Resumen: La repetición de algún curso académico es una de las grandes preocupaciones del sistema educativo español, porque su tasa duplica el promedio de los países de la OCDE y la Unión Europea, lo que resulta muy costoso. Además, es una medida de calidad controvertida, ya que, lejos de lograr la nivelación pretendida, aparece asociada en la investigación con el fracaso escolar. En este trabajo se pretende estudiar empíricamente el fenómeno, identificando las variables que definen el perfil del estudiante repetidor y no repetidor y aquellos predictores que más afectan a la probabilidad de repetir. Para ello, se ha partido del cuestionario de contexto del estudiante proporcionado por el informe PISA 2015 de la OCDE para España, que ofrece información sobre variables vinculadas con los antecedentes del estudiante, procesos y medidas no cognitivas, y que permite identificar claramente al alumnado que ha repetido algún curso en primaria y/o secundaria y al que no. Los datos se han analizado con la técnica de árboles de decisión y mediante el modelo de regresión logística binaria. Los resultados muestran que las variables que mejor discriminan entre los perfiles del estudiante repetidor y del no repetidor son las aspiraciones educativas y el haber cursado una materia de ciencias el curso anterior. La principal conclusión del estudio es que la probabilidad de repetir se asocia más con variables de procesos (tiempo de aprendizaje y currículum) que con variables vinculadas a los antecedentes del estudiante, en contra de lo que se ha venido perpetuando a través de la literatura. Esto supone un distanciamiento respecto a los predictores que tradicionalmente se han relacionado con la repetición y la aportación de evidencia empírica favorable a la apertura de una nueva perspectiva educativa, basada en el abordaje de la repetición de curso desde un enfoque menos socioeconómico y más pedagógico.
Palabras clave:PISAPISA,repeticiónrepetición,minería de datosminería de datos,regresión logísticaregresión logística,variables de contextovariables de contexto.
Abstract: Grade repetition is one of the major concerns in the Spanish educational system because its rate doubles the average performance of both OECD member countries and European countries. Grade repetition is usually linked to school failure and dropout instead of bringing student’s academic level onto an equal plane. This research empirically identifies the variables which repeating and non-repeating students have in common and those possible variables which have a higher influence in retaking a year. Thus, the student context questionnaire development provided by OECD PISA 2015 for Spain has been used. These questionnaires provide information on variables linked to the student’s background and also processes and non-cognitive outcomes. All of this information allows for the identification of the characteristics of both repeating and non-repeating students. Decision tree techniques and binary logistic regression have been applied to analyze the data. Results show that the educational aspirations and the fact of having studied a scientific module during the previous academic year are the main variables. The main finding of this study is that the probability of repeating an academic year is more influenced by process variables (learning time and curriculum) than by the student’s background. This outcome is contrary to what has been perpetuated through literature and starts a new educational perspective regarding grade repetition from a pedagogical point of view and a lower socioeconomic focus.
Keywords: PISA, repetition, data mining, regression logistics, context variables.
Estudios
LA REPETICIÓN DE CURSO A DEBATE: UN ESTUDIO EMPÍRICO A PARTIR DE PISA 2015
DEBATE ON GRADE REPETITION:AN EMPIRICAL STUDY FROM PISA 2015

Recepción: 01 Septiembre 2018
Aprobación: 30 Noviembre 2018
Según resultados obtenidos en el Programa para la Evaluación Internacional de Alumnos (PISA), uno de los principales problemas del sistema educativo español es la alta tasa de repetición (Méndez & Cerezo, 2018), pues el 31% de los estudiantes de 15 años han repetido en educación obligatoria (OCDE, 2016a). Dicho porcentaje es alarmante, ya que representa más del doble del promedio de la Unión Europea (15%) y de la OCDE (12%). Estas cifras sugieren que uno de los objetivos primordiales en el ámbito de la educación sea llegar a reducir dicha tasa (OCDE, 2016a), porque la repetición es una medida costosa, de efectividad dudosa y con efectos secundarios, lo que se traduce en que pocas veces favorece que los estudiantes afectados maduren y lleguen a conseguir los objetivos mínimos fijados para un curso o etapa y, sin embargo, se asocia de manera sistemática con niveles de desempeño menor.
La importancia de la repetición como tópico de investigación no radica únicamente en su alta incidencia, sino en que se relaciona con el bajo rendimiento, con el abandono educativo temprano y, en consecuencia, con el fracaso escolar (Benito, 2007; Choi, Gil, Mediavilla & Valbuena, 2018), que representa otro de los grandes hándicaps del sistema educativo español (Crespo, 2018), llevando a la Comisión Europea (2010) a fijarse como objetivo su reducción al 10% para el año 2020. La consecución de esta meta requiere de estudios rigurosos que permitan conocer a fondo variables que afectan al fracaso escolar, entre las cuales se encuentra el exceso de estudiantes repetidores, con el propósito de reducir su incidencia (Cordero, Manchón & Simancas, 2014). En el presente trabajo, a partir de los datos de España en PISA 2015, se pretende dar respuesta a los siguientes problemas de investigación: ¿cuál es el perfil del estudiante repetidor y no repetidor que emerge de la minería en las bases de datos de PISA? y ¿qué variables de contexto (antecedentes del estudiante, procesos y medidas no cognitivas) se asocian con una mayor probabilidad de repetir en los estudiantes?
La repetición de curso viene siendo objeto de discusión prácticamente desde el momento en que se instauraron las escuelas graduadas (Carabaña, 2013). En general, se ha venido utilizando como una estrategia de nivelación en los estudiantes que no alcanzan los objetivos mínimos (Cordero et al., 2014), aunque con resultados no siempre satisfactorios. Normalmente, la decisión sobre la repetición depende de los centros educativos, pero tiene un componente político y cultural importante, por lo que difiere de unos países a otros. Así, por ejemplo, en Japón y Noruega se ha prohibido la repetición y en Finlandia y Reino Unido solo se repite en circunstancias muy excepcionales.
En España, con la Ley Orgánica de Calidad de la Educación (LOCE, 2002) se planteó la eliminación de la promoción automática establecida por la Ley de Ordenación General del Sistema Educativo (LOGSE, 1990). Con la actual Ley Orgánica para la Mejora de la Calidad de la Educación (LOMCE, 2013) se establece que en la etapa de educación primaria los estudiantes podrán repetir como máximo un curso (artículo 20.2) y en secundaria (artículo 28) repetirán curso los estudiantes que hayan suspendido tres o más materias o dos asignaturas troncales, a no ser que el profesorado determine lo contrario. En esta última etapa educativa, el alumnado puede repetir el mismo curso una sola vez y dentro de la misma etapa como máximo dos veces, a excepción de cuarto de ESO que se puede repetir dos veces. Además, en dicha ley se establece el Programa de Mejora del Aprendizaje y el Rendimiento (PMAR), la Formación Profesional Básica (FPB) y el refuerzo de los conocimientos instrumentales de los estudiantes, con el fin de limitar la repetición de curso y el riesgo de fracaso escolar.
En los cambios habidos en el marco legal que la sustenta se refleja la falta de convicción en su efectividad. Por otra parte, los resultados de la investigación educativa de los últimos años sobre el tema asocian la repetición de curso con el fracaso escolar, al provocar efectos secundarios negativos, ya que suelen conducir a los estudiantes afectados hacia a una baja autoestima, y conlleva con cierta frecuencia problemas de absentismo, así como un abandono escolar temprano (Choi, 2017; Jacob & Lefgren, 2009; Manacorda, 2012). Asensio, Carpintero, López y Expósito (2018), con datos de PISA 2015 para España, encuentran que efectivamente, la repetición se asocia con el bajo rendimiento, y que los estudiantes repetidores obtienen peores puntuaciones en ciencias y en matemáticas, siendo el haber repetido en secundaria la tercera variable de contexto más importante en la explicación de diferencias en el nivel de desempeño, después del grado internacional en que el estudiante está escolarizado (variable que también implícitamente informa de la repetición) y de las expectativas del alumno. La evidencia a nivel internacional va en esta línea. Un meta-análisis realizado por Jimerson (2001) sintetizó las consecuencias de la repetición en más de cien estudios primarios realizados entre 1925 y 1999 y encontró más efectos negativos que positivos de esta estrategia de nivelación. Hattie (2009), como síntesis de 800 meta-análisis, llegó a la conclusión de que la repetición es una de las variables más importantes en los niveles de logro y cuantifica en un 16% el descenso que provoca en el rendimiento de los estudiantes, daño que solo es superado por el cambio de escuela y por tener más de una televisión en casa. Con estos resultados, es evidente la necesidad de un debate y de un replanteamiento de la cuestión que lleve a la identificación de nuevas estrategias que permitan reducir la repetición de curso y, por ende, sus efectos perversos, entre los que ocupa un lugar especial el riesgo de fracaso escolar.
La repetición es un fenómeno complejo y multicausal y existe una amplia literatura en los estudios PISA que muestran que tanto la repetición de curso (Carabaña, 2013; Cordero et al., 2014; Jheng, 2014; Pajares, 2005) como el riesgo de fracaso escolar (Calero, Escardibul & Choi, 2012; Choi & Calero, 2012; Cordero, Manchón & Simancas, 2012; Márquez, 2016) están relacionados con diferentes variables contextuales. Estas se presentan en PISA 2015 agrupadas en torno a tres áreas de contenido: antecedentes del estudiante, procesos y medidas no cognitivas (figura 1).
Las variables de las áreas de procesos y productos no cognitivos se han estudiado más con relación al nivel de desempeño (Önder & Uyar, 2018) que con relación a la repetición. Sin embargo, son abundantes los trabajos en los que han surgido variables del área de antecedentes del estudiante asociadas con nuestro objeto específico de estudio. Según la OCDE (2016b), incrementan la probabilidad de repetir: un menor nivel socioeconómico familiar, la nacionalidad (inmigrante) y el sexo (varón). Dentro del módulo 7, la categoría profesional de los padres (Calero et al., 2012), el tipo de familia monoparental (Fernández & Rodríguez, 2008) y los recursos educativos del hogar (Cordero et al., 2014) son las variables que más afectan en la tasa de repetición. En cuanto a la etnia e inmigración (módulo 8), Pedraja, Santín y Simancas (2012) señalan que los inmigrantes de primera generación tienen más posibilidades de repetir. Además, las chicas tienen menor probabilidad de repetir (Méndez & Cerezo, 2018) o de fracasar en el sistema educativo (Calero et al., 2012) y tienen una mayor posibilidad de alcanzar la excelencia en la competencia lingüística (Cordero et al., 2012). Sin embargo, esto no ocurre en ciencias (Rodríguez-Mantilla, Fernández-Díaz & Jover, 2018), ni en matemáticas (Gamazo, Martínez-Abad, Olmos-Migueláñez & Rodríguez-Conde, 2018), disciplinas en las que rinden más los varones. También hay que tener presente la importancia del recorrido educativo en la primera infancia (módulo 9), ya que la escolaridad temprana se relaciona con un menor riesgo de fracaso escolar (Choi & Calero, 2012).

La literatura científica hasta el momento pone de manifiesto una serie de variables de contexto relacionadas con la repetición, pero estas normalmente no han sido incluidas en los modelos explicativos con un criterio objetivo, dado que no se ha jerarquizado su importancia mediante técnicas empíricas. Los resultados de investigación existentes entonces pueden depender en gran medida de que el grueso de la investigación se ha realizado desde las ciencias económicas. El objetivo general de este trabajo es ahondar en el estudio de las variables de contexto (antecedentes del estudiante, procesos y medidas no cognitivas) relacionadas con la repetición de curso para:
Se trata de un estudio secundario con los resultados de PISA 2015 a través de una técnica de clasificación (para la identificación de perfiles y la selección de predictores) y un análisis de regresión logística, realizados mediante SPSS versión 23.
Se ha utilizado la base de datos referida al cuestionario de estudiantes españoles, clasificada según la variable objeto de estudio, de modo que se cuenta con 27.892 estudiantes no repetidores y 10.937 repetidores. Como variables predictoras se han seleccionado un total de 208 ítems, descartando aquellos que aportaban una información redundante (por ejemplo, repetir curso en primaria o secundaria, ya que se introduce el índice de repetición); asimismo se han eliminado predictores que manifiestan colinealidad con la variable dependiente, como es la edad. Además, se incluye el índice de inmigración, aunque en Choi et al. (2018) no resulta significativo, ya que según la literatura (Choi & Calero, 2012; Cordero et al., 2014) es una variable relacionada con la repetición de curso.
Con la técnica de data mining de árboles de clasificación, que proporciona una serie de diagramas formados por nodos, que representan una segmentación de la población en subgrupos, de acuerdo con sus características en una serie de variables predictoras, que determinan su aportación en la variable criterio (Tourón, López-González, Lizasoain, García & Navarro, 2018), se elaboran los perfiles de los dos grupos. Entre las alternativas existentes se ha seleccionado CART (Classification And Regression Trees), por ser un método de árbol binario numérico y exhaustivo (Román & Levy, 2003), que da lugar a nodos de fácil interpretación (Castro & Lizasoain, 2012) y que permite ordenar los predictores según su importancia normalizada. Se utiliza también como técnica de selección de las variables independientes, fijando como criterio de inclusión que su importancia normalizada fuera al menos de un 15%. La técnica de clasificación se complementa en este estudio con un análisis de regresión logística con el fin de comparar ambas metodologías y conseguir un resultado más parsimonioso y robusto. Dado que el análisis de regresión es una técnica más exigente, antes de la especificación del modelo de regresión se comprobaron los supuestos de no colinealidad, de independencia de errores y la presencia de casos atípicos. Tras esta comprobación se redujo el número de variables seleccionadas. Los predictores con más de dos categorías fueron dicotomizados (0 y 1) para facilitar la interpretación. A partir del modelo de regresión también se calcularon los pronósticos, de acuerdo con la siguiente ecuación:
Logit (repetir = 1) = B0+ B1(X1) + B2(X2) + B3(X3) ... Bk(Xk) Ecuación 1
En la ecuación 1, B0 se refiere a la constante del modelo y el resto de betas a los coeficientes asociados a cada una de las variables independientes donde, Xk es el valor de su categoría correspondiente. Resolviendo la ecuación anterior, se obtiene el logit de repetir más alto y bajo según el valor de la categoría utilizada. Debido a la dificultad que supone la interpretación del logit, mediante la ecuación 2 se transformó dicha escala a probabilidades (Pardo & Ruiz, 2013).
πˆ = 1/(1 + e–logit) Ecuación 2
En primer lugar, con el algoritmo CART de árboles de decisión se obtienen las variables contextuales que mejor discriminan entre repetidores y no repetidores que se muestran en la figura 2. En la rama izquierda (nodos 1 y 4), se aprecia el perfil del alumnado repetidor. La mayor frecuencia de repetidores (89,4%, n = 4426) se encuentra entre los estudiantes que se conforman con completar segundo ciclo de la ESO o menos (nodo 1) y que no han cursado ninguna asignatura de química el año anterior (nodo 4). Mientras que en la rama derecha (nodos 2, 5 y 9) se ofrece el perfil de los no repetidores. La frecuencia más alta de los no repetidores (98,2%, n = 14040) se da entre los estudiantes que aspiran completar más del segundo ciclo de la ESO (nodo 2), que han asistido alguna asignatura de química el año anterior (nodo 5) y que no han asistido a Ciencias Aplicadas y Tecnología (CAT, de aquí en adelante) este año (nodo 9).

En segundo lugar, con la misma técnica se procede a la selección de predictores. En la figura 3 se presentan las 14 variables independientes más importantes en la explicación de las diferencias entre repetidores y no repetidores, que cumplen con el criterio de inclusión de alcanzar una importancia normalizada superior a un 15%. En la jerarquía obtenida con el algoritmo CART, el nivel de aspiraciones de los estudiantes alcanza el primer puesto, seguido por nueve variables curriculares, de modo que las variables de antecedentes del estudiante (estatus socioeconómico y familiar del estudiante y etnia e inmigración) aparecen en los últimos cuatro puestos del ranking (figura 3).

Una de las limitaciones de los árboles de clasificación es una cierta inestabilidad metodológica en la selección de predictores, provocada por el hecho de que en la partición recursiva influye no solo la decisión sobre qué variable se divide, sino también el punto de corte exacto utilizado en la división (López-Martín, Expósito-Casas, Carpintero & Asensio, 2018; Strobl, Malley & Tutz, 2009). Por esta razón, en el presente estudio se complementa el uso de esta herramienta exploratoria, con otra más confirmatoria como es el análisis de regresión.
Antes de la regresión, se calculó la relación entre las variables independientes, se comprobó el supuesto de independencia de los errores, el de no colinealidad y se llevó a cabo un estudio de los casos atípicos. Los análisis de correlación entre los predictores mostraron una intensidad de relación inferior a 0,80, a excepción del coeficiente entre la variable cursar física año anterior y cursar química año anterior cuyo valor fue de 0,831. Siguiendo a Garbanzo (2014), que recomienda eliminar una de las variables cuando la correlación es superior a 0,70, se eliminó la variable cursar física año anterior, ya que era la que presentaba una menor importancia normalizada. De este modo, se cumplen los supuestos de independencia de los errores y de falta de multicolinealidad, dado que el valor Durbin-Watson obtenido se encuentra entre 1,5 y 2,5, los valores de tolerancia resultan superiores a 0,10 y los valores de FIV en ninguna de las variables superan el valor 10 (Pardo & Ruiz, 2013). En cuanto al estudio de los casos atípicos no se eliminó ninguno, puesto que la distancia de Cook arroja valores inferiores a 1 (Field, 2009).
Tras la comprobación de los supuestos, se recodificaron algunas variables para facilitar la interpretación de los coeficientes, como se muestra en la tabla 1.
De todas las variables predictoras introducidas en el modelo de regresión, tan solo se mantuvieron aquellas cuyo coeficiente resultó significativo (p < ,05). La tabla 2 ofrece una valoración del cambio que experimentó la desvianza del modelo nulo al incorporar las covariables finalmente seleccionadas.
La razón de verosimilitudes (chi-cuadrado) tiene un nivel menor que,05 lo que nos permite concluir que todas las variables del modelo propuesto consiguen mejorar el ajuste del modelo nulo. En cuanto a la calidad del modelo (tabla 3), el estadístico R2 de Nagelkerke indica que el modelo propuesto explica un 63,2% de la variabilidad de la variable repetición (44,4% según Cox y Snell).



En la tabla 4 se presentan los coeficientes del modelo de regresión logística. En ella se observa que cursar CAT este año es la única variable que se encuentra relacionada positivamente con la repetición.

El valor exponencial de la constante indica que los estudiantes cuyas aspiraciones educativas sean completar segundo ciclo de educación secundaria o menos (aspiraciones = 0), que no han cursado química (química = 0) o biología (biología = 0) el año anterior, que no han recibido clases de ciencias (clases ciencias = 0), que no han elegido asignaturas relacionadas con ciencias (ciencias = 0), que no han recibido clases de CAT este año (CAT = 1) ni el año anterior (CAT = 0), que tienen como mucho 25 libros en casa (libros = 0) y que son hijos de madres con estudios inferiores a bachillerato (estudios madre = 0) tienen 24,621 veces más posibilidades de repetir.
En relación con las aspiraciones educativas se aprecia que su coeficiente tiene un signo negativo (–2,028), por lo que la repetición es más probable en los estudiantes con menos aspiraciones. Concretamente, la odds de repetir entre los que esperan completar más del segundo ciclo de educación secundaria (aspiraciones = 1) es un 86,8% menor que los que esperan completar segundo o menos (aspiraciones = 0). Respecto a cursar química el año anterior el valor 0,196, indica que la posibilidad de repetir entre los que han asistido (química = 1) es un 80,4% menor que entre los que no han asistido (química = 0). Cursar biología el año anterior disminuye la probabilidad de repetir, ya que el coeficiente 0,338 muestra que la odds de repetir en los que han cursado la asignatura (biología = 1) es un 66,2% menor que entre los que no (biología = 0). El signo negativo de la variable número de clases de ciencias a la semana muestra que la probabilidad de repetir disminuye cuando aumenta el número de clases, de modo que, por cada clase de más que reciban, la odds de repetir disminuye un 11,9%. La elección de asignaturas de ciencias disminuye la probabilidad de repetir, pues la odds de repetir en los que han elegido alguna asignatura de ciencias (ciencias = 1) es un 79% menor que entre los que no la han elegido (ciencias = 0). Cursar CAT este año (CAT = 1) incrementa la probabilidad de repetir 4,5 veces. Por el contrario, cursar CAT el año anterior disminuye la probabilidad de repetir, en un 21%, respecto a los que no han cursado ciencias y tecnología (CAT = 0). Así mismo, en cuanto a la variable cantidad de libros los resultados muestran que la probabilidad de repetir disminuye cuando se tienen más de 200 libros en casa. Concretamente, para los estudiantes con más de 200 libros en el hogar (libros = 1) la odds de repetir es un 10,8% menos que los que tienen como mucho 25 (libro = 0). Por último, el valor 0,456 indica que la odds de repetir en los estudiantes cuya madre tiene al menos bachillerato (estudios madre = 1) es un 54,4% menor que entre los estudiantes cuya madre tiene estudios inferiores a ese nivel (estudios madre = 0).
En cuanto a los pronósticos del modelo, la probabilidad más baja de repetir se da entre los estudiantes cuyas aspiraciones educativas sean completar más del segundo ciclo de educación secundaria (aspiraciones = 1), que han cursado el año anterior química (química = 1) o biología (biología = 1), que más clases de ciencias reciben a la semana (clases ciencias = 10), que han elegido las asignaturas de ciencias (ciencias = 1), que no realizan clases de CAT este año (CAT = 0) pero sí el año anterior (CAT = 1), que poseen más de 200 libros en el hogar (libros = 1) y cuyas madres han cursado al menos bachillerato (estudios madre = 1). En estos estudiantes la probabilidad de repetir es muy baja (0,004).
Por el contrario, para los que tienen la aspiración educativa de completar segundo ciclo de educación secundaria o menos (aspiraciones = 0), que no han cursado química (química = 0) o biología (biología = 0) el año anterior, que no reciben clases de ciencias (clases ciencias = 0), que no han elegido asignaturas de ciencias (ciencias = 0), que realizan clases de CAT este año (CAT = 1), pero no el año anterior (CAT = 0), que tienen menos o igual a 25 libros en el hogar (libros = 0) y que los estudios alcanzados de la madre son inferiores a bachillerato (estudios madre = 0), la probabilidad de repetir es del 0,991.
En cuanto al valor predictivo, los modelos resultantes de la técnica de clasificación y de la regresión logística son muy similares como se puede observar en las tablas 5 y 6, siendo el porcentaje de coincidencia entre los valores observados y pronosticados por los modelos muy altos en el grupo de no repetidores y algo menos favorable en el de repetidores. El comportamiento del modelo CART es algo mejor en este último grupo, aunque la técnica de regresión es más parsimoniosa, al incluir solo 9 de las 14 variables que emergieron con CART.


Con este trabajo se pretendía profundizar en el estudio de las variables de contexto (antecedentes del estudiante, procesos y medidas no cognitivas) en PISA 2015, que se encuentran relacionadas con la repetición de curso, con la finalidad última de valorar su importancia y así obtener evidencias en las que basar las decisiones educativas para reducir la incidencia de este fenómeno en nuestro sistema educativo.
Respecto al primer objetivo, consistente en identificar las variables que mejor discriminan entre el perfil del estudiante repetidor y del no repetidor, se puede concluir que los ítems del cuestionario de contexto de PISA referidos a aspiraciones educativas y cursar química el año anterior son los predictores que mejor definen y diferencian a dichos estudiantes. Estas variables aparecen también como las más importantes en el ranking que aporta CART. Dichos resultados se encuentran en sintonía con los obtenidos por Santos, Godás y Lorenzo (2012), que destacan la importancia de las aspiraciones educativas en el estudiante repetidor, con Simons-Morton y Chen (2009), que relacionan el fracaso escolar con las aspiraciones educativas del estudiante o con López-Martín et al. (2018) que señalan la repetición como la principal variable relacionada con el desempeño en ciencias y las aspiraciones como una de las que definen el perfil de los estudiantes de alto rendimiento.
Con relación al segundo objetivo específico de jerarquizar las variables predictoras por orden de importancia, queda claro, que, incluyendo en el modelo simultáneamente diferentes tipos de variables de diversos módulos, las de tipo socioeconómico y familiar ocupan puestos de menor valor predictivo, aunque en la literatura son las que aparecen con mayor frecuencia (Carabaña, 2013; Choi et al., 2018; Cordero et al., 2014; Simons et al., 2009).
En cuanto al objetivo de seleccionar los predictores más relevantes, complementando los resultados de CART con los aportados por el análisis de regresión logística, se observa que la probabilidad de repetir es menor cuando los estudiantes tienen aspiraciones educativas más altas (superior a segundo ciclo de educación secundaria), cuando asisten a clases de química o biología el año anterior, cuantas más horas de ciencias realicen a la semana, cuando los estudiantes eligen asignaturas de ciencias y cuando no cursan la asignatura de CAT este año. Sin embargo, si la realizaron el año pasado, su probabilidad de repetir es mayor que la de los estudiantes que no la cursaron. También el número de libros en el hogar es importante, ya que, quienes poseen menos tienen una mayor probabilidad de repetir. En esta línea, Cordero, et al. (2014) y Evans, Kelley, Sikora y Treiman, (2010) obtienen evidencia del efecto negativo de contar con recursos culturales escasos. Por último, los estudios alcanzados por la madre resultan relevantes en nuestra investigación, puesto que el alumnado tiene mayor probabilidad de repetir si sus madres solo cuentan con estudios inferiores a bachillerato. Sin embargo, no ocurre lo mismo con el nivel educativo del padre que sí resulta importante en otros trabajos (Carabaña, 2013; Pérez-Diaz, Rodríguez y Fernández, 2008). Respecto a las variables de procesos, apenas se han encontrado investigaciones que demuestren la relación que existe entre ellas y la repetición y/o el riesgo de fracaso escolar, aunque Birbili (2005) y Calero (2006) ponen de manifiesto el impacto que el currículum y la organización escolar tienen en la eficacia del sistema educativo.
A la vista de estos resultados y siguiendo la clasificación realizada por PISA 2015 sobre las variables de contexto, la mayoría de los predictores que han surgido de la metodología empleada en este trabajo se encuentran relacionados con el área de procesos, a pesar de que se ha encontrado una extensa literatura (Calero et al., 2012; Choi, 2017; Choi et al., 2018; Cordero et al., 2012; Pedraja et al., 2012) que indique la importancia que tiene el área de antecedentes del estudiante en la repetición o en el riesgo de fracaso escolar. En el presente estudio se obtiene que dichas variables son relevantes, ya que, de los nueve predictores finalmente obtenidos, dos (estudios alcanzados por la madre y cantidad de libros) se encuentran relacionados con esta área. Sin embargo, no son los más importantes. Nuestros resultados destacan la importancia de las aspiraciones educativas, pero sobre todo resultan mayoritarias las variables vinculadas con el tiempo de aprendizaje y currículum en ciencias. Por consiguiente, este hallazgo complementa y matiza muchos de los resultados obtenidos en las investigaciones de los autores mencionados anteriormente y los contradice en el sentido de que se basan indirectamente en la teoría del capital cultural de Bourdieu (1986), que defiende la preponderancia que tiene el origen social (estudios y ocupación de los padres, recursos educativos del hogar, etc.) en el rendimiento académico. PISA, como iniciativa de una organización con fines fundamentalmente económicos, es foco de interés principal para sociólogos y economistas de la educación, pero los resultados de esta evaluación internacional también dan pistas a los investigadores educativos de que las variables de procesos son relevantes. La preponderancia de las variables socioeconómicas, si se incluyen variables de diferente tipo en los modelos estadísticos, no está tan clara cuando se trata de explicar la repetición.
La importancia de un producto no cognitivo, como es el nivel de aspiraciones, y de variables del área de procesos, debe tenerse en cuenta tanto por parte de la escuela, como de las políticas educativas. En este sentido, parece coherente trabajar en el aula el nivel de aspiraciones, así como desarrollar actividades que refuercen el interés y los conocimientos en ciencias motivando a los estudiantes en dicha área, de tal manera que sean ellos mismos los que elijan cursar estas asignaturas. Dada la importancia que las expectativas académicas del estudiante tienen en la repetición, sería adecuado que desde el centro educativo se trabajara en la mejora del autoconcepto académico del estudiante, tal y como indican Ibarra-Aguirre (2014), Ibarra y Jacobo (2016) y Serrano, Mérida y Tabernero (2016). Además, por la importancia que ha alcanzado el número de libros, se avala la conveniencia de políticas que los faciliten a las familias y de actividades pedagógicas de fomento de la lectura.
La principal aportación del estudio, en línea con lo obtenido por Asensio et al. (2018) y López-Martín et al. (2018), consiste en que, junto con las aspiraciones educativas del estudiante (producto no cognitivo), las variables más importantes son del área de procesos de enseñanza-aprendizaje en ciencias, que es el foco de atención en la edición de PISA 2015. Esto se desvincula de los resultados de los trabajos realizados por sociólogos o economistas (Carabaña, 2013; Choi et al., 2018; Cordero et al., 2014; Simons et al., 2009), en los que la repetición se asocia más con variables de antecedentes del estudiante de tipo personal y familiar.
Este trabajo también representa una aportación desde el punto de vista metodológico, por tres razones. Primero, porque la utilización de los árboles de decisión, como técnica de selección previa de los predictores a incluir en los modelos de regresión, resulta novedosa y altamente útil para reducir errores de especificación (Asensio et al., 2018). Segundo, porque las técnicas arborescentes son muy versátiles y especialmente adecuadas cuando se trabaja con una gran cantidad de predictores, permitiendo el uso simultáneo de variables medidas en diferentes escalas. La versatilidad es una cualidad esencial cuando se trabaja con los cuestionarios de contexto de PISA que son cada vez más complejos (González-Such, Sancho-Álvarez & Sánchez-Delgado, 2016). Tercero, porque este estudio aporta evidencia de que los árboles de clasificación y el modelo de regresión logística son técnicas complementarias y robustas.
Como prospectiva de investigación, aunque el cuestionario del estudiante es el más informativo del desempeño en ciencias (Asensio et al., 2018), sería interesante estudiar la importancia de los ítems de los otros cinco cuestionarios de contexto de PISA (trayectoria académica, uso de las TIC, cuestionario de la familia, del centro y del profesor) en relación con la repetición.
Por último, como limitación hay que advertir que los resultados obtenidos no permiten concluir en términos de causalidad. Para ello, sería necesario realizar modelos de ecuaciones estructurales o de estructuras de covarianza, idóneos para analizar el tipo (directa, indirecta o no causal) y el sentido de las relaciones en diseños no experimentales.
Cómo referenciar este artículo: Arroyo Resino, D.; Constante Amores, I. A. y Asensio Muñoz, I. (2019). La repetición de curso a debate: un estudio empírico a partir de PISA 2015. Educación XX1, 22(2), 69-92, doi: 10.5944/educXX1.22479
How to reference this article: Arroyo Resino, D.; Constante Amores, I. A. & Asensio Muñoz, I. (2019). Debate on grade repetition: an empirical study from PISA 2015. Educación XX1, 22(2), 69-92, doi: 10.5944/educXX1.22479








