Resumen: El objetivo de este estudio fue analizar la invarianza de medición de una escala de agotamiento emocional académico entre estudiantes universitarios de Perú (n = 472; 76.059% mujeres; Medad= 20.636), México (n = 362; 66.298% mujeres; Medad = 21.063) y Colombia (n = 288; 88.194% mujeres; Medad = 21.780). La estructura interna se estudió con un análisis factorial confirmatorio para comprobar la unidimensionalidad de la Escala de Cansancio Emocional (ECE) en cada muestra, y la invarianza del modelo fue analizada con un análisis factorial multigrupo. Los resultados mostraron que el modelo unidimensional obtiene evidencias favorables en cada muestra respecto a sus cargas factoriales y confiablidad, y es invariante entre las muestras en su estructura (invarianza configural),cargas factoriales (invarianza métrica), thresholds (invarianza fuerte) y residuales (invarianza estricta). Aunque se necesita investigación adicional, el ECE parece ser una medida prometedora para su uso con estudiantes universitarios colombianos, mexicanos y peruanos.
Palabras clave: burnout académico, agotamiento emocional, estudiantes universitarios, invarianza de medición.
Abstract: The aim of this study was to analyze the measurement invariance of a scale of academic emotional exhaustion among university students in Peru (n = 472; 76.06% women; Mage = 20.64), Mexico (n = 362; 66.3% women; Mage = 21.06), and Colombia (n = 288; 88.19% women; Mage = 21.78). The internal structure was analyzed with a confirmatory factor analysis in order to verify the single dimensionality of the Emotional Exhaustion Scale (ESS) in each sample, whereas the model’s invariance was analyzed with a multi-group factor analysis. The results showed that the one-dimensional model shows favorable evidence in each sample regard their factor loadings and reliability, and it was invariant across countries regarding its structure (configural invariance), factor loadings (metric invariance), thresholds (strong invariance), and residuals (strict invariance). Although additional research is needed, the ECE appears to be a promising measure to use among Peruvian, Mexican, and Colombian college students.
Keywords: academic burnout, emotional exhaustion, college students, measurement invariance.
Artículos Originales
Invarianza factorial de una medida de burnout académico entre estudiantes universitarios de Perú, México y Colombia
Factorial invariance of an academic burnout measure among college students from Peru, Mexico and Colombia

Recepción: 24 Octubre 2019
Aprobación: 10 Enero 2020
El síndrome de burnout (SB) fue definido tradicionalmente como una condición caracterizada por el agotamiento mental frecuentemente observado en las personas que trabajan con clientes o pacientes que demandan atención directa (Maslach, 1982). Esta condición destacaba por la presencia de tres componentes: agotamiento emocional (AE), despersonalización y baja realización personal.
Más adelante, el SB se estudió a partir de la relación entre trabajador y la labor que realiza, es decir, no necesariamente pensando en actividades basadas en la atención a personas (e.g., enfermería), dada la necesidad de ampliar el concepto del SB a otras profesiones (Maslach, Schaufeli, & Leiter, 2001). Esto trajo consigo cambios en la conceptualización del SB. Por ejemplo, el AE se enfocó en la labor que realiza el trabajador, más que en la relación con otras personas; la despersonalización fue renombrada como cinismo y valora las actitudes hacia el trabajo propiamente dicho; y la eficacia profesional evalúa la percepción de las posibilidades de éxito realizando esa actividad (Fernández, Juárez, & Merino, 2015).
Sin embargo, es conocido que el sentimiento de sobrecarga en las personas no se limita a una situación laboral remunerada, sino a toda actividad que demande esfuerzo constante y un periodo temporal determinado. En este sentido, la actividad académica puede ser considerada como una posible fuente de SB, ya que existen exigencias que los estudiantes deben cumplir (Hu & Schaufeli, 2009) y de no hacerlo, su estancia en la universidad o sus posibilidades de egreso dentro del plazo establecido (e.g., cinco años de carrera profesional) se verían afectados.
El burnout académico (BA) se refiere al sentimiento de agotamiento a causa de las demandas del estudio (AE), lo que trae como consecuencias mediatas una actitud cínica y poco comprometida con sus labores académicas (cinismo), así como creencias de poca capacidad (ineficacia) (Schaufeli, Martínez, Marques, Salanova, & Bakker, 2002). Existe amplia evidencia disponible de su asociación directa con ansiedad, depresión, entre otros (e.g., Caballero, Gutiérrez, & Palacio, 2015; Rosales & Rosales, 2013), su relación con variables personales y sociales (Ortega, Ortiz, & Martínez, 2014; Preciado-Serrano & Vázquez-Goñi, 2010), así como su repercusión en el desempeño académico de los estudiantes que lo experimentan, pudiendo observarse desde la adolescencia en la previa al ingreso a la universidad (Domínguez-González, Velasco-Jiménez, Meneses-Ruiz, Valdivia-Gómez, & Castro-Martínez, 2017), asociándose a su vez con problemas internalizantes en este grupo de edad (Walburg, 2014).
Esta situación daría cuenta de la necesidad de una labor preventiva desde el inicio de la vida universitaria, y la experiencia podría ser distinta según la carrera elegida (Martínez & Salanova, 2003), siendo los estudiantes de carreras asociadas a las ciencias humanas y sociales como psicología, filosofía, entre otras, quienes experimentan en menor grado el SB (Caballero, Hederich, & Palacio, 2010). Se observa que los estudiantes experimentan mayor AE que los docentes y administrativos (Visoso-Salgado, Sánchez-Reyna, & Montiel-Bastida, 2012), y que este va en aumento a medida que avanzan en la carrera universitaria (Rudman & Gustavsson, 2012).
Dado que el curso del SB es insidioso y sus dimensiones teóricas (AE, cinismo y eficacia) no aparecen simultáneamente en ese proceso, diversos estudios han identificado al AE como la dimensión central y más importante del SB y, por extensión, del BA (Bekker, Croon, & Bressers, 2005; Dominguez-Lara & Merino-Soto, 2019; Nikodijević, Labrović, & Đoković, 2012; Rohland, Kruse, & Rohrer, 2004; Van Dierendonck, Schaufeli, & Sixma, 1994). Esto permite considerarla como punto de partida del desarrollo y cronicidad del BA, ya que este es un fenómeno de prolongado agotamiento donde progresivamente una persona va perdiendo sus recursos físicos y emocionales (Alarcón, Edwards, & Menke, 2011; Hakanen & Schaufeli, 2012), que lo conducen a estrategias de afrontamiento desadaptativas, llevándolo al cinismo (Alarcón et al., 2011), es decir, a tener dificultades para afrontar de manera funcional las exigencias del contexto inmediato. Es decir, el AE provoca acciones para distanciarse emocional y cognitivamente del trabajo como una forma de hacer frente a la sobrecarga laboral (Maslach & Leiter, 2008), afectando así la percepción que se tiene sobre las actividades realizadas. En ese orden de ideas, existe evidencia empírica en el ámbito organizacional sobre la influencia del AE sobre el cinismo (Kranabetter & Niessen, 2017; Máynez-Guaderrama, Cavazos-Arroyo, & Reyes-Flores, 2017; Wong & Spence, 2015), y podría replicarse en el ámbito académico porque los estudiantes, como los trabajadores, están relacionados directa e indirectamente con la universidad.
Existe una medida de BA, el Maslach Burnout Inventory – Student Survey (MBI-SS, Schaufeli et al., 2002), en la que destaca la dimensión de AE como la de mejores parámetros psicométricos: cargas factoriales más elevadas y elevada confiabilidad. Pese a ello, el único estudio instrumental llevado a cabo en Latinoamérica del MBI-SS ha evidenciado algunas limitaciones de corte metodológico y técnico (ver Dominguez-Lara, 2018a). Asimismo, se ha observado en estudios desarrollados en otros contextos que la diferenciación entre las dimensiones del MBI-SS es confusa; es decir, mientras que en algunos trabajos las tres dimensiones son susceptibles de ser interpretadas de forma independiente (Hu & Schaufeli, 2009; Schaufeli et al., 2002), en otros existe una superposición importante entre las dimensiones (Tsubakita & Shimazaki, 2016), o simplemente el modelo original no brinda un adecuado ajuste en el nuevo grupo evaluado concluyendo a favor de modelos de medición alternativos (Mészáros, Ádám, Szabó, Szigeti, & Urbán, 2014; Rostami, Reza, Schaufeli, Ahmadi, & Sadeghi, 2014). Esto amenaza la validez de las inferencias al generalizar los resultados del estudio original, dado que es probable que la estructura dimensional del BA no sea aplicable a todos los contextos culturales, evidenciando resultados más cercanos a la propuesta teórica en grupos de estudiantes con características similares a los de la validación original. Por último, es una escala que posee derechos de autor comerciales y no es de dominio público.
Esta situación, es decir, la poca precisión en cuanto a su estructura factorial y que el estudiante deba hacer un pago por utilizarla, promueve la búsqueda de alternativas. La Escala de Cansancio Emocional (ECE; Ramos, Manga, & Morán, 2005) fue elaborada en el contexto hispanohablante como una medida unidimensional de AE en el contexto académico y presenta propiedades psicométricas favorables, tanto en lo que concierne a confiabilidad y estructura interna en Argentina (λpromedio = .668; α = .87; Fontana, 2011), México (λpromedio = .685; α = .90; González & Landero, 2007a), España (λpromedio = .666; α = .866; Torres, Mohand, & Espinosa, 2016) y Perú (λpromedio = .607; αordinal = .853; Dominguez-Lara, 2013; λpromedio =.709; α = .870; Dominguez-Lara, 2014). A su vez, presenta evidencias de validez con relación a otras variables por su asociación con la resiliencia y autoeficacia (Dominguez-Lara, Gravini-Donado, & Torres-Villalobos, 2019), autoestima (Herrera, Mohamed, & Cepero, 2016) o el estrés percibido (González & Landero, 2007b). Por último, destaca la presencia de un grado elevado de invarianza de acuerdo al sexo (Dominguez-Lara, Fernández-Arata, Manrique-Millones, Alarcón-Parco, & Díaz-Peñaloza, 2018), así como de invarianza longitudinal de sus puntuaciones (Dominguez-Lara, 2018b), lo que permitiría usarla para valorar resultados de intervención.
Entonces, si bien la evidencia psicométrica de la ECE se obtuvo de forma independiente en cada uno de los países mencionados, no se conoce si la medición del AE es invariante en esos contextos, por lo que es necesario explorar ese aspecto. Cabe precisar que existen estudios basados en la invarianza de medición del AE, pero utilizando otras escalas.
Por ejemplo, resalta un estudio que compara estudiantes españoles, portugueses y holandeses (Schaufeli et al., 2002), así como otro entre estudiantes colombianos y españoles (Charry, Garzón, Pozo, & Bretones, 2018), y un trabajo entre brasileños y portugueses (Campos & Marôco, 2012), todos con el MBI-SS. De estos, el primero (Schaufeli et al., 2002) solo se basó en la comparación descriptiva de los índices de ajuste (e.g., la variación en el Índice de Ajuste Comparativo [CFI]) para indicar que el grado de invarianza no fue aceptable, es decir, que el constructo se mide de forma diferente entre los grupos; resaltando a su vez la inclusión en el modelo de varios pares de residuales correlacionados enfocados solamente en mejorar el ajuste estadístico sin aportar interpretaciones al respecto. A su vez, entre los otros dos estudios, Campos y Marôco (2012) concluyen que la medición del constructo no es invariante entre grupos, mientras que Charry y colaboradores (2018) indican el cumplimiento de la invarianza. Por otro lado, fue hallado un estudio que compara la versión para estudiantes del Oldenburg Burnout Inventory (OLBI; Demerouti, Mostert, & Bakker, 2010) entre universitarios alemanes y griegos, y se reporta que el grado de invarianza hallado no fue satisfactorio (Reis, Despoina, & Tsaousis, 2015).
Además, independientemente del instrumento de medición empleado, no existen estudios de invarianza del BA, o del AE, que involucren solo a países latinoamericanos, pese a que es un problema con prevalencia importante en los países de la región (e.g., Athié Gutiérrez et al., 2016; Caballero, Abello, & Palacio, 2007; Estela-Villa, Jiménez-Román, Landeo-Gutiérrez, Tomateo-Torvisco, & Vega-Dienstmaier, 2010; Galvan-Molina, Jimenez-Capdeville, Hernandez-Mata, & Arellano-Cano, 2017), y que va incrementándose conforme avanzan los años cursados (Asencio-Lopez et al., 2016), lo que podría facilitar la emergencia del SB en entornos laborales luego de la titulación. Esto es relevante, además, porque en la actualidad están tomando mayor importancia los estudios interculturales que permitan comprender el carácter general (o específico) de ciertos rasgos de personalidad o aspectos emocionales relevantes para comprender el comportamiento de personas de determinados países, o para establecer comparaciones entre estos, ya sean de la misma región (Lowe, 2019; Morán, García, & Hormazabal, 2018) o de regiones distintas (Żemojtel‐Piotrowska et al., 2018), y las evidencias de invarianza de medición brindan la oportunidad de comparar puntuaciones sin que existan sesgos en el momento de medir el constructo.
Con base en lo argumentado, el objetivo del presente estudio fue realizar un análisis de invarianza de medición del AE entre estudiantes universitarios procedentes de México, Perú y Colombia.
El interés por estudiar el BA trasciende el recinto universitario, ya que una persona que lo experimente probablemente vea afectada otras esferas de su vida además de la académica. Por ello, la primera etapa (AE) es crítica para un abordaje adecuado, ya que si se interviene de forma temprana es más probable que el BA no llegue a consolidarse.
Por otro lado, aunque se puede percibir que el lenguaje y costumbres comunes a diversos países latinoamericanos pueden uniformizar la experiencia diaria del AE, en Latinoamérica existen también peculiaridades y diferencias culturales que pueden evidenciar alguna variabilidad en las mediciones por la forma de entender y vivenciar el constructo, y de hacerse visibles estas diferencias en la medición del constructo (sesgo) podrían limitar las posibilidades de comparación. No obstante, si la medida resultara invariante, es posible integrar datos para estudios de mayor envergadura y así dar respaldo a las conclusiones derivadas de esa información.
De este modo, las investigaciones transculturales son una necesidad para alcanzar una mejor comprensión del SB como un problema global yendo más allá de la comparación de resultados (Moreno-Jiménez, Garrosa-Hernández, Benevides-Pereira, & Gálvez-Herrer, 2003), dado que uno de los sesgos que con mayor frecuencia enfrentan este tipo de investigaciones se presenta en la recolección de datos por los distintos estilos de respuesta de cada cultura (Vergara & Balluerka, 2000). Por tal motivo, contar con una escala de medición del AE que sea invariante en la región abre una ventana de oportunidad para su estudio a profundidad.
El presente es un estudio psicométrico (Ato, López, & Benavente, 2013), orientado al análisis de las propiedades psicométricas de una escala, siendo en este caso la estructura interna, confiabilidad e invarianza factorial de la estructura interna de la ECE.
La muestra peruana estuvo constituida por 472 estudiantes de psicología entre tercer y octavo ciclo (76.059% mujeres; Medad = 20.636; DEedad = 2.512) de una institución privada. En cuanto a las características demográficas, la mayoría eran solteros en el momento de la evaluación (95.762%) y poco más de la quinta parte poseía un trabajo (21.822%). La muestra procedente de Colombia se conformó por 288 estudiantes de psicología entre tercer y décimo ciclo (88.194% mujeres; Medad = 21.780; DEedad = 3.228) pertenecientes a una universidad privada. Asimismo, un porcentaje elevado eran solteros (89.236%) y menos de la cuarta parte trabajaba (23.958%). Por último, la muestra mexicana estuvo formada por 362 estudiantes (66.298% mujeres; Medad =21.063; DEedad = 1.889) de dos universidades públicas, quienes cursaban diversas carreras profesionales (84.615% de ciencias de la salud: nutrición, medicina, odontología y enfermería), y predominantemente eran solteros (95.580%) y solo trabajaba menos de la quinta parte (16.022%).
Escala de Cansancio Emocional (ECE; Fontana, 2011). La ECE mide unidimensionalmente el AE por medio de 10 ítems escalados en formato Likert con cinco opciones de respuesta que van desde raras veces [1] hasta siempre [5]. Fue utilizada la versión adaptada en el contexto universitario peruano (Dominguez-Lara et al., 2018).
Este trabajo es un producto del proyecto Relación entre burnout académico, ansiedad y depresión en estudiantes universitarios: análisis mediacional de factores protectores y de riesgo aprobado por la universidad del tercer autor. Los investigadores e investigadoras de Colombia y México fueron invitados más adelante, y en vista de que se trató de un proyecto ya aprobado por una universidad y que no involucraba procedimientos invasivos o potencialmente dañinos para las personas, no fue necesario someterlo nuevamente a un comité de evaluación, optando por solicitar permiso directo a las autoridades de las instituciones.
En la presente investigación fueron aplicados los principios de la declaración de Helsinki (Asociación Médica Mundial, 1964), así como del código de ética del Colegio de Psicólogos del Perú (Colegio de Psicólogos del Perú, 2017).
De forma preliminar a las evaluaciones, se solicitaron los permisos a las autoridades universitarias para realizar las aplicaciones en horario de clase, lo que posteriormente fue coordinado con los docentes de curso. Para el caso de Colombia, se habilitó el protocolo de aplicación en un formulario de Google Docs.
Luego de firmar el consentimiento informado, o de aceptar participar para el caso de los estudiantes colombianos, se dieron las instrucciones, resaltando el carácter voluntario de la participación, y se completaron los cuestionarios de manera anónima. Por último, los autores han seguido los protocolos de su centro de trabajo sobre el manejo de datos de los estudiantes.
De manera preliminar al análisis de las evidencias de validez con relación a la estructura interna en cada grupo, fue evaluada la normalidad multivariada con el coeficiente de Mardia (G2; 1970), esperando magnitudes por debajo de 70 (Rodríguez & Ruiz, 2008). Posteriormente se aplicó un análisis factorial confirmatorio (CFA) con el método de extracción WLSMV con base en la matriz de correlaciones policóricas en las tres muestras por separado. Para valorar el modelo se recurrió a la magnitud de los índices de ajuste más frecuentes: el índice de ajuste comparativo (CFI > .90; McDonald & Ho, 2002), el límite superior del intervalo de confianza (IC) del índice de aproximación de la raíz de cuadrados medios del error (Límite superior RMSEA < .10; West, Taylor, & Wu, 2012), y la raíz cuadrada media residual ponderada (WRMR < 1; DiStefano, Liu, Jiang, & Shi, 2018). Asimismo, fue valorada la magnitud de las cargas factoriales (> .50; Dominguez-Lara, 2018c), la varianza media extraída por factor (VME) esperando que sea mayor que .50 (Fornell & Larcker, 1981), y la confiabilidad del constructo con el coeficiente ω (> .70; Hunsley & Marsh, 2008).
En segundo lugar, se realizó un análisis de invarianza de medición para valorar la equivalencia del modelo unidimensional de la ECE entre las tres muestras mediante un análisis factorial de grupo múltiple, agregando de forma consecutiva una serie de restricciones de igualdad de parámetros, explorando inicialmente la equivalencia de la estructura de la ECE (invarianza configural), y posteriormente la igualdad estadística de las cargas factoriales (invarianza métrica), de los thresholds o umbrales (invarianza fuerte), y de los residuales (invarianza estricta) (Pendergast, von der Embse, Kilgus, & Eklund, 2017).
La evidencia del grado de invarianza de medición se obtuvo mediante tres fuentes de información. La primera se basó en la variación en la magnitud de los índices de ajuste entre modelos, específicamente del CFI y RMSEA, es decir, evidencia desfavorable de invarianza de medición si ΔCFI < -.01 y ΔRMSEA ≥ .015 (Chen, 2007), y de forma complementaria el cambio en el χ2 con el comando DIFFTEST de Mplus (Asparouhov & Muthén, 2006). Cabe mencionar que si bien la efectividad del uso de puntos de corte basados en estudios realizados considerando variables continuas (e.g., Chen, 2007) aún no está estudiada en variables ordinales, podría usarse en esos casos cuando se cuenta al menos con 150 participantes por grupo (Pendergast et al., 2017), aunque es necesario complementarlo con otros criterios.
La segunda fuente se basó en el análisis bajo un enfoque de malas especificaciones (Saris, Satorra, & van der Veld, 2009) de los índices de modificación (IM) de los potenciales parámetros no invariantes, y la comparación entre grupos de los parámetros factoriales (cargas factorial, threshold y residuales) consignados como no invariantes con medidas de magnitud del efecto (Cohen, 1992) aplicadas a la invarianza de medición (Pornprasertmanit, 2014); y la tercera, fue la consideración de la cantidad de parámetros no-invariantes, esperando que sean menos del 20% del total de parámetros estudiados (Dimitrov, 2010). Los procedimientos principales se ejecutaron con el Mplus versión 7 (Muthén & Muthén, 1998-2015), y el análisis de las malas especificaciones con un módulo especializado (Dominguez-Lara & Merino-Soto, 2018). Al final del manuscrito (Anexo) se encuentra la sintaxis para la invarianza estricta (último proceso de invarianza de medición).
No existió un alejamiento significativo de la normalidad multivariada en los tres grupos (G2México = 9.565; G2Colombia = 9.698; G2Perú = 12.087). El ajuste del modelo unidimensional alcanza magnitudes aceptables del CFI y WRMR en los tres países (CFIPerú = .945, WRMRPerú = 1.386; CFIMéxico = .940, WRMRMéxico = 1.323; CFIColombia = .948, WRMRColombia = 1.125), a diferencia del RMSEA que excedió lo establecido con relación al límite superior de su intervalo de confianza en Perú (RMSEA = .124, IC 90% [.111, .138]), México (RMSEA = .131, IC 90% [.116, .146]) y Colombia (RMSEA = .121, IC 90% [.104, .139]). Por otro lado, se puede apreciar (Tabla 1) que la magnitud de las cargas factoriales fue de moderada a alta en las tres muestras (λpromedio > .70) y el límite inferior de su intervalo de confianza fue mayor que .50 en casi todos los casos, la varianza media explicada en cada grupo es adecuada (VME ≥ .50) y la confiabilidad del constructo excelente (ω > .90).

La invarianza configural evidenció índices de ajuste similares a los que obtuvo cada grupo separadamente (CFIconfigural = .945; RMSEAconfigural = .125, IC 90% [.117, .134]). Posteriormente, al evaluar la invarianza métrica los índices de ajuste mejoraron (CFImétrica = .963; RMSEAconfigural = .094, IC 90% [.086, .102]) y la diferencia con el modelo configural no fue significativa (Δχ2 = 25.657, gl = 18, p = .108). Además, destaca que los grupos comparten los tres ítems más representativos (ítem 6: Hay días que noto más la fatiga y me falta energía para concentrarme; ítem 7: Me siento emocionalmente agotado por mis estudios; ítem 9: Estudiar pensando en los exámenes me produce estrés) y los tres menos representativos (ítems 2: Creo que me esfuerzo mucho para lo poco que consigo; ítem 3: Me siento bajo de ánimo, como triste, sin motivo aparente; ítem 4: Hay días que no duermo bien a causa del estudio). Cabe mencionar que los IM sugerían liberar las cargas factoriales de los ítems 4 (IMColombia = 11.741; Cambio estimado en el parámetro (CEP) = .100; IMPerú = 10.601; CEP = -.095) y 5 (IMMéxico = 10.254; CEP = .093) por considerarlos no invariantes, pero no se llevaron a cabo procedimientos de contraste en vista de que no podían ser valorados como malas especificaciones.
Finalmente, en cuanto a la invarianza fuerte, los índices de ajuste (CFIfuerte = .954; RMSEAfuerte = .087, IC 90% [.080, .094]) y su variación respecto al modelo anterior fueron aceptables en esta etapa, pero el procedimiento DIFFTEST indica que ambos modelos difieren estadísticamente (Δχ2 = 100.515, gl = 58, p < .001). Con atención a ello, la lectura de los IM bajo un enfoque de malas especificaciones encontró que dos promedios de ítems y cuatro thresholds serían significativamente diferentes entre los grupos.
En cuanto a los promedios, los ítems 2 (Creo que me esfuerzo mucho para lo poco que consigo; MColombia = 2.809, MPerú = 2.655, MMéxico = 2.439) y 8 (Me siento cansado al final de la jornada de estudio; MColombia = 3.396, MPerú = 3.271, MMéxico = 2.997) se mostraron como no invariantes (ítem 2: IMColombia = 23.958, CEP = .217; IMPerú = 13.869, CEP = -.169; Ítem 8: IMColombia = 23.795, CEP = .224; IMPerú = 16.338, CEP = -.183). Sin embargo, un análisis posterior bajo el enfoque de magnitud del efecto indica que la diferencia de medias entre grupos fue insignificante tanto para el ítem 2 (ω2 = .014) como para el 8 (ω2 = .018).
Con relación a los threshold, destaca el τ4 asociado a la última categoría de respuesta (Siempre) de los ítems 3 (IMPerú = 14.412, CEP = -.611) y 6 (IMPerú = 13.053, CEP = -.427), así como el τ2 (responder Pocas veces o Raras veces) del ítem 2 (IMColombia = 13.786, CEP = -.189) y τ3 (responder de Con frecuencia hacia las opciones menores) del ítem 8 (IMColombia = 13.207, CEP = -.187). Con respecto al ítem 3, la probabilidad asociada a responder la última categoría es de 2.4% para Colombia (τ3,4 = 1.972), de 6.8% para Perú (τ3,4 = 1.492) y de 1.1% para México (τ3,4 = 2.289); y en cuanto al ítem 6, la probabilidad fue de 3.1% para Colombia (τ6,4 = 1.863), de 9.3% para Perú (τ6,4 = 1.321) y de 2.8% para México (τ6,4 = 1.917). Por otro lado, la probabilidad asociada al τ2 del ítem 2 fue de 21.2% para Colombia (τ2,2 = .033), de 26.1% para Perú (τ2,2 = .035) y de 30.1% para México (τ2,2 = .035); y por último, la probabilidad asociada al τ3 del ítem 8 fue de 30.2% para Colombia (τ3,8 = .352), de 32.2% para Perú (τ3,8 = .335) y de 29% para México (τ3,8 = .318).
Para todos los casos, se analizó la diferencia entre pares de proporciones (e.g., diferencias entre la probabilidad asociada a τ3,4 de Perú y Colombia) con el estadístico h, y solo se halló que los parámetros peruanos son más elevados que los de los otros grupos en los τ4, y el τ2 de Colombia es menor que el de los otros países, lo que significa que únicamente esos tres parámetros (τ3,4, τ6,4 y τ8,3) podrían considerarse parcialmente no invariantes.
Para terminar, la evaluación de la invarianza estricta mostró índices de ajuste (CFIestricta = .957; RMSEAestricta = .080, IC 90% [.073, .087]) que no variaron de forma notable con respecto al modelo de invarianza fuerte. Sin embargo, de la misma forma que el contraste anterior, según DIFFTEST los modelos difieren estadísticamente (Δχ2 = 49.922, gl = 20, p < .001). Los IM sugieren que el residual de los ítems 4 (IMColombia = 14.769, CEP = -.258; IMPerú = 14.448, CEP = .253; δPerú = .677; δColombia = .542; δMéxico = .623) y 10 (Me falta tiempo y me siento desbordado por los estudios; IMMéxico = 10.927, CEP = .180; δPerú = .441; δColombia = .449; δMéxico = .509) difiere entre grupos, encontrando mediante el estadístico . que el residual del ítem 4 del grupo colombiano es significativamente menor que los demás, y el del ítem 10 de los estudiantes mexicanos es mayor.
De este modo, puede entenderse que la ECE, como medida unidimensional del AE, presente un grado aceptable de invarianza entre los tres grupos de estudiantes universitarios a decir de la elevada cantidad de parámetros invariantes que presenta el modelo ( > 80%).
En vista de la ausencia de trabajos que analicen la equivalencia de la medida del AE entre estudiantes latinoamericanos, el objetivo del presente fue realizar un análisis de invarianza de una medida unidimensional de AE, la ECE, entre estudiantes universitarios mexicanos, peruanos y colombianos.
En cuanto al análisis por grupo, el modelo unidimensional mostró índices de ajuste, cargas factoriales y VME aceptables, así como una elevada confiabilidad de constructo. Ello concuerda con estudios previos llevados a cabo en Perú (Dominguez-Lara et al., 2018) y México (González & Landero, 2007a) donde se resaltan estas bondades psicométricas, y a su vez representan las primeras evidencias de validez de la ECE en universitarios colombianos, lo que brinda la posibilidad de ser utilizada en ese contexto. Estos resultados representan una línea base que indica la viabilidad de un análisis de grupo múltiple. No obstante, la magnitud observada en el RMSEA, donde el límite superior fue mayor que .10 en todos los casos, necesita una explicación independiente.
Cuando las cargas factoriales son elevadas (> .70), el RMSEA es más sensible a cualquier tipo de mala especificación (por mínima que sea) mostrando un mal ajuste, pero cuando las cargas factoriales son pequeñas, incluso en presencia de malas especificaciones tiende a alcanzar magnitudes aceptables (Heene, Hilbert, Draxler, Ziegler, & Bühner, 2011; Mahler, 2016; Savalei, 2012). Así, es probable que existan discrepancias con otros índices de ajuste como el CFI, pero la evidencia indica que, en presencia de normalidad multivariada, es más problemático para el ajuste del modelo un RMSEA “bueno” y un CFI “malo” que un RMSEA “malo” y un CFI “bueno” (Lai & Green, 2016), como es el caso de este trabajo, y otros anteriores (Dominguez-Lara, 2014, 2018b; González & Landero, 2007a), dado que el RMSEA se basa en el análisis de la matriz residual y el CFI en la comparación con un modelo nulo de ítems independientes. Por tales motivos, pese a que podría otorgar información relevante, no es conveniente realizar una interpretación del RMSEA puesto que la ECE posee pocos ítems y cargas factoriales de moderadas a altas (λpromedio > .70).
En cuanto al análisis de invarianza realizado, y las evidencias recopiladas en cada etapa, tal como el análisis global de la variación de los índices de ajuste, la evaluación de las malas especificaciones asociadas a potenciales parámetros no invariantes y contrastes estadísticos, se confirma que el AE es medido por la ECE de forma similar en los tres grupos de estudiantes, considerando la estructura unidimensional de la escala, las cargas factoriales, thresholds, y residuales, además de una elevada confiabilidad del constructo.
En ese sentido, los hallazgos derivados de la invarianza métrica aportan información relevante sobre qué tanta representatividad poseen los ítems con relación al constructo evaluado (cargas factoriales) en los tres grupos, encontrando que los ítems poco (e.g., ítem 2: “Creo que me esfuerzo mucho para lo poco que consigo”) o muy representativos (e.g., ítem 7: “Me siento emocionalmente agotado por mis estudios”) son los mismos entre los tres grupos. Asimismo, la invarianza fuerte indicaría que el constructo AE posee, en términos generales, el mismo nivel en los estudiantes peruanos, mexicanos y colombianos, y que cualquier diferencia encontrada podría interpretarse sin sesgo aparente.
De este modo, estos hallazgos coinciden con otro estudio desarrollado en población hispanohablante (Charry et al., 2018) que resalta el carácter invariante del constructo, aunque usando el MBI-SS. Sin embargo, pueden destacarse las diferencias con un estudio que también se enfocó en estudiantes que hablaban el mismo idioma, en este caso el portugués, pero concluyó que la medida no fue invariante (Campos & Marôco, 2012), así como los de los grupos de Schaufeli et al. (2002) y Reis et al. (2015). En estos últimos casos, es posible resaltar que la fuente de la ausencia de un grado aceptable de invarianza sería la procedencia, la composición de la muestra según carrera profesional y el sexo.
Conforme lo mencionado en el párrafo anterior, Campos y Marôco (2012) indican con respecto al sexo que el 89% de la muestra portuguesa fueron mujeres en comparación al 53.3% del grupo procedente de Brasil; el 90.5% de los portugueses estudiaban ciencias sociales y humanidades, mientras que la muestra brasileña incluía estudiantes de diversas carreras (49.0% ciencias de la salud, 32.7% ciencias exactas, 11.6% ciencias sociales y humanidades, y 5.8% ciencias biológicas). Asimismo, en Reis y colaboradores (2015) se aprecia que las dos muestras presentan una elevada proporción de mujeres (74.3% alemanas; 81% griegas), aunque la composición según carreras varía de forma sensible ya que el grupo alemán está conformado por estudiantes de diferentes programas de estudio, mientras que en el de estudiantes griegos predominan los de psicología (59.1%) y educación (21.8%).
Por otro lado, con relación a la composición de grupos considerando la carrera profesional estudiada, cabe precisar que en Schaufeli y colaboradores (2002) la mayor parte de estudiantes de los tres grupos fue de psicología, mientras que en la muestra española el 62% fueron mujeres, muchas menos que en la muestra portuguesa (84%) y holandesa (88%), por lo que la ausencia de invarianza podría asociarse al instrumento empleado en vista que se pudo observar que desde etapas tempranas del análisis primó el uso de correlaciones entre residuales para mejorar el ajuste de los modelos, siendo esta una práctica que en la actualidad genera controversia si se usa solo para aumentar los índices de ajuste (Dominguez-Lara, 2019). En cambio, en Charry y equipo (2018) solo se menciona que el 68% fueron mujeres (sin diferenciar por grupo), pero indican que los grupos se componen por estudiantes de diferentes carreras, lo que da equilibrio a las diferencias que podrían existir.
Por último, la potencial fuente de sesgo asociada a la procedencia de los evaluados podría adjudicarse al sistema universitario en el cual está inmerso, pero si bien esto se aplicaría a las muestras que consideraron estudiantes europeos y latinoamericanos (Campos & Marôco, 2012), no se replica en Charry y colaboradores (2018) cuyos grupos tenían esas características (Colombia y España). Por otro lado, en Reis et al. (2015) y Schaufeli et al. (2002) a pesar de contar con estudiantes europeos, cuyo contexto universitario es muy similar entre ellos (Fraile Aranda, 2006), la medida de burnout no es equivalente, lo que podría asociarse con diferencias idiomáticas (se emplearon versiones en español, portugués, neerlandés, alemán y griego) que afectaría la representación del constructo en los evaluados teniendo en cuenta que las traducciones no siempre capturan la esencia del ítem original debido a la cultura en la que fue creado el instrumento determina qué aspectos prioriza (e.g., Ruiz et al., 2019; Valer, Aires, Fengler, & Paskulin, 2015).
De este modo, conforme a los resultados obtenidos con respecto a la pertenencia a determinada carrera profesional, la ausencia de invarianza se podría explicar por la dificultad percibida o a la exigencia inherente a determinados programas de estudios en los que enfatizan diferentes áreas del conocimiento. Por ejemplo, los programas curriculares de las carreras de ingeniería reciben predominantemente asignaturas (o materias) vinculadas a las matemáticas, mientras que en ciencias de la salud lo hacen en los de anatomía, biología, promoción de la salud, entre otros. En cambio, en carreras como psicología las mallas curriculares suelen ser más heterogéneas: existen cursos que involucran matemáticas (e.g., estadística), anatomía (e.g., neurociencias) y aquellos propios de la especialidad (e.g., psicología de la personalidad), y no conllevan una experiencia de burnout elevada (Caballero et al., 2010). Sin embargo, es de esperar diferencias en cuanto a las puntuaciones en la escala (e.g., que un grupo puntúe más alto que otro), pero no en la medición del constructo, porque de ser así existirían elementos más allá del SB que están afectando las respuestas generando sesgo.
Por último, ya fue contrastado con anterioridad que el AE es invariante con relación al sexo (e.g., Dominguez-Lara et al., 2018; Li, Wu, Wen, & Wang, 2014; Portoghese et al., 2018), por lo que la configuración de la muestra con base en esta variable no parece ser una limitación seria, teniendo en cuenta que existen carreras profesionales con una población mayoritaria de mujeres, como psicología o enfermería.
Entonces, estos resultados indican que es posible evaluar de forma invariante el AE inclusive en diferentes contextos, en contraste a estudios previos que indicaban lo contrario (Campos & Marôco, 2012; Reis et al., 2015; Schaufeli et al., 2002), y así se abren las posibilidades de realizar posteriormente estudios comparativos entre países, inclusive evaluar modelos explicativos.
En cuanto a las fortalezas del análisis de invarianza realizado destaca el examen pormenorizado de potenciales parámetros no invariantes partiendo de un enfoque de malas especificaciones (Saris et al., 2009). Este proceder no es frecuente en estudios similares, ya que la mayoría basa sus conclusiones solo en la variación de los índices de ajuste para valorar el grado de invarianza (e.g., Reis et al., 2015) o en liberar parámetros no invariantes optando por concluir a favor de la invarianza parcial, sea métrica o fuerte (e.g., Portoghese et al., 2018; Xanthopoulou, Bakker, Kantas, & Demerouti, 2012), sin explicar por qué no son invariantes. Además, es necesario mencionar que la presencia de invarianza de medición del AE fue alcanzada aun en presencia de grupos donde se espera una experiencia distinta de AE a nivel de puntuaciones, que se asocia con la percepción de dificultad en cuanto a la formación profesional (los estudiantes de Colombia y Perú fueron de psicología, y los mexicanos mayoritariamente de ciencias de la salud). Todo ello, brinda evidencia favorable a la ECE para ser usada en el contexto latinoamericano. No obstante, es necesario mencionar que el análisis de invarianza con modelos no lineales es un tema que se encuentra en desarrollo (Pendergast et al., 2017; Wu & Estabrook, 2016) dado que la mayor parte de supuestos y criterios de valoración fueron obtenidos con base en variables cuantitativas (e.g., Chen, 2007), por lo que es necesario estar vigilantes a los avances en el área.
En cuanto a las potenciales limitaciones, un punto importante es el referido al método de estimación. Si bien es cierto el uso de estimadores no lineales (como el WLSMV) requiere del cumplimiento de la normalidad multivariada, para los cuales quizás el uso de coeficientes como el de Mardia (1970) podría estar limitado dado que fue pensado inicialmente para variables continuas, estudios seminales indican que frente a desviaciones mínimas de la normalidad no parece haber sesgos importantes en la estimación de parámetros (Flora & Curran, 2004). No obstante, reportes recientes han demostrado que las desviaciones de la normalidad multivariada pueden afectar los resultados en medidas multidimensionales (Foldnes & Grønneberg, 2020). Con todo, al ser la ECE una medida unidimensional no existiría evidencia definitiva respecto al grado en que las estimaciones podrían estar sesgadas, aunque es conveniente tener en cuenta este aspecto en futuros estudios. Asimismo, se podría señalar que las aplicaciones en la muestra colombiana fueron hechas mediante un formulario vía internet, pero a juzgar por la magnitud de los parámetros hallados no parece ser un punto de inflexión en el momento de valorar el constructo, habiéndose demostrado en diversos contextos la equivalencia entre aplicaciones a lápiz-y-papel y vía internet de un mismo instrumento (e.g, Barrigón et al., 2017; Dias, Maroco, & Campos, 2015). Por otro lado, debido al tamaño muestral de los grupos no fue posible realizar un análisis de invarianza considerando nacionalidad y sexo, ya que si bien existe evidencia de que en diferentes muestras la medición es similar (e.g., Li et al., 2014), no existe evidencia de una comparación más allá de las fronteras de cada país.
En conclusión, la medición del AE realizada con la ECE es invariante entre estudiantes mexicanos, colombianos y peruanos. Esto es muy importante en el momento de afrontar niveles altos de AE en estudiantes, pues se puede contar no solo con una herramienta para evaluarlo, sino que además sus resultados podrían permitir tomar acciones de intervención en aquellos casos que manifiesten altos niveles de AE, sin tener que diseñar tratamientos para grupos diferenciados.
Con todo, es recomendable ampliar el estudio a otros países de la región, así como estudiar si la influencia del AE sobre algunas variables afectivas es similar entre países, considerando a su vez algunas variables moderadoras del SB como la autoeficacia (Salanova, Bresó, & Schaufeli, 2005). Del mismo modo, sería conveniente realizar estudios que involucren nacionalidad y sexo (e.g., mujeres peruanas, hombres colombianos, etc.), dado que brindaría mayor alcance a las conclusiones desde una perspectiva de diferencias de sexo. Finalmente, sería interesante valorar la ECE desde el marco de la Teoría de Respuesta al Ítem (TRI) para determinar qué ítems son los más representativos, considerando la heterogeneidad de las cargas factoriales (es probable que algunos ítems evalúen de forma precisa el AE).
Data:
File
is " C:/Users/DOMINGUEZ/Documents/data.csv";
variable:
NAMES
ARE NAC A1 A2 A3 A4 A5 A6 A7 A8 A9 A10;
USEVARIABLES
ARE NAC A1 A2 A3 A4 A5 A6 A7 A8 A9 A10;
GROUPING
IS NAC (0=MEX 1=COL 2=PER);
CATEGORICAL
ARE A1 A2 A3 A4 A5 A6 A7 A8 A9 A10;
Analysis:
ESTIMATOR=
WLSMV;
COVERAGE
= .00005;
ITERATIONS
= 100000;
PARAMETERIZATION
= THETA;
Output:
SAMPSTAT;
MODINDICES;
stdyx;
Model:
F1
BY A1* (LA1)
A2*
(LA2)
A3*
(LA3)
A4*
(LA4)
A5*
(LA5)
A6*
(LA6)
A7*
(LA7)
A8*
(LA8)
A9*
(LA9)
A10*
(LA10);
[A1$1];
[A1$2];
[A1$3];
[A1$4];
[A2$1];
[A2$2];
[A2$3];
[A2$4];
[A3$1];
[A3$2];
[A3$3];
[A3$4];
[A4$1];
[A4$2];
[A4$3];
[A4$4];
[A5$1];
[A5$2];
[A5$3];
[A5$4];
[A6$1];
[A6$2];
[A6$3];
[A6$4];
[A7$1];
[A7$2];
[A7$3];
[A7$4];
[A8$1];
[A8$2];
[A8$3];
[A8$4];
[A9$1];
[A9$2];
[A9$3];
[A9$4];
[A10$1];
[A10$2];
[A10$3];
[A10$4];
[F1@0];
F1@1;
A1@1
A2@1 A3@1 A4@1 A5@1 A6@1 A7@1 A8@1 A9@1 A10@1;
MODEL
COL:
F1
BY A1* (LA1)
A2*
(LA2)
A3*
(LA3)
A4*
(LA4)
A5*
(LA5)
A6*
(LA6)
A7*
(LA7)
A8*
(LA8)
A9*
(LA9)
A10*
(LA10);
[F1*];
F1*;
A1@1
A2@1 A3@1 A4@1 A5@1 A6@1 A7@1 A8@1 A9@1 A10@1;
MODEL
PER:
F1
BY A1* (LA1)
A2*
(LA2)
A3*
(LA3)
A4*
(LA4)
A5*
(LA5)
A6*
(LA6)
A7*
(LA7)
A8*
(LA8)
A9*
(LA9)
A10*
(LA10);
[F1*];
F1*;
A1@1
A2@1 A3@1 A4@1 A5@1 A6@1 A7@1 A8@1 A9@1 A10@1;
Citar este artículo como: Dominguez-Lara, S.; Alarcón-Parco, D.; Fernández-Arata, M.; Tamayo-Agudelo, W.; Bernal-Vargas, L. & Campos-Uscanga, Y. (2021). Invarianza factorial de una medida de burnout académico entre estudiantes universitarios de Perú, México y Colombia. Revista Argentina de Ciencias del Comportamiento, 13(3), 70-86
https://revistas.unc.edu.ar/index.php/racc/article/view/25946/36509 (pdf)
Enviar correspondencia a: Campos-Uscanga, Y. E-mail: ycampos@uv.mx
