Resumen: La evaluación de conductas éticas se ha realizado habitualmente a través de escalas y cuestionarios, utilizando en ocasiones escenarios o situaciones concretas que cuentan con una serie de limitaciones. El objetivo del presente estudio es validar una escala para evaluar la predisposición de actuación ética por parte de estudiantes de distintos niveles educativos. Partiendo de la escala de Akaah y Lund (1994) se crearon 36 escenarios que reflejaban dilemas éticos en el entorno educativo. El instrumento resultante se aplicó a 662 estudiantes de enseñanzas medias y superiores. El Análisis Factorial Exploratorio permitió obtener 4 factores con 18 elementos y una fiabilidad de .90, mientras que el Análisis Factorial Confirmatorio replicó la estructura de factores. Se discuten las implicaciones y los retos a los que hacer frente en la investigación y en intervenciones futuras.
Palabras clave: conducta ética, escenarios, escala, validación.
Abstract: Ethical behavior has often been assessed using scales and questionnaires, that are sometimes based on specific scenarios or situations with a number of limitations. In the present research, we aimed at validating a scale to measure students' ethical behavioral predispositions at different educational stages. Based on the scale by Akaah and Lund (1994), we created 36 scenarios depicting ethical dilemmas in educational settings. The instrument was applied to 662 students of both secondary and higher education. Exploratory factorial analysis identified 4 factors with 18 elements and a reliability of .90, while confirmatory factorial analysis replicated the structure of the factors. The implications and challenges in research, as well as in future interventions, are discussed.
Keywords: ethical behavior, scenarios, scale, validation.
Validación de una Escala de Conductas Éticas en la Educación Secundaria y Superior: La Escala de Ética en Escenarios Educativos (EEEE)
Validation of a Scale of Ethical Behavior in Secondary and Higher Education: The Ethics Scale in Educational Scenarios (EEEE)
De un tiempo a esta parte, parece que no pasa un día sin que aparezcan en los medios de comunicación noticias relacionadas con conductas poco éticas de políticos, empresarios o profesionales que ocupan puestos de responsabilidad e incumplen las normas, roban, o intimidan. Si los líderes de la sociedad, los que tendrían que servir de modelo, no muestran una conducta normativamente apropiada (honesta, fiable, que muestre equidad y respeto hacia los otros) a través de sus acciones personales y sus relaciones interpersonales- es decir, lo que sería un liderazgo ético (p. ej., Brown & Treviño, 2005; Peng & Kim, 2020)- es difícil esperar que tanto jóvenes como mayores pongan de manifiesto otro tipo de conductas.
La relevancia de las conductas éticas en la actualidad también se ha visto reflejada en el ámbito científico, donde han gozado de amplio interés. Así, por ejemplo, se han abordado los factores que influyen en las conductas éticas de los estudiantes, como puedan ser la cultura de integridad en la institución (Kisamore et al., 2007), la influencia de la carrera cursada (Smyth & Davis, 2004) o las actitudes hacia conductas que incumplen las normas (Yu et al., 2020). Asimismo, son varios los meta-análisis que han abordado las causas de las conductas no éticas (Belle & Cantarelli, 2017), la relación entre actitudes y conductas éticas en estudiantes (Borkowski & Ugras, 1998) o la relación entre factores motivacionales y la falta de honradez académica (Krou et al., 2020).
De hecho, las diferentes etapas del proceso educativo juegan un papel fundamental en el desarrollo de orientaciones éticas. Así, por ejemplo, la educación en ética influye positivamente sobre la consciencia ética, así como la sensibilidad y el razonamiento moral (Lau, 2010). En la enseñanza secundaria española se abordan los valores éticos a lo largo de varios cursos a través de las asignaturas “Historia de la filosofía” y “Valores éticos”, en las que, además de abordar la ética y los autores más representativos, se plantea la mejora de los juicios de los estudiantes en sus procesos de toma de decisiones, utilizando, entre otras técnicas, los dilemas éticos. Las universidades, a su vez, se centran especialmente en la transmisión de conocimientos y el desarrollo de competencias concretas, tales como la solución de problemas, el trabajo en equipo o la comunicación. Con ello se busca formar personas que puedan incorporarse al mundo del trabajo prestando un servicio a su organización y a la sociedad. Sin embargo, a pesar de la relevancia que adquiere la educación superior en el desarrollo moral de los estudiantes (Couch, 2005) y la importancia que se le concede a la ética en el diseño de las titulaciones universitarias, la ética es una variable que merece mayor atención en la formación de los estudiantes universitarios (p. ej., Drumwright et al., 2015).
Cabe señalarse, no obstante, que la importancia de la conducta ética trasciende la formación académica, tal y como señalan varios estudios que han analizado la relación que tienen las conductas poco éticas que los estudiantes muestran durante su etapa de formación con la que muestran posteriormente (p. ej., Guerrero-Dib, Portales, & Heredia-Escorza, 2020). Así, los estudiantes que hacen trampas o plagian en la universidad son más tolerantes con la necesidad de recurrir a conductas poco éticas en el lugar de trabajo (Lawson, 2004) y aquellos que muestran poca honestidad en la universidad tienen más probabilidades de ser poco honestos en el trabajo (Nonis & Smith, 2001).
Desarrollo y evaluación de la conducta ética
El desarrollo del razonamiento y de las conductas morales ha sido objeto de estudio en modelos como los de Kohlberg (p. ej., 1968; Kohlberg & Hersh, 1977) y Rest (p. ej., Bebeau et al., 1999; Narvaez & Rest, 1995), cuyas formulaciones han servido de base para desarrollos teóricos en la actualidad a pesar de remontarse a varias décadas atrás (Bairaktarova & Woodcock, 2017). Kohlberg plantea el desarrollo moral a través de tres niveles con dos estadios cada uno. Mientras que en el primer nivel se interpretan las etiquetas de bueno/malo o correcto/incorrecto en función de las consecuencias (físicas o hedónicas) o de la fuerza física que ejercen aquellos que formulan las normas y etiquetas, en el segundo nivel se mantienen las expectativas y normas de los grupos de pertenencia al tener valor en sí mismas con independencia de las consecuencias. En el tercer nivel se separan los propios valores y principios de los otros y se tiene una mayor confianza en los propios principios morales. Dicho modelo fue posteriormente desarrollado por Rest y colaboradores desde una perspectiva neo-Kohlbergiana (Rest et al., 2000) y plantea que los cuatro procesos o componentes que dan lugar a la conducta moral comprenden la sensibilidad moral para reconocer las situaciones sociales; el razonamiento moral para valorar si las acciones son morales; la motivación para actuar de forma moral priorizando los valores morales sobre los valores personales y el carácter moral para implementar la acción seleccionada.
De cara a identificar el razonamiento moral, Kohlberg (Colby & Kohlberg, 1987) recurría a los dilemas éticos (es decir, situaciones que implican decisiones entre dos alternativas correctas o entre dos alternativas incorrectas; Schwartz, 2016) en entrevistas, narrándolos en primer lugar y haciendo posteriormente preguntas sobre los mismos. Dichos dilemas fueron utilizados posteriormente a través de escalas y cuestionarios tales como el DIT (Defining Issues Test; p. ej., Rest et al., 1974). Otro instrumento utilizado con frecuencia ha sido la escala ética multidimensional (MES) de Reidenbach y Robin (1988), que evalúa la toma de decisiones éticas a través de escenarios. Para cada escenario, los sujetos tienen que contestar 29 ítems relacionados con cinco filosofías normativas: justicia (p. ej., justo-injusto), utilitarismo (p. ej., eficiente-ineficiente), egoísmo (p. ej., egoísta-no egoísta), relativismo (p. ej., culturalmente aceptable-inaceptable) y deontología (p. ej., moralmente correcto-moralmente incorrecto). Tanto el DIT como el MES se han utilizado en diferentes ámbitos, incluyendo el educativo. Así, han sido objeto de estudio la eficacia de las actividades curriculares y extracurriculares sobre el conocimiento ético, el razonamiento ético y la conducta ética de los estudiantes universitarios (Finelli et al., 2012) o la relación entre valores culturales, personalidad, religiosidad y sensibilidad ética (Kara et al., 2016). Sin embargo, en investigaciones previas se ha aludido a ciertas limitaciones como las dudas generadas acerca de la validez discriminante del DIT (McMahon & Harvey, 2007) o a la necesidad de mejorar el contenido de los instrumentos con escenarios (Mudrack & Mason, 2013a). A pesar de los problemas, tal y como señalan Kenny, Lincoln y Killian (2015), el uso de escenarios constituye un instrumento adecuado para la educación y evaluación ética y la construcción de escenarios o viñetas en los que aparece una conducta cuestionable constituye una metodología común (Mudrack & Mason, 2013b) para evaluar dimensiones o conductas éticas tales como la integridad personal (Fritzsche & Becker, 1984) o hacer trampas durante un examen (McCabe et al., 1994). En este artículo se plantea, por tanto, como objetivo la validación de una escala de ética que utiliza la técnica de escenarios educativos para medir la predisposición de actuación ética de los estudiantes en distintas situaciones educativas. La construcción del instrumento se basó en una escala de Akaah y Lund (1994) formulada originariamente por Newstrom y Ruch (1975) y que ha sido ampliamente utilizada en diversas investigaciones (p. ej., Zhang et al., 2018) durante más de 30 años para estudiar actitudes de empleados con respecto a problemas éticos habituales en el contexto laboral (Perryer & Scott-Ladd, 2014) a pesar de contar con una serie de limitaciones (p. ej., de validez de criterio; Kaptein, 2008). Por ello, siguiendo las recomendaciones articuladas en los últimos años de recurrir a enfoques centrados en contextos específicos (p. ej., Schmocker et al., 2019), y la realización de adaptaciones y actualizaciones de la escala realizadas en diferentes investigaciones, incluso dentro del ámbito específico para el que fue diseñada originalmente (Morales-Sánchez et al., 2020), se adaptó la escala al ámbito académico para que permitiese conocer la toma de decisiones en situaciones reales. Debido a que otros instrumentos como el DIT recurren a escenarios que abordan situaciones alejadas de la vida académica o extraacadémica del estudiante (p.ej., decisión a la que se enfrenta un médico en el ejercicio de su profesión), se optó por adaptar la escala al ámbito académico para facilitar que el estudiante expresara su predisposición a comportarse de forma ética en una situación cotidiana y conocida. Este instrumento, adaptado al contexto de las personas que lo cumplimentan (estudiantes), con situaciones propias de su entorno, propicia la interpretación del constructo evaluado, es decir, la predisposición a comportarse de forma ética.
En segundo lugar, se plantea, asimismo, evaluar la invarianza de medición del instrumento en función de dos variables -género y edad o nivel educativo - cuya relevancia ya fue señalada en relación al desarrollo cognitivo- moral (Rest, 1986 en Perryer & Tsahuridu, 2013) y que, de hecho, han sido objeto de análisis en múltiples investigaciones (p. ej., Lawson, 2004; Mudrack & Mason, 2013b). A este respecto, si bien los resultados de las investigaciones relativas a las diferencias de género y edad no son consistentes (p. ej., Loe et al., 2000; O’Fallon & Butterfield, 2005), en línea con investigaciones anteriores esperamos conductas más éticas en las mujeres en comparación con los hombres (Mubako et al., 2020), así como en los estudiantes cursando estudios en niveles educativos superiores (Dawson, 1997).
Participantes
El instrumento se aplicó a una muestra formada por 662 estudiantes de la Comunidad de Madrid que fueron seleccionados a partir de un muestreo no probabilístico de conveniencia intencionado (Martínez-Arias, 1995). El 37.5% eran estudiantes de Educación Secundaria Obligatoria y el 12.4% de Bachillerato, todos del mismo instituto de la zona Oeste de Madrid. El 46.2% de la muestra eran estudiantes universitarios de distintos grados (Psicología, Derecho, Relaciones Laborales) y cursos (desde primero a cuarto) y el 3.9% estudiantes de máster de una Universidad de Madrid. El 62.8% eran mujeres y el 37.2% hombres y la edad media era de 18.29 años (SD=5.10). 57 participantes no indicaron su género y 12 no indicaron su edad.
Instrumento
Para la elaboración del instrumento se partió de la escala de conductas éticas de Akaah y Lund (1994), que consta de 17 ítems que miden los factores de uso personal, culpar a otros, falsificación, soborno, engañar y pasar gastos con cargo a la empresa. Debido a que dichos factores, que han sido utilizados previamente en diversas investigaciones (p. ej., Fritzsche, 1995, 2004), se inscribían en un contexto organizacional, no se procedió a una traducción literal de los enunciados siguiendo los estándares de adaptación lingüística, sino optó en un primer paso por adaptar los ítems propios del contexto organizacional al educativo. En un segundo paso, se ampliaron los ejemplos en cada dimensión, de manera que se crearon 36 escenarios que reflejaban distintos dilemas éticos adaptados a entornos educativos mediante ejemplos de situaciones concretas que buscaban un paralelismo con las dimensiones del cuestionario de Akaah y Lund (1994). Así, para la dimensión de “uso personal” se crearon tres ítems relacionados con el hurto, dos con el aprovechamiento de dichos recursos y un ítem con el aprovechamiento del trabajo de otros; para la dimensión “culpar a otros” tres ítems relacionados con el ocultamiento de errores, tres relativos a culpar a otros, y tres ítems que suponen atribuirse el mérito del trabajo ajeno; para la dimensión de “falsificación” cinco ítems relacionados con hacer trampas para aprobar, cuatro relativos a conseguir un trato preferencial a través de mentiras y tres ítems relacionados con violar las normas. Para la dimensión de “soborno” se crearon cuatro ítems y para la dimensión de “engañar” cinco ítems. Por ejemplo, para el “hurto de materiales y suministros de la oficina” se redactó un ítem que reflejaba el hecho de hurtar: “Quedarse con un libro perdido de la biblioteca”. A su vez, la “falsificación de informes” se recogió mediante el ítem de “falsificar la firma de un compañero para ayudarle a aprobar” o “llamar fingiendo que está enfermo para tomarse un día libre” se transformó en “pedir al médico un certificado para que le examinen otro día”.
Los elementos de la escala se presentaron alternando un elemento de cada dimensión y la escala fue revisada y mejorada por tres jueces, investigadores y docentes, con experiencia en afrontar situaciones éticas con los estudiantes. Dichos jueces eliminaron algunos elementos y modificaron otros para mejorar su comprensión y, por tanto, la validez de contenido, recurriendo a un análisis cualitativo.
Procedimiento
Con anterioridad a la aplicación del cuestionario, se explicó a todos los estudiantes la voluntariedad de la actividad y se pidió el cumplimiento del consentimiento antes de aplicar la escala. Para la participación de los estudiantes de educación secundaria se solicitó autorización a la Dirección del centro, desde donde se facilitó la aplicación, mientras que se accedió a los estudiantes universitarios a través de los profesores que impartían docencia en cada uno de los grupos.
El instrumento se aplicó en papel y lápiz y en él se recogía información sobre el género, la edad, los estudios que se estaban realizando, el curso y el centro. Posteriormente se presentaban los 36 escenarios. A todos los estudiantes se les explicó que la escala planteaba distintos escenarios que podían darse en entornos educativos y que se trataba de conocer su forma habitual de comportarse. Para ello, se les pidió que señalaran la probabilidad de actuar de la forma planteada utilizando una escala de 1 (extremadamente improbable) a 7 (extremadamente probable).
Análisis de datos
De cara al análisis de datos se procedió, en primer lugar, con un análisis preliminar de la normalidad de la variable dependiente. En el análisis de los ítems de la escala se tuvieron en cuenta el índice de homogeneidad corregida y el coeficiente alfa si se elimina el ítem, siguiendo las recomendaciones señaladas por Lloret et al. (2014). La fiabilidad de la escala se calculó a través del alfa de Cronbach y el coeficiente omega (p. ej., Trizano-Hermosilla & Alvarado, 2016), mientras que la estimación de omega se basó en la solución aproximada de Hancock y An (2020).
Posteriormente, la muestra total se dividió en dos submuestras aleatorias. La primera de ellas se utilizó para la realización del Análisis Factorial Exploratorio (AFE) y la segunda para el Análisis Factorial Confirmatorio (AFC). Para el AFE se siguieron las pautas de Lloret et al. (2014) y dado que las distribuciones de las variables eran adecuadas y que la escala tenía siete categorías de respuesta, se utilizó la matriz de correlaciones de Pearson. El método utilizado para el AFE fue máxima verosimilitud (ML) y promín de rotación oblicua, ya que permitía una solución factorial más simple y fácil de interpretar. En concreto, los criterios utilizados para la toma de decisiones respecto a la selección de ítems fueron los siguientes: cuando el índice de homogeneidad corregido (correlación ítem-total sin el ítem analizado) era inferior a .4; cuando tras la eliminación del ítem de la subescala aumentaba dicho alfa; cuando en los sucesivos análisis factoriales realizados la comunalidad era inferior a .3; o cuando el peso del ítem en el factor era inferior a .3. Estos criterios se tomaron en función de las recomendaciones de Brown (2015), si bien los puntos de corte fueron determinados por los autores.
Los análisis se realizaron con el programa FACTOR (Lorenzo-Seva & Ferrando, 2006), mientras que el AFC fue realizado con el programa AMOS v.23, utilizando máxima verosimilitud y la matriz de correlaciones de Pearson. Para evaluar el ajuste se utilizaron los indicadores de bondad de ajuste recogidos por Herrero (2010): índice CFI (comparative fit index) recomendado >=.95; TLI (Tucker-Lewis index) recomendado >=.93; y el RMSEA (root mean square error of approximation) recomendado <=.05.
A continuación, se analizó la invarianza en función del género y el nivel de estudios. El objetivo era conocer si el modelo resultante se mantiene estable para varones y mujeres, por un lado, y para estudiantes de instituto y de universidad, por otro. Es decir, si existe invarianza en la estructura factorial de la prueba. Siguiendo a Milfont y Fischer (2010) se tomaron como criterios de toma de decisiones los valores de CFI, el Gamma-Hat (GH) y el índice de ajuste no centralizado (NCI), ya que permiten identificar la invariancia de los parámetros y no están influenciados por la complejidad del modelo, ni por el tamaño de la muestra. En este sentido, suponen buenos indicadores cuando los incrementos de un modelo a otro no son superiores a .01 para CFI, .001 para GH y .02 para NCI. Por último, para analizar las relaciones entre las dos variables, se realizaron pruebas de diferencia de medias (.-test para muestras independientes).


En el análisis de los ítems de la escala se observó que los índices de asimetría y curtosis estaban por debajo de 1.5, lo que indicaba una adecuada distribución de las variables. El análisis de normalidad multivariada no permitió afirmar que las puntuaciones totales en ética procedían de poblaciones normales (Kolgomorov-Smirnov=.041; .=.011). Sin embargo, hay que tener en cuenta que con muestras grandes estos estadísticos son muy sensibles. El histograma y los gráficos Q-Q de normalidad mostraron, por el contrario, una tendencia a dicha normalidad. Se constató la existencia de normalidad multivariada mediante el coeficiente de Mardia, cuyo valor de 18.21 resultó inferior a p(p+2), siendo p el número de variables observadas (en nuestro caso, 18).
Tras la realización sucesiva de distintos análisis factoriales (AFE), la solución más satisfactoria al AFE se encontró con 18 elementos que se agrupaban en 4 factores. El número de factores se decidió teniendo en cuenta los requisitos marcados para los ítems y la facilidad para interpretar la solución. Los factores se denominaron “engañar para aprobar”, “perjudicar a terceros”, “ocultar información” y “hurtar”.
Por tanto, los 36 escenarios iniciales se redujeron a 18 ítems, de los cuales cinco correspondían a “engañar para aprobar”, seis a “perjudicar a terceros”, tres a “ocultar información” y cuatro a “hurtar”.
En el análisis final realizado, la prueba Kaiser-Meyer-Olkin (KMO) ofreció un valor de .879, siendo la prueba de Bartlett significativa, χ.(153)=1680.70, .<.001. La medida de bondad de ajuste GFI mostró un valor de .99, de la misma forma que el índice RMSEA tuvo un valor de .05. Los datos indicaron, por tanto, la pertinencia del análisis factorial y el buen ajuste del modelo (Lloret et al., 2014).
A continuación, se calcularon los distintos estadísticos descriptivos de los ítems, así como las correlaciones ítem-total (ver Tabla 1).

Los indicadores de fiabilidad para las distintas subescalas, con los respectivos intervalos de confianza (ver Tabla 2), revelaron valores del coeficiente omega situados entre .70 y .73 para las distintas dimensiones. Los valores más bajos de los intervalos de confianza estaban por encima de .65.
Asimismo, se recoge en la Tabla 3 la matriz de correlaciones entre los cuatro factores.
El AFC (ver Figura 1) permitió confirmar la estructura encontrada a través de AFE. Los 18 elementos se agruparon en los mismos cuatro factores, con pesos superiores a .4 en todos los casos. Dicho punto de corte ha sido sugerido, por ejemplo, por Enders y Bandalos (2001), siempre que la muestra sea aceptable. Los coeficientes de determinación (r.) de cada ítem variaron desde .17 (i3) hasta .51 (i5) y las correlaciones entre los cuatro factores fueron elevadas, observándose la más baja entre “ocultar información” y “perjudicar a terceros” (.53) y la más alta entre “ocultar información” y “engañar” (.79).

Los indicadores de bondad de ajuste no llegaron a las recomendaciones que recoge Herrero (2010), dado que el índice CFI fue .91, el TLI .89, y el RMSEA de .059. Las cifras de ajuste mejoraron cuando se eliminaron los ítems con menores pesos (ítems i3, i6, i24, i30), pero se optó por mantener la estructura de ambos modelos (AFE y AFC) en cuanto al número de dimensiones y también respecto al número de ítems.
A continuación, se realizó un AFC multigrupo para analizar la invarianza factorial en función del género. El modelo sin restricciones probó si la estructura propuesta era igual para hombres que para mujeres. Proporcionó un ajuste de datos discreto, pero similar a cuando se tomó en cuenta un solo grupo, indicando que la estructura factorial del constructo es igual en todos los grupos (χ.(258)=593.1, .<.001; CFI=.88; RMSEA=.046).
Para probar la invarianza métrica se restringieron los coeficientes del patrón factorial para que fueran iguales. El incremento de CFI y de NCI cumplió con los criterios anunciados, pero el de GH fue de .002. Estos resultados indican que las cargas factoriales tienden a ser equivalentes en las dos muestras, lo que apoya la invarianza de medición de dos factores en los dos grupos, es decir que los ítems tienen relaciones similares con el constructo en todos los grupos. Sin embargo, el modelo de invarianza escalar, respecto al modelo anterior, debe ser rechazado, y no se puede garantizar que las puntuaciones obtenidas están totalmente relacionadas con el nivel de rasgo latente de los sujetos, independientemente de su grupo. Al analizar la invarianza para los grupos de estudiantes de universidad y estudiantes de institutos se obtuvieron resultados similares a cuando se atendía al género (ver Tabla 4). Debido a que los indicadores de ajuste fueron muy discretos, se confirmó la invarianza métrica, pero no se pudo aceptar la invarianza escalar.


A pesar de que los datos de invarianza no permitían realizar con suficientes garantías la comparación de puntuaciones en ética, se realizaron pruebas de diferencias de medias para muestras independientes en función del género y el nivel de estudios. La prueba . de Student puso de manifiesto diferencias significativas en la dimensión de “perjudicar a otros” (.=3.71; .<.001; .=0.32) y “hurtar” (.=5.77; .<.001; .=0.48) con un tamaño de efecto medio y puntuaciones menos éticas en hombres. A su vez, los contrastes realizados en función de si los estudiantes eran de universidad o instituto mostraron diferencias significativas en dos de las dimensiones: “engañar” (.=4.27; .<.001; .=0.33) y “perjudicar a terceros” (.=10.52; .<.001; .=0.76), en las que los estudiantes de instituto presentaron puntuaciones menos éticas (ver Tabla 5).
La actuación acorde a las normas y principios establecidos en la sociedad constituye un objetivo central en la formación y desarrollo de las personas. De hecho, conforme van avanzando los estudiantes en su camino por los diferentes niveles educativos se van sentando los fundamentos para futuras actuaciones éticas como futuros profesionales en el mundo laboral, así como en la vida en general. La relevancia de la conducta ética trasciende, por tanto, el ámbito académico, por lo que resulta necesario conocer la predisposición de los estudiantes a llevar a cabo conductas éticas o poco éticas en el transcurso de sus estudios.
La Escala de Ética en Escenarios Educativos (EEEE) constituye en este contexto una herramienta desarrollada en el ámbito español que, con sus dieciocho ítems seleccionados mediante el Análisis Factorial Exploratorio y posteriormente mediante el Análisis Factorial Confirmatorio, permite disponer de una escala con unos índices de fiabilidad y validez de constructo adecuados, así como con el suficiente número de ítems o escenarios para justificar las cuatro dimensiones encontradas (engañar para aprobar, perjudicar a terceros, ocultar información y hurtar). En este sentido, en comparación con otros instrumentos que recurren, por ejemplo, a la ética normativa como el MES en su formulación original (Reidenbach & Robin, 1988), en el presente trabajo se ha abordado la predisposición para realizar conductas éticas específicamente en contextos educativos.
La fiabilidad total de cada subescala se sitúa por encima de 0.7 tomando como referencia el coeficiente omega, punto que se utiliza normalmente como criterio con fines de investigación- especialmente teniendo en cuenta el reducido número de elementos para cada sub-escala. A este respecto, cabe considerarse que el instrumento no deba utilizarse con fines de evaluación para tomar decisiones de selección de estudiantes, excepto, por ejemplo, de cara a la asignación a cursos de formación específicos que les permitan mejorar competencias éticas. El alto grado de correlación observado entre factores, tal y como queda reflejado en la Figura 1, invita a plantear estudios para analizar la posible unidimensionalidad del instrumento, lo que permitiría distintas opciones a la hora de interpretar las puntuaciones del test (una puntuación global o puntuaciones por factor), máxime de cara a su aplicación con fines de intervención. En este sentido, el instrumento permitiría contar con una medida total relativa al nivel ético de un estudiante o diferenciar facetas concretas que permitan distinguir a personas con puntuaciones éticas en unas dimensiones y poco éticas en otras. Estos nuevos análisis se pueden abordar en el futuro a través de la utilización de índices estadísticos de modelo bifactor como el ECV (Explained Common Variance), el PUC (Percentage of Uncontaminated Correlations) y el omega jerárquico (ver, por ejemplo, Domínguez-Lara & Rodríguez, 2017).
Teniendo en cuenta que los análisis relativos a la invarianza no ofrecen buenos resultados, una opción habría sido realizar análisis de invarianza parcial para detectar los ítems no equivalentes entre los grupos, pero entre los procedimientos posibles no hay acuerdo entre los investigadores en los criterios a aplicar cuando no se cumple la invarianza (Milfont & Fischer, 2010).
En futuros estudios se podrá analizar, a este respecto, la estructura del cuestionario con otras muestras, dado que los datos de invarianza no garantizan las comparaciones entre grupos (Milfont & Fischer, 2010). A pesar de las limitaciones de nuestro estudio en ese sentido, estudios previos que han analizado la relación entre género y conducta ética, tales como el trabajo de Borkowski y Ugras (1998), están en la misma línea que el nuestro señalando que las mujeres muestran conductas más éticas que los hombres Si bien no se ha observado consistentemente en investigaciones anteriores, Mudrack y Mason (2013b) señalan que, en caso de observarse, las mujeres tienden a ser más críticas con acciones discutibles que los hombres. De hecho, en un estudio que analizó las conductas éticas y justificaciones de dichas conductas en el ámbito laboral en más de 2700 gerentes se observó que los hombres actuaban, en mayor medida, de forma poco ética (p. ej., evadiendo impuestos), tendiendo, asimismo, a justificar dichas acciones poco éticas (Chen et al., 2016). En lo que a la edad se refiere, y a pesar de que los diferentes estudios realizados al respecto (Loe et al., 2000) no son concluyentes, Borkowski y Ugras (1998) también sugieren que los estudiantes mayores muestran conductas más éticas que los más jóvenes. Estas pautas se pueden deber a que, conforme van avanzando a lo largo de los itinerarios educativos y van cumpliendo años, los estudiantes maduran y sus objetivos están más centrados en el aprendizaje (en lugar de “en aprobar”), lo que puede ir acompañado de una mayor predisposición a llevar a cabo conductas más éticas.
Disponer de un instrumento para evaluar la predisposición de actuación ante situaciones que plantean dilemas éticos a los estudiantes, tomando como referencia situaciones reales que éstos viven, debería permitir no sólo conocer la predisposición a comportarse de determinada forma, sino servir de justificación para poner en marcha programas de intervención que mejoren las competencias éticas de los estudiantes. La finalidad última del diseño de dichas intervenciones, así como de la evaluación de su eficacia, radicaría precisamente en aumentar las conductas éticas de nuestros alumnos para conseguir profesionales más íntegros y una sociedad mejor. Ahora bien, ¿cómo incluir programas de intervención ética en los centros de estudios que vayan más allá de la teoría y los conceptos? A este respecto, entre las metodologías de enseñanza que han resultado ser más eficaces para desarrollar habilidades éticas se ha identificado el aprendizaje activo a través de actividades tales como discusiones de grupo (Bairaktarova & Woodcock, 2016; Miñano et al., 2017). En este sentido, el presente estudio puede servir de base para plantear intervenciones dirigidas específicamente a reducir conductas poco éticas como el engaño para aprobar, perjudicar a terceros, ocultar información y hurtar. Entre dichas actividades se puede abordar, a modo de ejemplo, un re-encuadre de conductas poco éticas, de manera que copiar deje de tener valor y pase a ser una conducta poco ética para todos; la recompensa no estaría, por tanto, en conseguir una nota (meta extrínseca), sino que el aprendizaje adquiriría un carácter intrínseco (Davy et al., 2007). De forma parecida, si los estudiantes justifican ocultar información como estrategia para evitar sanciones, problemas, o reprimendas por parte de los profesores, el reencuadre podría ir dirigido a incrementar su compromiso y sentido de pertenencia con el centro (a través de la realización de actividades concretas; Finelli et al., 2012) o hacia la puesta en marcha por parte de la organización de políticas en las que primara la integridad (Kisamore et al., 2007). También resultaría de interés abordar en futuros estudios las causas para las conductas éticas -y menos éticas- de los estudiantes. Así, cabría incidir en el análisis de variables que influyen de forma diferencial sobre cada una de las conductas identificadas (p. ej., Kara et al., 2016), como pueda serlo la presión del grupo normativo del estudiante para que se oculte información o el conocimiento relativo a la realización de trampas previas por parte de algún miembro de la comunidad estudiantil, así como la relación entre las diferentes conductas éticas y variables tales como la conducta prosocial (Balabanian & Lemos, 2018) o la conducta empática (Auné et al., 2017).
Como limitaciones de este estudio podemos señalar que, si bien la muestra utilizada cumple con los criterios estadísticos requeridos para los análisis realizados, dicha muestra podría ampliarse en investigaciones futuras, incluyendo la recogida de datos en distintos centros educativos y de diferentes niveles, como pueda serlo la formación profesional. Asimismo, hubiera enriquecido el trabajo la posibilidad de relacionar las puntuaciones obtenidas con otros instrumentos que evalúen actuaciones éticas o con conductas reales que sirvieran de criterio. En este sentido, no puede descartarse que se haya producido deseabilidad social al carecer de un contraste con el comportamiento demostrado. También resultaría de interés la realización de estudios longitudinales que permitiesen analizar las posibles mejoras en las puntuaciones éticas en los diferentes niveles educativos, así como, en concreto, en las transiciones entre dichos niveles educativos y la incorporación al mundo laboral. Por último, merece mención aparte que, al no tratarse de una muestra aleatoria, representativa de una población, no se pueden generalizar los resultados.
No obstante, la escala presentada supone un avance destacable al proporcionar un instrumento para evaluar la predisposición de actuación ética ante situaciones propias del entorno que plantean dilemas éticos en estudiantes. En la medida en que se aborden en los títulos universitarios, de forma generalizada, las competencias éticas, éstas tomarán mayor protagonismo y será más probable que se evalúen y se intervenga sobre ellas.





