Resumen: La investigación presenta un enfoque basado en analítica de datos y mecanismos de aprendizaje automático integrado a una de las plataformas digitales de aprendizaje más usadas en el mundo (open EDX) como aporte al mejoramiento de los procesos de aprendizaje en estudiantes de educación media de municipios de Colombia. Metodológicamente con base en Creswell y Plano Clark (2007) y Clements et al. (2017), se construyó un sistema que posibilita la recomendación de contenidos educativos adecuados a las características individuales de estudiantes teniendo en cuenta las limitaciones en el uso y apropiación social de las tecnologías en las instituciones educativas, se realizaron entrevistas con docentes y grupos focales con estudiantes de grados 10 y 11 de media vocacional; como resultado se generó una propuesta de arquitectura funcional que permite la generación de recomendaciones iniciales de contenidos administrados según el desempeño de los estudiantes y las características propias del territorio.
Palabras clave:Sistema de recomendaciónSistema de recomendación, plataforma de aprendizaje plataforma de aprendizaje, modelo de datos modelo de datos, aprendizaje automático aprendizaje automático, educación educación.
Abstract: The research presents an approach based on data analytics and automatic learning mechanisms integrated into one of the most widely used digital learning platforms in the world (open EDX) as a contribution to the improvement of learning processes in middle school students in municipalities of Colombia. Methodologically, according to Creswell y Plano Clark (2007), and Clements et al. (2017) a system was created to recommend educational contents adapted to the individual characteristics of students considering the limitations in the use of technologies in educational institutions; we developed interviews with teachers and focus groups with students of 10º and 11º grade; as a result, a functional architecture proposal was generated that allows the generation of initial recommendations of contents managed according to the students' performance and the characteristics of the territory.
Keywords: Recommendation system, learning platform, data model, machine learning, education.
Artículos
Tic para la educación: sistema adaptativo basado en mecanismos de aprendizaje automático para la apropiación de tecnologías en estudiantes de educación media
ICT for education: adaptive system based on automatic learning mechanisms for the use of technologies in students
Recepción: 04 Marzo 2019
Aprobación: 10 Junio 2019
Las tecnologías de información y comunicaciones (TIC) han propiciado el acceso a tipos de información con gran cantidad de información generada a partir de internet o de centros de datos específicos, siendo esta información diversa por los diferentes dispositivos por los cuales se puede acceder (Tablet, Smartphone, computadores, ebooks, smartwatches) (Ramírez-Montoya y García-Peñalvo, 2017). Esto ha permitido que el sector educativo inicie un proceso de transformación digital dejando a un lado sus procesos tradicionales de enseñanza y aprendizaje, superando limitaciones y obstáculos que impedían el acceso como la limitante geográfica o los tiempos del esquema tradicional educativo (Avello Martínez y Duart, 2016). De acuerdo con esto, las tendencias en el sector educativo como plataformas en línea, cursos abiertos masivos (MOOC), gestores de contenidos de aprendizaje y el e-learning constituyen herramientas utilizadas hoy en día para mejorar calidad en la educación.
Según el Foro “Invertir en jóvenes como condición para una paz duradera en Colombia” (UNFPA Colombia, 2016) realizado por el Fondo de Población de las Naciones Unidas en Julio de 2016, en Colombia, cerca de 13 millones de personas se encuentran en el rango 14 - 28 años, constituyendo el 27% de la población colombiana. El gasto total (nacional y territorial) en adolescencia y juventud equivale al 2.9% del PIB. El sector que destina mayores recursos específicamente para jóvenes es educación (40,8% del presupuesto nacional). A pesar de que la educación es el sector donde más se invierte, aún subsisten grandes brechas en el acceso y la calidad de la educación entre los jóvenes. Aquellos que viven en zonas rurales acceden un 24% menos a educación secundaria y media que los de zonas urbanas. 13,5% de estudiantes no terminan la primaria y 30,9% de adolescentes no terminan la secundaria. 13% de los adolescentes que terminan la secundaria no continúan en grado 10° y el 11,3% de quienes presentan pruebas SABER 11° no ingresan a educación superior (Departamento Nacional de Planeación, 2014).
Estudiar los referentes teóricos y pragmáticos alrededor de la inclusión de herramientas tecnológicas en el aula de clase.
Proponer una plataforma que coadyuve a la gestión de contenidos a partir de las necesidades reales de los niños, niñas y jóvenes. Lo anterior a partir de un ejercicio piloto a desarrollar en el departamento del Cauca.
El proceso inició con una revisión literaria alrededor de los procesos de incorporación de tecnologías de la información y las comunicaciones –TIC- en el aula de clase, así como de las dinámicas y las posibilidades de fomento al proceso de aprendizaje en los niños desde las instituciones educativas. Se revisaron, además, experiencias internacionales en estos temas a fin de contar con referentes teóricos y empíricos para avanzar en la estructuración de una propuesta sustentada desde lo técnico y pertinente desde un enfoque territorial.
Más allá de prepararlos para un mercado laboral cada vez más imbricado con la tecnología, la incorporación de tecnología permite a los niños desarrollar competencias de pensamiento lógico, resolución de problemas complejos, recursividad y coherencia narrativa. La propuesta que se realiza, posibilita la gestión de contenidos en ambientes reales y conectados con el entorno de los estudiantes a fin de optimizar y facilitar el acceso a contenidos de calidad y pertinentes.
Para avanzar en los objetivos de la investigación, se dividió la revisión literaria en tres componentes que posibilitan el análisis de referentes. En primera instancia se revisan autores cuya producción intelectual de relevancia se concentre en las relaciones estudiante-educador y el establecimiento de estrategias de monitoreo.
En segundo lugar, se abordan elementos concernientes a la evaluación de técnicas, algoritmos y modelos para realizar recomendaciones en el proceso de enseñanza y aprendizaje. Finalmente se analizan los Sistemas de recomendación que trabajen con la plataforma de Open EDX.
Relación estudiante – educador: Usan técnicas de minería de datos con el fin de analizar patrones entre el uso de la tecnología y las experiencias de aprendizaje de los estudiantes, determinando de esa forma la ruta de aprendizaje de cada docente (Howard et al., 2016). Otros autores proponen una herramienta que es capaz de relacionar a los estudiantes con supervisores teniendo en cuenta a la experiencia, carga máxima de trabajo e interés de este último con respecto a las preferencias del estudiante (Sanchez-anguix et al., 2019).
En los trabajos de autores como Pereira et al. (2018) y Birjali et al. (2018) extraen el perfil y preferencias de los estudiantes a través de redes sociales, con base en esta información realizan recomendaciones. Por otro lado, autores como Tahmasebi et al., (2018) obtienen información de los sitios web OCW visitados, de ahí extraen metadatos que relacionan con los estilos de aprendizaje dados por la teoría de Felder y Silverman (1988) para realizar recomendaciones. Los autores Bradac y Walek (2017), Udupi et al., (2016) y Cuong et al (2018) integran modelos de lógica difusa y web semántica para hacer más efectivo la adaptación de contenido a plataformas LMS. Los trabajos de Nye (2015) y Klašnja-Milićević et al. (2018) se enfocan en sistemas de recomendación basados en las necesidades y nivel de conocimiento de los estudiantes.
Acosta et al., (2018) elabora un modelo de data warehouse sobre el cual implementan técnicas de minería de datos para determinar el perfil de los estudiantes de acuerdo a su desempeño académico, factores socioeconómicos, demográficos y actitudinales. Por otro lado, para determinar el perfil de un estudiante, Duque Méndez et al., (2018) implementan un sistema de recomendación basado en contenido donde a través del test de CHAEA obtienen el estilo de aprendizaje del estudiante, de esa forma determinan y recomiendan actividades educativas adaptadas a su perfil.
Evaluación de técnicas, algoritmos y modelos: Li et al., (2018) evalúan el desempeño del árbol de Naïve Bayes con el fin de determinar el estilo de aprendizaje de los estudiantes. Por otra parte, Núñez-Valdez et al., (2018) realizan una evaluación de doce (12) algoritmos populares dentro del aprendizaje automático: árboles de clasificación y regresión, redes neuronales artificiales y algoritmos para determinar la similitud, con el fin de construir un sistema de recomendación de libros electrónicos concebido como una tarea de regresión.
Por otra parte, Guanín et al., (2019) evalúan catorce (14) algoritmos de aprendizaje supervisado divididos en tres categorías: Crisp Rule Learning, Decision Trees y Evolutionary crisp rule learning, donde se obtiene un conjunto de reglas para la toma de decisiones y estrategias focalizadas en grupos de interés. Trifa et al., (2019) proponen evaluar el proceso de personalización de una plataforma de e-learning que esté acorde con el perfil de cada estudiante mediante un sistema referencial inteligente basado en agentes, específicamente en el agente Mod-Knowledge.
Sistemas de recomendación utilizando Open EDX: Los autores desarrollan un sistema de recomendación de recursos educativos para la plataforma EDX (Collado Sánchez, 2014), para este diseñan un algoritmo de filtrado colaborativo basado en puntuaciones de problemas obtenidos a través de EDX por cada uno de los compañeros de un curso; el algoritmo busca a los compañeros con patrones similares, es decir, los que tienen más problemas aprobados, luego se realiza las predicciones en función de la popularidad de dichos problemas. Por otra parte, Anacona et al., (2017) presentan una propuesta arquitectónica para descubrir patrones de navegación de los estudiantes dentro de los MOOC1, que soporta la plataforma EDX, mediante el modelo de espacio vectorial y el algoritmo LexRank con Umbral. Finalmente, Gope y Kumar Jain, (2018) proponen un sistema de recomendación basado en los requerimientos y estilos de aprendizaje, estos últimos son una versión adaptada de la teoría de Felder Silverman y funcionan exclusivamente para los MOOCs de edx.
La investigación partió de un enfoque metodológico mixto, que involucra el uso de herramientas y técnicas cuantitativas y cualitativas.
Se realizó una recolección y análisis de datos que, combinados, permiten llegar a un mejor entendimiento del problema de investigación (Creswell y Plano Clark, 2007). Esta aproximación es ampliamente utilizada en las ciencias sociales (Pereira Perez, 2011) y muy útil para la investigación en educación pues posibilita una comprensión profunda de los fenómenos en observación (Sabino, 2003). Las entrevistas de tipo cualitativo se realizaron entre septiembre de 2018 y enero de 2019 a 10 expertos regionales. Usando técnicas de muestreo dirigido o intencional se seleccionaron las unidades elementales de la población según el juicio de los investigadores, dado que las unidades seleccionadas gozan de representatividad (Hernandez Sampieri et al., 2010) en virtud de la experiencia de los entrevistados como docentes (5 personas) durante más de 10 años, y conocedores de política pública (5 personas) dado que han sido Secretarios Municipales de Educación en los municipios de Popayán, Argelia, El Tambo, o que han desarrollado programas de incorporación de TIC en el aula de clase con la Corporación CreaTIC.
La propuesta arquitectónica contiene entre sus componentes la plataforma Open EDX, de ahora en adelante EDX, como plataforma encargada de administrar los estudiantes y contenidos educativos a los que pueden acceder. En la Figura 1, se puede observar su estructura.
En ese sentido, en la Figura 2 se presenta la arquitectura propuesta para la implementación de una plataforma adaptativa basada en mecanismos de aprendizaje automático haciendo uso de edx.
Como se puede observar en la Figura 2, la arquitectura consta de 6 componentes: Plataforma EDX, servidor de base de datos, módulos de análisis, procesamiento, recomendación y visualización.
En ese sentido, un usuario ingresa a la plataforma EDX donde puede visualizar la información de los cursos y formarse en alguno de ellos. Toda la información proporcionada por el usuario: su registro, inscripción en cursos, y el avance de aprendizaje en cada uno de ellos es almacenado en las bases de datos que se encuentran dentro del servidor de bases de datos. Finalmente, los datos almacenados son analizados y procesados por cada uno de los siguientes módulos para finalmente obtener una recomendación apropiada para el usuario y que este pueda visualizarla. Ahora bien, el flujo del funcionamiento de toda la plataforma se visualiza en la Figura 3, seguido a esto se explica cada uno de los módulos en más detalle.
Ahora bien, el módulo de la plataforma EDX y el servidor de base de datos hacen parte de la arquitectura propia de EDX por lo que no se ahondará en detalles en estos.
Es el medio por el cuál un usuario es capaz de visualizar la información de los cursos educativos y las recomendaciones realizadas por el sistema.
La información tanto de cursos como la de los usuarios de EDX es almacenada en dos gestores de bases de datos: MySQL y MongoDB.
modulestore: Colección de la base de datos edxapp de MongoDB.
student_courseenrollment: Tabla de la base de datos edxapp de MySQL.
courseware_studentmodule: Tabla de la base de datos edxapp de MySQL.
el proceso de ETL (Extracción, transformación y carga) para los datos y posteriormente es realizada una técnica de preparación de los datos para la generación de una vista minable que pueda ser utilizada por el modelo definido generando resultados mostrados por el módulo de visualización para toma de decisiones.
Extracción: Conectarse a una fuente de datos, seleccionar y leer los datos relevantes.
Transformación: Hacer operaciones sobre los datos.
Carga: Guardar el resultado en un destino.
Una vez el componente de procesamiento envía los datos transformados, el módulo de recomendación los recibe para conformar un conjunto de datos, llamado dataframe, que serán analizados por un algoritmo de aprendizaje automático y así poder entregar las recomendaciones correspondientes.
Después de obtener los datos y conformar el dataframe, se crea adicional un conjunto de datos llamados trainset que será el conjunto de datos utilizado para entrenar el modelo de recomendación y hacerlo cada vez más preciso. Para ello se utiliza la técnica llamada factorización de matrices (Galarza Hernández, 2017), la cual se realizó implementando el algoritmo SVD (Descomposición en valores singulares).
Finalmente se aplica un proceso de validación cruzada o cross validation para mejorar los parámetros del algoritmo de predicción SVD y obtener recomendaciones más óptimas.
El algoritmo SVD y cross validation fueron implementados a través de las librerías surprise (Surprise documentation, 2015) y scikit-learn (scikit-learn documentation, 2018) para python.
En ese sentido, el modelo de recomendación desarrollado se presenta en la Figura 4.
Para efectos de pruebas, se crea un proyecto utilizando el lenguaje de programación javascript, donde se puede observar las recomendaciones. Por lo tanto, se obtiene la información de los usuarios y cursos de la base de datos a través de un api que realiza la conexión a estas; luego, dicha api genera una URL por la cual la interfaz de javascript consulta las predicciones de acuerdo al usuario registrado, lo anterior se realiza mediante el protocolo http.
Finalmente, se crean 2 usuarios y 3 cursos de pruebas en la plataforma EDX. Uno de los usuarios es estudiante de último semestre de ingeniería de sistemas de la Universidad del Cauca, el segundo es ingeniera en electrónica y telecomunicaciones de la misma universidad. Cada uno de ellos realizó el proceso completo: entrar a la plataforma, registrarse, luego mirar los cursos e inscribirse en cada uno de ellos y finalmente realizar un avance en cada uno, de los cuales se tomó registro para entender de qué forma y en qué lugar la plataforma almacenaba la información.
Al ejecutar el modelo de recomendación con los datos obtenidos de los usuarios, se tiene como resultado una precisión de 89%, una media de 1.18 y una desviación estándar de 0.36.
De acuerdo a los resultados obtenidos en el modelo de recomendación de la arquitectura propuesta, este presenta un error absoluto medio de 0.8198, lo que quiere decir que el 81,98% de las recomendaciones fueron útiles, lo que indica que el modelo implementado es prometedor.
Los expertos regionales en el ámbito TIC y educación manifiestan que las aplicaciones disponibles en la Web y los AppStore conllevan de manera ineluctable nuevos cambios sociales propios de la globalización, ciertos docentes se sienten inmigrantes digitales y enfrentan el desafío de introducirse en el entorno digital en el cual los estudiantes ya están inmersos; en la mayoría de los casos, los docentes son receptivos frente al uso de estas tecnologías siempre y cuando sean involucrados en los procesos de apropiación y encuentren los mecanismos a través de los cuales sus contenidos y metodologías se articulen con el uso de nuevas tecnologías. Si bien es inevitable que el uso de contenidos digitales genere cambios en los procesos actuales, en la medida en que el uso de plataformas y contenidos posibilite la participación activa del docente su integración tendrá un mayor nivel de efectividad.
Existe consenso en el ámbito literario alrededor de la necesidad de descubrir en los estudiantes los intereses y motivaciones intrínsecas para lograr un aprendizaje significativo; en esta vía se aumenta el deseo de aprender y se incrementan los niveles de eficacia que son materia de análisis y promoción por parte de la política pública. Una revisión de las plataformas y contenidos disponibles de manera gratuita evidencia la existencia de formas interactivas y didácticas de enseñar que atraen la atención de estudiantes mas no garantizan continuidad en el proceso.
La plataforma Open EDX es una de las más utilizadas para enseñar y aprender de forma virtual, es una plataforma de código abierto que puede ser utilizada en cualquier parte del mundo. En ese sentido EDX, es capaz de almacenar gran cantidad de información correspondientes a estudiantes y educadores, es así como se hace una herramienta clave en el momento de analizar datos para contribuir en la mejora de un sistema educativo virtual, con dichos datos es posible reconocer las necesidades de los estudiantes, sus gustos y de esa forma realizar predicciones que lo impulsen a potenciar sus capacidades, de la misma forma con los educadores, al conocer las necesidades de sus estudiantes tomará acciones y decisiones correctas acerca de su metodología de enseñanza. De esa manera, la propuesta de un sistema adaptativo basado en mecanismos de aprendizaje automático abre las puertas para seguir mejorando el entorno e-learning. Queda como trabajo futuro mejorar el modelo de recomendación y adaptar una aplicación dentro de la plataforma EDX para que sea de más fácil acceso a los estudiantes poder visualizar sus recomendaciones.
En la educación, la influencia tecnológica ha cambiado el paradigma de la enseñanza comprometiendo a docentes diversificar sus prácticas y replantear procesos didácticos en función de las tecnologías de la información y comunicaciones de manera que sean más efectivos y eficientes. Pese a esto, aún se encuentran limitaciones en los mecanismos para proporcionar los recursos educativos. Los estudiantes reciben información que no va acorde con sus características individuales, estilos de aprendizaje y preferencias; además que no se tiene en cuenta los recursos tecnológicos disponibles en su entorno, tales como un computador, Tablet, Smartphone, Smart TV, dispositivos para desarrollar proyectos IoT (internet de las cosas) o aprender programación, entre otros, evidenciando la necesidad de contar con un sistema, plataforma y/o aplicación que facilite recursos educativos, aprendiendo de la experiencia de los estudiantes para tomar decisiones más acordes con su perfil de aprendizaje.
Recientes estudios han demostrado la aplicación de mecanismos de aprendizaje automático para la identificación y recomendación de contenidos a usuarios en diferentes contextos, siendo usados para construir sistemas que mejoren en función de la experiencia lo que los lleva a tomar mejores decisiones e identificando apropiadamente la información o contenidos que se presentan a cada usuario. En el ámbito del territorio caucano, el modelo propuesto presenta múltiples aplicaciones en virtud de sus posibilidades de mejoramiento de la calidad en la educación.
Actualmente, son múltiples las aplicaciones disponibles para el fomento de la educación y las TIC en ámbitos como matemáticas, ciencias, lenguaje, manejo de idiomas, entre otras. Sin embargo, pocas son las herramientas que personalicen u orientes sus esfuerzos hacia el mejoramiento de los estudiantes en virtud de su desempeño. Si bien algunas plataformas han mostrado su eficacia en términos de seguimiento a los estudiantes, disponibilidad de contenidos, facilidad de acceso y amplia oferta recursos transmedia, no se han detectado casos atemperados a la realidad latinoamericana que permitan un seguimiento a los estudiantes en términos de su desempeño y que logre dinamizar la plataforma poniéndola al servicio real de los estudiantes. Si se analiza este elemento, la solución tecnológica termina por simular el trabajo de un docente que en la práctica adecua sus contenidos, metodologías y enfoque de trabajo a las realidades de cada contexto y, para el caso de docente sobresalientes, a la particularidad de cada estudiante.
La realidad en el ámbito colombiano y latinoamericano no es diferente. Este tipo de soluciones tecnológicas posibilita el acceso y pertinencia de los contenidos educativos activando un sistema de recomendaciones que se nutre a partir de su uso. Si bien la labor del docente seguirá siendo irremplazable por varias décadas, la tecnología comienza a transformar los mecanismos con los cuales se aprende, permitiendo a los estudiantes acceder a contenidos atemperados a sus capacidades, evitando frustraciones que resultan catastróficas y socavan las posibilidades de crecimiento y desarrollo por parte de los estudiantes.