RESUMEN: El crecimiento exponencial de la información en la web ha generado un desafío en la organización, gestión y búsqueda de recursos. Generalmente se debe a que, en muchos casos, los recursos publicados en la web no poseen la estructura adecuada o no están descritos de forma apropiada imposibilitando su relación con otros de su mismo tipo, siendo crítico cuándo se hacen búsquedas relacionadas con recursos educativos en las que prima la urgencia y sobre todo la necesidad de contar con información clara y confiable de forma que sean utilizados por el usuario que lanza la búsqueda. Este trabajo aborda la importancia de establecer una guía de recomendaciones para gestionar los recursos educativos en línea, promoviendo la interoperabilidad y facilitando la búsqueda con el objetivo de optimizar la experiencia tanto de los creadores como de los consumidores de contenido. Estas recomendaciones fueron el resultado de la definición de dominio específico sobre la publicación y recuperación de recursos educativos. Para su construcción se realizaron tres iteraciones aplicando el método de patrón de investigación iterativo. En consecuencia, al realizar los pasos de esta guía se obtuvieron beneficios como mejor interpretación y comprensión de los recursos por parte de la máquina, reutilización e interoperabilidad, enlazabilidad y acceso.
Palabras clave: Datos abiertos vinculados, insignias, recomendaciones para publicación y recuperación de recursos, recursos educativos abiertos.
ABSTRACT: The exponential growth of information on the web poses a challenge regarding the organization, management, and search for resources. In many cases, the resources published on the web do not have the correct structure or are not described appropriately, thus making it difficult to link them to other resources of the same type. This is critical when searching for educational resources because sometimes urgency prevails and, above all, clear and reliable information is needed so that it can be used by the user who launches the search. This work addresses the need to establish a guide to manage online educational resources, promote interoperability, and ease the search, as well as to optimize the experience of both content creators and consumers. These recommendations resulted from defining a specific domain for the publication and recovery of educational resources. Three iterations were carried out for its construction, applying the Iterative Research Pattern method. Consequently, following the steps in the guide yielded benefits such as better interpretation and understanding of resources by machine, reuse and interoperability, linkability, and access.
Keywords: Insignia, open educational resources, open linked data, retrieval and publication of resources.
Artículo
RECOMENDACIONES PARA LA PUBLICACIÓN Y RECUPERACIÓN DE RECURSOS EDUCATIVOS EN LÍNEA. RESULTADOS DE UNA ONTOLOGÍA DE DOMINIO
Recommendations for Publishing and Retrieving Online Educational Resources: Results of a Domain Ontology
Received: 25 August 2024
Accepted: 26 November 2024
La rápida evolución de las Tecnologías de la Información (TI) y su masificación ha influenciado el desarrollo de la sociedad y sobre todo su funcionamiento [1], como se puede apreciar en diferentes áreas como finanzas políticas, entretenimiento y, especialmente, en el sector educativo, dado que la combinación de estas tecnologías en los procesos pedagógicos ha propiciado transformaciones radicales en la forma de trabajo y en la manera en que se aprende [2]. Es allí donde surgen los recursos educativos, específicamente los recursos abiertos, es decir, disponibles para ser usados sin costo.
En 2019, la Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura (Unesco) [3] definió los recursos educativos abiertos como: "materiales de aprendizaje, enseñanza e investigación en cualquier formato y soporte que existen en el dominio público o están bajo derechos de autor y fueron liberados bajo una licencia abierta, que permiten su acceso sin costo, su reutilización, reorientación, adaptación y redistribución por parte de tercero".
En el contexto colombiano, los recursos educativos abiertos se encuentran desde dos enfoques [4]: 1) educativo: cursos virtuales, aplicaciones para educación (programas o software) y objetos de aprendizaje, y 2) digital: textuales, sonoros, visuales, audiovisuales y multimediales.
Lo anterior evidencia el crecimiento de los recursos educativos tanto en cantidad como en variedad [5], creando interacciones de personas en diferentes espacios digitales [6], hasta el punto en que, en muchas ocasiones, se dificulta tener acceso a los insumos apropiados mediante una consulta en la web [7], encontrando resultados de todo tipo, calidad y provenientes de diversas fuentes.
Dado ese aumento en el volumen de recursos educativos en la web y su velocidad de publicación, no existe uniformidad en la forma de publicación y no se usa completamente el potencial que tiene este medio para interconectar los recursos entre sí y descubrirlos fácilmente [6], es decir, que los usuarios los puedan recuperar con facilidad. En consecuencia, es todo un desafío representar, describir, publicar y encontrar los recursos en la web tanto para los publicadores como para los usuarios consumidores de la información.
En este contexto, los datos abiertos vinculados (Linked Open Data - LOD) surgen para promover la interoperabilidad y la integración de grandes colecciones de datos en la web [8], creando enlaces para que una máquina internamente logre explorar datos vinculados dentro de una red y ayude a encontrar otros relacionados [9]. De modo similar, las ontologías son usadas como una herramienta para la representación de conocimiento de una forma sencilla para el ser humano y para una máquina, permitiendo contener en su estructura información conceptual sobre un dominio dado, ya que define términos y relaciones básicas de este, lo que puede llegar a mejorar la precisión en la recuperación de la información [7]. En la actualidad, se encuentran varios referentes para publicar recursos educativos en línea, según lo establecido para los LOD [9], así como esfuerzos para representar el conocimiento interno de la información y obtener un resultado óptimo en su búsqueda.
Por ejemplo, Blerina Spahiu et. al.[8] proponen un enfoque en el que desarrollan un modelo de similitud y descubrimiento de vínculos para encontrar características o entidades semejantes en diferentes conjuntos de datos. Arciniega et al.[10], presentan un modelo ontológico basado en los principios de los LOD para que la información sea debidamente publicada y compartida, mostrando cómo una ontología permite estudiar las características de los datos que pueden existir en algún dominio y su representación mediante una estructura o modelo. En Bulygin [11] se expone una forma de calificar las ontologías por medio de medidas de funciones de similitud semántica y léxica para conseguir un modelo híbrido eficiente que dispone la información propicia de acuerdo con las búsquedas. En Otero-Cano et al.[12] se muestra una ontología de dominio específico para la recuperación y publicación de recursos educativos en la web desde dos perspectivas diferentes: una académica y una industrial, en donde se definen los conceptos, las relaciones y los atributos que fundamentan la información, incluidos los metadatos a tener en cuenta al momento de hacer una publicación de un recurso educativo en aras de facilitar su recuperación. Los metadatos corresponden a la información subyacente que debe contener un recurso para su identificación en la web [4].
Teniendo en cuenta lo anterior, es importante brindar orientación a publicadores y consumidores sobre la forma en que son gestionados los recursos para disponerlos en la web, promoviendo la reutilización e interoperabilidad de los datos para facilitar los resultados. Por tanto, esta investigación sugiere unas recomendaciones enfocadas en el área educativa para la publicación y recuperación de recursos en la web, soportadas en el conocimiento estructurado en Otero-Cano et al.[12].
Las recomendaciones se fundamentan en una serie de pasos guía enfocados en obtener beneficios, como mejor interpretación y comprensión de los recursos por parte de la máquina, reutilización e interoperabilidad, enlazabilidad y acceso.
Este trabajo se estructura en cinco secciones, incluyendo la introducción. La segunda sección (metodología) presenta el estado de arte y las iteraciones realizadas para la definición y evaluación de las recomendaciones propuestas. En la tercera (resultados) se proponen las recomendaciones y su evaluación. Finalmente, en las dos últimas (discusión y conclusiones) se mencionan algunas conclusiones y potenciales trabajos futuros.
Esta sección describe las iteraciones realizadas para proponer las recomendaciones para la publicación y recuperación de recursos educativos y evaluar su utilidad. Las iteraciones aplicaron el patrón de investigación iterativo [13], que se enfoca en múltiples y cortos ciclos con cuatro pasos básicos, como se aprecia en la Figura 1[14]: observación del problema, identificación del problema, desarrollo tecnológico de la solución y pruebas de la solución.

En esta iteración se realizó una revisión del estado del arte sobre la recuperación y publicación de recursos educativos donde se obtuvo un esqueleto de las posibles recomendaciones para estas. En la Figura 2 se presentan las actividades y resultados de cada fase.

Algunos de los hallazgos relevantes identificados en la búsqueda fueron el de Bazouzil et al.[15], del año 2024, quienes propusieron un método para representar recursos educativos basado en anotación de documentos y LOD, obteniendo buenos resultados en clasificación y en la representación visual. En 2022, Herrera-Cubides et al.[16], definieron un conjunto de elementos mejorado e interoperable para enriquecer los datos de los recursos educativos abiertos. En 2021, Ambite et al.[17] desarrollaron el portal Big Data to Knowledge (BD2K) utilizando técnicas de aprendizaje automático, recuperación de información y procesamiento de lenguaje natural para recopilar y describir automáticamente los recursos en la web para aprender ciencia de datos. En 2020, Ali y Warraich [18] señalaron que los LOD son usados para la exploración y publicación de datos en diferentes dominios, por lo que representan un gran beneficio en el sector educativo al ir más allá de exponer los recursos en la web como documentos HTTP, realizando enlaces entre los recursos o explorando y utilizando fuentes de datos más relevantes [19]. En 2019, Anrui et al.[20] indicaron que la ontología de dominio de Apple Orchard logra una taza de recuperación de palabras clave más alta que el algoritmo de recuperación de palabras tradicional. En 2018, Pereira et al.[21] analizaron las propuestas de trabajos que incorporaron linked data en la educación e identificaron las herramientas para mapear, almacenar y extraer datos como RDF, SPARQL y SILK. Por último, en 2016, Imran y Kastrati [22] utilizaron la ontología de dominio para la creación de un enfoque automatizado para la clasificación de documentos, permitiendo que estos se agruparan en categorías.
En la revisión realizada se encontró que las técnicas más usadas para el tema son las que están relacionadas con ontologías, sistemas de recuperación de información, linked data, motores de búsqueda y web semántica en general. Se evidenció que su uso en conjunto optimiza la publicación y recuperación de los recursos educativos. Además, que existe escasez de investigaciones que traten de los temas de publicación y recuperación en conjunto. Por tanto, esta investigación aporta al ofrecer recomendaciones para los dos temas, dado que son complementos para desarrollar sistemas que sí involucren ambas partes.
En esta iteración se estructuró y organizó el conocimiento mediante una ontología de dominio, siguiendo los pasos de la metodología de Noy y McGuinnes [23]. Esta guía a los usuarios en la creación de recursos que cumplan con los estándares de calidad y sean fácilmente localizables en la web a través de un sistema de insignias (comprensible, accesible, interoperable, reutilizable y vinculado). La finalidad es aplicar todos los pasos recomendados para que el recurso contenga todas las insignias [12]. La Figura 3 presenta los pasos seguidos para la construcción de esta ontología y la Figura 4[12] da cuenta de esta última.


La ontología ONTOGuide es implementada en Protégé [24] y las preguntas de competencia son validadas en SPARQL, obteniendo las respuestas deseadas tanto a nivel de estructura como de datos [12].
En primera instancia, se obtuvieron la definición y guía final de las recomendaciones para la publicación y recuperación de recursos educativos, basadas en la ontología de dominio ONTOGuide [12], con el esquema que se presenta en la Tabla 1.

En segunda instancia, se diseñó una encuesta de satisfacción para evaluar la utilidad del conjunto de recomendaciones propuestas, que tuvo en cuenta tres criterios fundamentales que se presentan en Walters [29] para el diseño de encuestas, muestreo y pruebas: 1) validez, dado que se define claramente el objetivo de evaluación de satisfacción y, parte de ello, es elaborar preguntas de investigación que cumplan con ese fin. 2) Confiabilidad, que se mide a partir de las preguntas de investigación para que la guía sea clara y concisa para verificar que, si esta encuesta se aplica a otro grupo de usuarios, los resultados serían similares. 3) Generazabilidad, es decir, que tanto la encuesta como las mismas recomendaciones puedan aplicarse en un contexto más amplio, por ejemplo, a una muestra más grande.
En tercera instancia, se ejecutaron las pruebas para la validación y, finalmente, se analizaron los resultados obtenidos de las pruebas mediante la aplicación de un modelo de análisis de lenguaje natural para entender la polaridad descrita en las respuestas de la encuesta de satisfacción. Las pruebas tuvieron como objetivo evaluar la utilidad de las recomendaciones propuestas.
Para lo anterior, se diseñó una encuesta que permitió determinar la polaridad y subjetividad de sus respuestas [25] partiendo del análisis de sus resultados. Esta fue aplicada a un grupo de usuarios del contexto educativo del Cauca, Colombia.
La población evaluada se dividió de la siguiente manera:
Grupo A: cinco usuarios con profesiones afines a las ingenierías de Sistemas y Electrónica con fuertes conocimientos en la gestión de información web.
Grupo B: cinco usuarios docentes de instituciones educativas del Cauca y un experto temático del SENA con conocimientos básicos en ofimática.
Cada grupo respondió a la encuesta basado en las siguientes dos pruebas:
La Tabla 2 presenta las preguntas realizadas en la encuesta de satisfacción.

En esta sección, se describen en forma de pasos las recomendaciones propuestas para la publicación y recuperación de recursos educativos, su evaluación y análisis de resultados.
Cada uno de los pasos son importantes para obtener un recurso interoperable e integrado en la web de los datos. Estos se muestran en orden, de tal forma que, al cumplirlos a cabalidad, un recurso obtenga las insignias ya mencionadas: comprensible, accesible, interoperable, reusable y vinculado en la web. Los pasos expuestos en la guía se presentan desde la Tabla 3 hasta la 12.










Al aplicar la encuesta de satisfacción, los resultados obtenidos fueron analizados mediante la aplicación de un modelo proporcionado por la librería de paralleldots[26] que ayuda a determinar la polaridad de cada una de las respuestas.
A nivel general, el promedio de los resultados de toda la encuesta obtuvo una polaridad neutra con un 42.95 %, seguido a la positiva con un 32 % y, finalmente, una negativa con 25.05 %. La Tabla 13 presenta la polaridad por cada una de las preguntas y un resumen total. En esta se observa que, en los resultados individuales por pregunta, la diferencia entre positivo a neutral es menor que la de negativo a neutral.

Luego, se analizaron los resultados por tipo de prueba observados en la Figura 5, donde se identificó que, en ambos casos, tienen una polaridad neutra por encima del 40 %, después se encuentra la polaridad positiva por encima del 30 % y, finalmente, la negativa por debajo del 25.5 %. Aquí se puede notar que entre la prueba P1 (entendimiento general de las recomendaciones) y la P2 (aplicación de la guía) se suma casi un 1.5 % a la polaridad neutral para P2 y se resta un 1.32 % a la positiva. Esto se debe a que la segunda prueba fue más práctica, porque realizaron comprensión lectora, diseñaron una consulta de búsqueda y obtuvieron el resultado. En este proceso, surgieron varias dudas por parte de los usuarios y el resultado es consecuente con ello.

Como resultado se obtuvo una guía para la publicación y recuperación de recursos educativos en la web de los datos, que está presentada mediante pasos de fácil comprensión y aplicación. Esta guía está diseñada principalmente para personas que gestionan la información, científicos o profesionales interesados en compartir y recuperar datos de investigación en la web.
A su vez, permite fomentar la interoperabilidad, reutilización y vinculación entre los recursos, mejorando la eficiencia a la hora de encontrar uno apropiado para una búsqueda. Cabe aclarar que la no ejecución de los pasos descritos no interfiere en la publicación o recuperación de un recurso, pero el realizarlos mejorará la recuperación de cada uno de ellos. Por lo anterior, para el correcto uso de la guía se recomienda realizar más de un paso, dado que ninguno de ellos cuenta con todas las insignias, por tanto, para obtener un buen resultado, se deben involucrar más de dos. En la Figura 6 se muestra con cuántas insignias cuenta cada paso.

Hacer uso de las recomendaciones presentadas es muy importante en la época actual, dado que el volumen de crecimiento de la información en la web, recursos educativos con información valiosa pueden perderse y quizá no puedan ser recuperados por los usuarios. Sumado a esto, emplear las recomendaciones dentro de plataformas educativas de e-learning o MOOCS permitirá que la gestión de su documentación sea más limpia y estructurada, de tal forma que, al compartir la información ir a través de la web, sus recursos serán encontrados con mayor facilidad.
Los resultados obtenidos mediante la aplicación de una encuesta de satisfacción permiten observar que guías como estas son muy útiles y pueden ser aplicadas en diferentes entornos de trabajo. Adicionalmente, se logró percibir que los usuarios más interesados por entender y aplicar estas recomendaciones fueron los docentes y el experto temático, dado que para ellos fue un tema nuevo y necesario para compartir de manera efectiva sus materiales educativos con sus estudiantes.
La guía de recomendaciones para la publicación y recuperación de recursos educativos se puede encontrar en el enlace: Recomendaciones_publicacion_ _para_docentes.pdf.
Como trabajo futuro, se propone la masificación de la guía realizando una iteración más de patrón iterativo, donde se extiendan las pruebas para obtener una validación de un grupo focal y una de expertos con el fin de conseguir mayor retroalimentación y hacer los ajustes correspondientes.
El primer autor agradece a la Universidad Pontificia Javeriana y al Ministerio de Ciencia de Colombia. El Segundo autor reconoce y agradece el apoyo del Grupo de I+D en Tecnologías de la Información de la Universidad del Cauca


















