Resumen: La ciencia abierta está conformada por un conjunto de principios, factores y actores con el propósito de ampliar el acceso, reproducibilidad y gestión de datos y resultados de investigación financiados con fondos públicos de las Instituciones de Educación Superior y Centros de Investigación. Un factor de la ciencia abierta es la apertura de datos de investigación, la cual se encuentra en fase de implementación a nivel global, debido a que resulta necesario transitar de tener repositorios institucionales de publicaciones de acceso abierto a tener repositorios de datos en los que se almacene, coseche y fomente la localización, acceso, interoperabilidad y reutilización de diferentes conjuntos de datos. El objetivo de este trabajo es estudiar el desarrollo de repositorios de datos y/o con perspectiva de ciencia abierta en Iberoamérica, a partir de analizar un conjunto de categorías definidas sobre la implementación de tales canales. La metodología para este trabajo se realiza con base en la revisión bibliográfica para analizar teóricamente los factores, tipos, infraestructura y de colaboración para implementar los repositorios de datos de investigación en Iberoamérica; y para comprobar los supuestos planteados se lleva a cabo un estudio exploratorio sobre la muestra de 22 países de Iberoamérica. El estudio exploratorio se realiza al consultar en portales web oficiales de organismos, universidades y bibliotecas de cada país, así como en el Registro de Repositorios de Datos de Investigación, en Dataverse Project y en Figshare, para identificar y analizar los elementos que Iberoamérica ha implementado sobre la apertura de datos, a partir de la base de ocho categorías definidas. Asimismo, se realiza un análisis descriptivo y explicativo de los hallazgos obtenidos y sus especificidades. El trabajo se estructura en tres apartados: primero, se presentan los principios de la ciencia abierta y los factores que conforman las plataformas informativas, tales como conceptos de repositorios, datos, tipos y formatos; segundo, se expone la metodología y el estudio exploratorio sobre el desarrollo de repositorios de datos y/o con perspectiva de ciencia abierta en Iberoamérica; y tercero, se presentan los hallazgos del estudio y un conjunto de buenas prácticas para el desarrollo de repositorios de datos. Una conclusión general es que la transición a la ciencia abierta, representada por el desarrollo e implementación de repositorios de datos, pone de manifiesto la necesidad de estudiar los elementos que constituyen dichos canales de comunicación con el propósito de aumentar la reproducibilidad de los datos y resultados de la investigación, ya sea para fundamentar publicaciones y/o apoyar procesos de investigación.
Palabras Clave: Ciencia abierta, Infraestructura, Repositorios, Datos de investigación, Bibliotecas académicas, Iberoamérica.
Abstract: Open data, a component of open science, is based on a set of principles aimed at increasing access, reproducibility and management of data generated mainly by publicly funded research at academic institutions and research centres. Open data is in its implementation phase around the world, mainly because it requires a shift from institutional repositories of open access publications, to data repositories with the required functionalities to collect, store and share all types of research outputs that do not fit into a standard institutional repository - including datasets supporting the publication of journal articles - in a findable, accessible, interoperable and reusable (FAIR) way. The aim of this paper is to look at the development of data repositories in Ibero-America by analysing a set of defined parameters. The study methodology is based on a bibliographic review to analyse the types of research data infrastructures utilised in Ibero-America to date, based on an exploratory study carried out on a sample of 22 countries in the region. This is carried out by checking the official website portals of research institutions, universities and libraries in each country, as well as the Registry of Research Data Repositories, the Dataverse Project, and Figshare, to identify and analyse data repositories implemented in Ibero-America based on eight parameters. The paper is structured in three parts; first, we present the Open Science principles and the general concepts, such as types of repositories, data repositories, etc; second, we describe the methodology and present the sample exploratory study on the development of data repositories in Ibero-America, and; third, we present the study findings and a set of best practices for the development of data repositories. The general conclusion is that the transition to open data, measured by the development and implementation of repositories for research data in Ibero-America, highlights the need to further understand the role of data repositories in order to increase the reproducibility of research data and results, whether to support publication and, or the entire research process.
Keywords: Open science, Research infrastructures, Repositories, Data repositories, Research data, Academic libraries, Ibero-America.
Artículos
Repositorios de datos de investigación en Iberoamérica
Research Data Repositories in Ibero-America
Received: 30 August 2024
Accepted: 15 October 2024
Published: 28 November 2024
La comunicación académica se encuentra en transición debido a que las sociedades y comunidades académicas y de investigación han puesto de manifiesto la necesidad de implementar distintos canales de comunicación para la apertura sin restricciones a datos de investigación financiados con fondos públicos de Instituciones de Educación Superior (IES) y Centros de Investigación (CI) en el marco de la ciencia abierta.
El camino hacia la ciencia abierta en materia de infraestructura demanda no solo tener acceso abierto a publicaciones académicas en repositorios, sino también, fomentar el libre acceso a los datos que se utilizaron para generar una investigación y posteriormente una publicación, (denominados datos de investigación) y datos masivos producto de investigaciones (datos crudos) que no han sido utilizados para una publicación (denominados datos para investigación).
Asimismo, uno de los factores de la ciencia abierta es fomentar que mediante infraestructura innovadora y útil se expandan las formas de apertura e intercambio de resultados de investigación, por lo que además de desarrollar repositorios de publicaciones de acceso abierto se debe transitar a la implementación de repositorios de datos y la metodología que den lugar a tales publicaciones para que sean localizables, accesibles, interoperables y reutilizables en múltiples plataformas, en función de los principios FAIR y de la apertura de la ciencia.
En paralelo, para la ciencia abierta es relevante la colaboración de actores que fomenten la implementación de infraestructuras para la apertura de la ciencia. A la fecha, la contribución de las bibliotecas y los bibliotecarios es relevante para fomentar el desarrollo de repositorios de ciencia abierta, tanto para publicaciones como para datos, ya que las funciones y responsabilidades sociales de estas entidades están centradas en desarrollar vías para el acceso libre a la información; por lo que para el presente trabajo resulta pertinente estudiar la transición y el desarrollo de repositorios de datos abiertos en Iberoamérica.
Los principios generales de la ciencia abierta son maximizar las acciones de acceso, colaboración, participación, reproducibilidad y gestión de datos y productos de investigación financiados con fondos públicos en las IES y CI.
La evolución de la comunicación académica hacia la apertura inmediata y continua de datos y resultados de investigación está en el foco de atención global, porque los procesos de acceso e intercambio de estos recursos en múltiples medios muestran que deben ser tratados con procesos de registro, disponibilidad, reproducibilidad, visibilidad y usabilidad sin barreras basada en principios, factores y actores de la ciencia abierta.
Algunos antecedentes teóricos sobre la ciencia abierta son los siguientes:
De Gennaro (1977) planteó el problema de cómo la crisis de suscripciones afecta los presupuestos de las bibliotecas académicas y, en consecuencia, afecta directamente el acceso a la información.
En la Conferencia Mundial de Ciencia de la UNESCO de 1999 se presentó la Declaración sobre la ciencia y el uso del conocimiento científico (UNESCO, 1999), en la que se argumentaron propuestas para la disponibilidad y uso del conocimiento científico.
En 2002 y 2003 se proclamaron las principales declaraciones, conocidas como las tres B del acceso abierto, para que la literatura científica financiada con fondos públicos esté disponible y visible sin barreras (Open Society Foundations, 2002; Howard Hughes Medical Institute, 2003; Max Planck Society, 2003).
Bartling y Friesike (2014) propusieron el inicio de una segunda revolución científica, que se articula con la apertura de productos de investigación con apoyo de herramientas tecnológicas.
En 2021, la UNESCO publicó la Recomendación sobre ciencia abierta (UNESCO, 2021), que establece los conceptos, valores, principios y las siete áreas principales de acción para promover el desarrollo y la implementación de este movimiento.
El conjunto de antecedentes expuestos son el marco teórico sobre el que esta investigación fundamenta su análisis y propone posiciones y enfoques que nos permiten plantear que la ciencia abierta propicia un cambio de paradigma en la forma de hacer ciencia.
La definición que se utiliza para el objeto de estudio en el presente trabajo es la siguiente:
La ciencia abierta se define como un constructo inclusivo que combina diversos movimientos y prácticas con el objetivo de hacer que el conocimiento científico esté abiertamente disponible, accesible y reutilizable para todos, para aumentar las colaboraciones científicas y el intercambio de información en beneficio de la ciencia y la sociedad, y abrir los procesos de creación, evaluación y comunicación del conocimiento científico a actores sociales más allá de la comunidad científica tradicional. Incluye todas las disciplinas científicas y aspectos de las prácticas académicas, incluidas las ciencias aplicadas, las ciencias naturales y sociales y las humanidades, y se basa en los siguientes pilares clave: acceso abierto al conocimiento científico, infraestructuras científicas abiertas, comunicación científica abierta, participación abierta de los actores sociales y diálogo abierto con otros sistemas de conocimiento (UNESCO, 2021).
Esta definición expone algunos de los principales factores que constituyen la ciencia abierta, y nos permite identificar dos objetos de estudio específicos:
la ciencia abierta requiere de un análisis profundo para definir los factores y los actores del movimiento;
fortalecer que la ciencia abierta tenga como objetivo hacer que los datos, los resultados de la investigación y las publicaciones académicas estén disponibles, sean visibles y de libre acceso.
Con base en lo antes mencionado y en línea con el objetivo de este documento, a continuación se presentan algunos factores que componen la ciencia abierta.
Los principales elementos y factores que constituyen la ciencia abierta son diversos, y a la fecha diversos autores y organismos han planteado actualizaciones de las taxonomías que conforman dicho movimiento dada su particularidad dinámica (Pontika et al., 2015; Silveira et al., 2023).
Con base en el análisis de las taxonomías de la ciencia abierta, se identifica que la infraestructura es un elemento central del movimiento de apertura de la ciencia, ya que dicho factor promueve sistematizar la difusión (Fressoli y Arza, 2018), la visibilidad y el acceso abierto a los procesos, datos y productos de investigación; la misma actividad que a la fecha se ha centrado mayormente en repositorios institucionales, y cada vez más, se dirige a desarrollar e implementar repositorios de datos de Investigación.
A nivel global, la sistematización tecnológica tiene evidencia significativa de avances en la producción de plataformas y definición de metadatos para la disponibilidad, visibilidad y acceso abierto a productos de investigación financiados con fondos públicos, por lo que ante la tendencia de ampliar la apertura de bienes académicos, es necesario estudiar los conceptos, las tipologías, las partes y las estructuras que conforman los repositorios de datos de investigación.
Las plataformas para almacenar datos de investigación son cada vez más relevantes por promover el intercambio y reutilización de los datos para apoyar el cumplimiento de los principios de la investigación, por lo que resulta útil estudiar los elementos que los conforman.
La Declaración de acceso abierto de Berlín, (Max Planck Society, 2003) señaló que “No solo los artículos, sino también los datos y metadatos, los materiales originales, las representaciones digitales de materiales pictóricos y gráficos y el material multimedia académico, deben ser de libre acceso y utilizables”; y para tal propósito, los repositorios de datos fomentan la disponibilidad, almacenamiento, intercambio y uso de datos de investigación sin barreras (McNeill, 2016).
A la fecha, existe una diversidad de literatura especializada que tiene como objeto de estudio los repositorios de datos investigación; por lo que para esta investigación tales plataformas se definen como sigue:
Respalda[n] la preservación, el descubrimiento, el uso, la reutilización y la manipulación de objetos de datos científicos que respaldan la investigación publicada. A menudo proporciona[n] valor agregado a los datos a través de la garantía de calidad y la mejora de los metadatos, y tiene[n] un modelo operativo basado en la armonización de datos en un esquema común (University of Minessota, 2020).
En paralelo, existen un conjunto de elementos esenciales para desarrollar repositorios de datos, los cuales se estudian a continuación.
Los conceptos sobre datos de investigación que se utilizan para fundamentar el presente estudio, son los siguientes:
En la perspectiva académica, Gómez et al. (2016) definen a los datos de investigación como sigue:
“hechos, números y símbolos que describen un objeto, idea, condición, situación u otros factores” a los que se unen las “manifestaciones digitales de literatura (incluyendo textos, sonidos, imágenes fijas, imágenes en movimiento, modelos, juegos o simulaciones)”.
OpenAIRE (European Commission, 2017) señala que los datos de investigación son:
“ … información, en particular hechos o cifras, recopilada para ser examinada y considerada como base para el razonamiento, la discusión o el cálculo. … Los usuarios normalmente pueden acceder, minar, explotar, reproducir y difundir abiertamente datos de investigación accesibles de forma gratuita”
El Consejo Nacional de Ciencia y Tecnología (CONACyT) de México, señala que los datos de investigación son:
“ … toda aquella información recolectada y utilizada para la investigación académica, científica, tecnológica y de innovación … con licencias que permitan su libre reutilización” (CONACyT, s.f)
Los conceptos expuestos anteriormente proporcionan elementos comunes sobre los datos de investigación, tales como que son manifestaciones en texto, sonido, imágenes, entre otros; así como que es necesario la implementación de licencias abiertas para garantizar el reconocimiento de autoría y que estén disponibles, accesibles, interoperables y reutilizables en el marco de la legalidad.
En este sentido, podemos definir que los datos de investigación son aquellos que sustentan y validan los resultados de una investigación original, que probablemente ha sido revisada por pares, principalmente para su publicación. Estos datos poseen un conjunto de particularidades que es necesario tratar para que sean organizados en repositorios para tener acceso a aquellos, comprender, intercambiar, reutilizar, garantizar transparencia y reproducibilidad en los entornos en los que se almacenen, así como proporcionar servicios de información acorde con las necesidades y contextos en que se implementen.
Paralelamente, un elemento relevante por identificar sobre los datos de investigación es su tipología.
La tipología de los datos de investigación es diversa y se relaciona con los diferentes procesos de la actividad científica y de sus atributos particulares.
La National Science Board (2005, p. 19) clasifica y agrupa los datos de investigación como sigue:
Datos observacionales: son registros históricos, obtenidos en un lugar y tiempo determinado. Esta característica hace que no puedan ser reproducidos en caso de pérdida. Ejemplos: encuestas de opinión, datos climatológicos.
Datos experimentales: surgidos en la planificación y realización de experimentos. Pueden reproducirse, pero el costo de repetir el experimento es alto. Se generan con instrumentos especializados.
Datos computacionales: son resultado de ejecutar un modelo computacional. La reproducción requiere documentación del hardware, software y datos de entrada.
Datos numéricos. Se obtienen de estudios estadísticos, matemáticos, entre otros.
Datos observacionales-descriptivos. Incluyen datos de sensores, encuestas, muestras, imágenes, registros históricos, y se pueden obtener en un lugar y en un momento en el tiempo.
Datos computacionales. Son datos ciertos programas y resultados, que son reproducidos con soportes tecnológicos.
Datos experimentales. Acompañan experimentos desde la planificación, preparación e implementación hasta la obtención de resultados.
Datos derivados o compilados. Incluyen información reproducible para la interoperabilidad mediante minería de textos y datos, bases de datos compiladas, entre otros.
Datos procedentes y/o de referencia. Se obtienen de datos revisados por pares, probablemente publicados y seleccionados, bancos o bases de datos.
OpenAIRE señala que
En un contexto de investigación, los ejemplos de datos incluyen estadísticas, resultados de experimentos, mediciones, observaciones resultantes del trabajo de campo, resultados de encuestas, entrevistas grabaciones e imágenes. La atención se centra en los datos de investigación que están disponibles en forma digital (European Commission, 2017).
Con base en las tres perspectivas globales expuestas se puede definir que los tipos de datos de investigación son producidos en función de los fines y campos de conocimiento para los que sean empleados. Asimismo, una particularidad significativa de los datos de investigación a considerar para su registro en repositorios son los formatos en que se objetivan para intercambiarlos.
En paralelo con la dinámica actual, se puede precisar que gran parte de los formatos de los datos de investigación son objetivados de facto en forma digital.
Algunos formatos de datos de investigación, se muestran en el Cuadro 1.

El análisis de los conceptos, tipos y formatos de datos de investigación están centrados en que son recursos frecuentemente producidos y utilizados para fundamentar las publicaciones académicas, tales como son: libros, mapas, periódicos, fotografías, estudios lingüísticos, películas, análisis de objetos, entre otros recursos (Gómez et al., 2016).
Los elementos analizados anteriormente pueden considerarse como una base teórica a tener presente al momento de desarrollar e implementar repositorios de datos de investigación, ya que se pone de manifiesto que los datos de investigación tienen atributos específicos que habrá que considerar en el momento de su registro, descripción y organización.
En paralelo, el desarrollo e implementación de acciones de ciencia abierta avanza paulatinamente en Iberoamérica, región que tiene amplia tradición en realizar acciones de acceso abierto, y que se constata con la diversidad de sistemas de información y repositorios de publicaciones disponibles a la fecha. Por ello, acorde con el objeto de estudio de este documento y en función de complementar el análisis de los factores que componen la ciencia abierta, resulta pertinente investigar qué entidades de Iberoamérica han desarrollado repositorios de datos de investigación y/o con perspectiva de ciencia abierta.
La metodología para este trabajo consiste en una revisión bibliográfica, así como con técnicas cuantitativas y cualitativas, debido a que para comprender el fenómeno de estudio se requiere delimitar, explicar, predecir y comprender las propiedades, factores, características y tendencias del objeto de estudio.
La problemática del estudio consiste en que la ciencia abierta plantea diversos retos, y uno de ellos es implementar repositorios de datos de investigación, por lo que resulta relevante conocer los elementos esenciales para implementar acciones de apertura de la ciencia en dichas plataformas.
El objetivo de este trabajo es estudiar el desarrollo de repositorios de datos y/o con perspectiva de ciencia abierta en Iberoamérica, a partir del análisis de un conjunto de categorías definidas sobre la implementación de tales canales.
La hipótesis de la presente investigación es que, si uno de los propósitos de la ciencia abierta es ampliar el acceso y la reproducibilidad de los datos y resultados de investigación mediante repositorios de datos, entonces, para lograr tal propósito es fundamental conocer los elementos necesarios para potenciar la reproducibilidad de dichos productos.
La revisión bibliográfica se realiza con base en la búsqueda y análisis de literatura especializada para estudiar los principios teóricos y factores de la ciencia abierta y los repositorios de datos. Igualmente se analiza el contexto de los hallazgos.
Basado en la técnica de investigación cualitativa, en este estudio se implementan cuatro niveles de investigación:
Exploratorio. Investigar el tema de los repositorios de datos con base en la revisión de la literatura especializada, así como con los resultados obtenidos de la búsqueda en fuentes de referencia definidas. La revisión bibliográfica consistió en la recuperación y el análisis de literatura cuyos temas de estudio fueran principalmente: ciencia abierta; apertura de la ciencia; repositorios de datos; asimismo, se delimitó que la literatura recuperada tuviera preferentemente análisis en la perspectiva de la bibliotecología. Para recuperar información y comprobar los supuestos planteados se lleva a cabo un estudio exploratorio sobre una muestra de 22 países de Iberoamérica con el propósito de identificar las principales acciones que se desarrollan e implementan para la apertura de datos en dicha región. Las fuentes de consulta definidas para el estudio son portales web oficiales de organismos, universidades y bibliotecas, tales como: International Federation Library Associations (IFLA); Organización Mundial de Propiedad Intelectual (OMPI); Organización de las Naciones Unidas (ONU); Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura (UNESCO), así como el Registro de Repositorios de Datos de Investigación (re3data), en Dataverse Project y en Figshare.
Descriptivo. Identificar, describir y explicar los fundamentos teóricos, conceptuales, factores y tipos de los repositorios de datos, a partir de una revisión de la literatura y hallazgos del conjunto de categorías definidas para estimar la dimensión del tema.
Explicativo. Esta sección presenta factores, causas y desafíos del objeto de estudio para encontrar las razones de investigación y provocar la comprensión del tema. Esta parte metodológica se analiza con base en las referencias globales y los elementos asociados con el fenómeno de estudio.
Predictivo. Analizar, explicar, interpretar, discutir y proponer estrategias sobre el desarrollo y la implementación de los repositorios de datos para justificar la funcionalidad del objeto de estudio.
La búsqueda y recuperación de información en las fuentes de referencia se basa en ocho categorías definidas que están alineadas con los niveles de investigación implementados, y son las siguientes:
Asimismo, se realiza un análisis de contenido descriptivo y explicativo de tipo cualitativo en el enfoque metodológico de las ciencias sociales y la bibliotecología a partir de los hallazgos obtenidos, con el fin de exponer sus especificidades; y conocer los avances y tendencias sobre el fenómeno de estudio; por lo que a continuación, se presentan los hallazgos.
Los hallazgos obtenidos son derivados de la búsqueda, recuperación y estudio de las categorías definidas, por lo que los datos de los países que se presentan son aquellos que tienen registradas sus iniciativas en las fuentes de consulta establecidas para el estudio. Además, para aquellos países que no tienen registradas sus iniciativas en las fuentes definidas para el estudio se realiza la búsqueda en los portales Web oficiales institucionales. Por lo que aquellos países de los que no se recupera información en las fuentes de consulta definidas, se puede interpretar que es debido a que no han desarrollado, implementado o documentado sus acciones y/o infraestructuras.
Asimismo, se realiza un análisis de contenido descriptivo y explicativo de los hallazgos obtenidos, con el propósito de enunciar los principales elementos para implementar repositorios de datos de investigación.
Al respecto, los hallazgos de los países de Iberoamérica que tienen alguna acción desarrollada sobre ciencia abierta y/o datos abiertos se muestran en la Tabla 1; en la cual se indica si los países cumplen con las categorías de estudio; y se usa la sigla “SD” (sin datos) para referir los países que no presentan dichos elementos; se anotan los datos cuantitativos recuperados.

Los hallazgos de la Tabla 1 muestran información recuperada de 18 países de 22 que conforman la región de Iberoamérica; los países de los cuales no se recuperó información fueron cuatro: Andorra, Bolivia, Nicaragua y Venezuela.
Los hallazgos generales de los 18 países de Iberoamérica, indican que 17 países tienen normatividades sobre ciencia abierta; y de ellos 6 países tienen desarrolladas políticas específicas de datos abiertos: Argentina, Brasil, Chile, Colombia, México y República Dominicana. Asimismo, 15 países tienen repositorios disciplinarios e institucionales; y 18 países almacenan datos observacionales, experimentales y computacionales en los repositorios. Adicionalmente, 10 países indican que utilizan softwares para implementar repositorios: Dspace (8 países), dataverse (10 países), Eprints (2 países), Fedora (2 países), MySQL (3 países) y CKAN (2 países). Además, sobre los repositorios de Iberoamérica se obtuvo que re3data tiene 146 repositorios registrados; Dataverse tiene 31 repositorios registrados y Figshare tiene 1 repositorio institucional y cuenta con más de 8 millones de datos almacenados, incluyendo un pequeño porcentaje sobre dicha región, en su versión libre y gratuita para investigadores Figshare.com. Por último, 10 países fomentan la colaboración de bibliotecas (universitarias, digitales, repositorios) para el desarrollo de acciones de ciencia abierta y/o repositorios de datos abiertos.
Con base en lo anterior, a continuación se expone el análisis descriptivo y explicativo de las especificidades de los hallazgos obtenidos por país en orden alfabético.
Tiene como base la Ley No. 26.899 con Resolución 753-E/2016 (Argentina, 2016), la cual cristaliza el acceso abierto a través de repositorios institucionales; y en 2022 se presentó el Diagnóstico y lineamientos para una política nacional de ciencia abierta en Argentina, (Argentina, 2022) el cual busca ser el marco legal para la implementación de la ciencia abierta en este país.
Los tipos de repositorios de datos son disciplinarios, institucionales y otros.
Los tipos de datos con los que pobla los repositorios son observacionales, experimentales y computacionales.
El tipo de software que utilizan para crear repositorios de datos abiertos está basado en DSpace, Dataverse, Eprints y propietarios.
A la fecha, tiene registrados nueve repositorios en re3data, dos repositorios en Dataverse, 782 items, y 571 Datasets; y Figshare.com tiene 5,077 items y 2.137 Datasets sobre Argentina.
Colabora con sus bibliotecas, principalmente universitarias, para emprender acciones de ciencia y repositorios abiertos.
El Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT) publicó el Manifiesto de acceso abierto a los datos de investigación brasileños para la ciencia ciudadana (IBICT, 2016) en el que plantea que los datos de investigación son recursos indispensables para la ciencia abierta (Babini y Rovelli, 2020).
Los tipos de repositorios de datos son disciplinarios, institucionales y otros.
Los tipos de datos con que pobla los repositorios son observacionales, experimentales y computacionales.
El software con que elabora repositorios de datos abiertos es DSpace y Dataverse.
Tiene registrados 21 repositorios en re3data, 11 repositorios en Dataverse, 1,746 items, y 1,196 datasets; Figshare.com tiene 37,812 items, y 24,406 datasets sobre Brasil.
La colaboración de bibliotecas se establece mediante SciELO Data, debido a su implementación con perspectiva bibliotecaria.
Desarrolló la Política Nacional de Ciencia Abierta 2022-2031 (Colombia, 2022), con el objetivo de proporcionar una normatividad, directrices y lineamientos para el tratamiento del acceso abierto a datos de investigación.
Los principales tipos de repositorios de datos son disciplinarios e institucionales.
Pobla los repositorios con datos observacionales, experimentales y computacionales.
Los repositorios de datos se crean con los softwares DSpace, Dataverse, Digital Commons y propietario.
Tiene registrados 14 repositorios en re3data, tres repositorios en Dataverse, 980 items, y 675 datasets; Figshare.com tiene 6,025 items, y 2,315 datasets sobre Colombia.
Colabora con sus redes de bibliotecas universitarias, públicas, escolares y digitales.
Tiene como principal normatividad de la ciencia abierta la Declaración de Ciencia Abierta del CSUCA (CSUCA, 2023), la cual representa un logro para fortalecer la ciencia abierta y la comunidad académica de los países de América Central, República Dominicana, y Cuba. Asimismo, la Universidad Nacional lanzó la Estrategia de ciencia abierta, que se compone de siete pilares de ciencia abierta, alineadas con las Recomendaciones de la UNESCO (UNA, 2023).
No refiere desarrollo de tipos de repositorios de datos.
Pobla los repositorios con datos observacionales, experimentales y computacionales.
No refiere información sobre el tipo de software que emplea para desarrollar repositorios.
No tiene repositorios registrados en re3data, no refiere información sobre repositorios en Dataverse, y tiene 33,179 items y 15,121 datasets sobre Costa Rica en Figshare.com.
En colaboración bibliotecaria, la Universidad Nacional de Costa Rica gestiona “Kimuk: repositorio nacional de Costa Rica” (Biblioteca Arturo Argüello Chaves, 2021).
Publicó la Política de Acceso Abierto de la ANID (Agencia Nacional de Investigación y desarrollo, 2020), que es referencia para la formulación de políticas de acceso y preservación de datos de investigación financiados con fondos públicos.
Sus tipos de repositorios de datos son disciplinares e institucionales.
Pobla los repositorios con datos observacionales, experimentales y computacionales.
Uso de los softwares DSpace y Dataverse para desarrollar repositorios de datos.
Tiene seis repositorios registrados en re3data, dos repositorios en Dataverse, 1,101 items, y 654 datasets. Figshare.com tiene 5,634 items, y 2,226 datasets sobre Chile.
Colabora con la Biblioteca Electrónica de Información Científica (BEIC) como instrumento para el acceso a la información científica de este país.
Forma parte de la Declaración de Ciencia Abierta del CSUCA (CSUCA, 2023).
Tiene repositorios de datos disciplinares e institucionales.
Pobla los repositorios con datos observacionales, experimentales y computacionales.
No refiere el tipo de software que usa para desarrollar repositorios de datos.
No tiene repositorios registrados en re3data, no tiene repositorios registrados en Dataverse, sin embargo, tiene 1,055 items, y 610 datasets en dicha fuente; Figshare.com tiene 932 items, y 304 datasets sobre Cuba.
No refiere información sobre colaboración con bibliotecas para acciones de apertura de datos.
No refiere información sobre regulaciones de ciencia abierta y/o datos abiertos.
Desarrolla repositorios de datos disciplinares.
Pobla los repositorios con datos computacionales.
Señala usar el software Dataverse para desarrollar repositorios de datos.
Tiene un repositorio registrado en re3data, un repositorio registrado en Dataverse, 641 items, y 356 datasets; Figshare.com tiene 2,713 items, y 1,124 datasets sobre Ecuador.
No refiere información sobre colaboración con bibliotecas para acciones de apertura de datos.
Forma parte de la Declaración de Ciencia Abierta del CSUCA (CSUCA, 2023).
No refiere información sobre desarrollo de tipos de repositorios de datos.
Refiere poblar los repositorios con datos observaciones, experimentales y computacionales.
No señala información sobre el tipo de software que utiliza para desarrollar repositorios de datos.
No tiene repositorios registrados en re3data, no tiene repositorios registrados en Dataverse, sin embargo tiene 4,107 items, y 1,984 datasets registrados en dicha fuente; Figshare.com tiene 53,189 items, y 15,327 datasets sobre El Salvador.
No refiere información sobre colaboración con bibliotecas para acciones de apertura de datos.
Tiene como normatividades de ciencia abierta la Ley de la Ciencia 17/2022 (Gobierno de España, 2022) en la que integra a la ciencia abierta y sus factores como son: repositorios institucionales, datos de investigación, principios FAIR, procesos de evaluación y la ciencia como bien común. Además, España tiene como normatividad de este movimiento a la Estrategia Nacional de Ciencia Abierta (ENCA) 2023-2027 (Gobierno de España, 2023), con el objetivo de desarrollar infraestructura digital, gestionar datos de investigación, implementar acceso abierto y crear nuevos mecanismos de evaluación de la investigación.
Desarrolla repositorios de datos disciplinarios e institucionales.
Usa los softwares CKAN, DSpace, Dataverse, Fedora, MySQL y propietarios para desarrollar repositorios de datos.
Tiene 55 repositorios registrados en re3data, tiene tres repositorios registrados en Dataverse, 288 items, y 259 datasets; Figshare.com tiene 1,539 items, y 385 datasets sobre España.
Colabora con sus bibliotecas universitarias y digitales para desarrollar acciones de apertura de datos.
Forma parte de la Declaración de Ciencia Abierta del CSUCA (CSUCA, 2023).
No refiere información sobre desarrollo de tipos de repositorios de datos.
Refiere poblar los repositorios con datos observaciones, experimentales y computacionales.
No señala información sobre el tipo de software que utiliza para desarrollar repositorios de datos.
No tiene repositorios registrados en re3data, no tiene repositorios registrados en Dataverse, sin embargo, tiene 840 items, y 624 datasets registrados en dicha fuente; Figshare.com tiene 1,108 items, y 396 datasets sobre Guatemala.
No refiere información sobre colaboración con bibliotecas para acciones de apertura de datos.
Forma parte de la Declaración de Ciencia Abierta del CSUCA (CSUCA, 2023).
Indica que desarrolla repositorios de datos disciplinarios e institucionales.
Refiere poblar los repositorios con datos observaciones, experimentales y computacionales.
No indica información sobre el tipo de software que usa para desarrollar repositorios de datos.
No tiene repositorios registrados en re3data, no tiene repositorios registrados en Dataverse, sin embargo, tiene 728 items, y 482 datasets en dicha fuente; Figshare.com tiene 628 items, y 207 datasets sobre Honduras.
No refiere información sobre colaboración con bibliotecas para acciones de apertura de datos.
Señala en su Constitución Política de México en su artículo 3º. Fracc V, que el Estado apoyará y garantizará el acceso abierto a la información derivada de la investigación científica (México, 2022).
Refiere que desarrolla repositorios de datos disciplinarios e institucionales.
Refiere poblar los repositorios con datos observaciones, experimentales y computacionales.
Indica que usa los softwares DSpace, Dataverse, EPrints, Fedora, MySQL y propietaria para desarrollar repositorios de datos.
Tiene 18 repositorios registrados en re3data, dos repositorios registrados en Dataverse, 282 items, y 194 Datasets; Figshare.com tiene 13,166 items, y 5,096 Datasets sobre México.
Refiere que colabora con sus bibliotecas universitarias y digitales para desarrollar acciones de apertura de datos.
Forma parte de la Declaración de Ciencia Abierta del CSUCA (CSUCA, 2023). Además, Panamá fue donde se gestó la Declaración de Panamá sobre Ciencia Abierta, (Fundación Karisma, 2018) la cual manifiesta el interés de diversos países de América Latina para trabajar en la apertura de información financiada con fondos públicos.
Desarrolla repositorios de datos disciplinarios e institucionales.
Pobla sus repositorios con datos observaciones, experimentales y computacionales.
No indica qué softwares usa para desarrollar repositorios de datos.
Tiene dos repositorios registrados en re3data, no tiene repositorios registrados en Dataverse, sin embargo, tiene 35 items, 4 datasets registrados en dicha fuente; Figshare.com tiene 1,797 items, y 805 datasets sobre Panamá.
No refiere colaboración con sus bibliotecas para desarrollar acciones de apertura de datos.
Tiene como normatividad para la ciencia abierta y la apertura de datos la Ley Nº 7064 (República del Paraguay, 2023), la cual fomenta el acceso abierto y los repositorios para publicaciones para el acceso sin barreras.
Desarrolla repositorios de datos disciplinarios e institucionales.
Pobla sus repositorios con datos observaciones, experimentales y computacionales.
No indica qué softwares usa para desarrollar repositorios de datos.
No tiene repositorios registrados en re3data, no tiene repositorios registrados en Dataverse, sin embargo, tiene 287 items, y 191 datasets registrados en dicha fuente; Figshare.com tiene 664 items, y 304 datasets sobre Paraguay.
No refiere colaboración con sus bibliotecas para desarrollar acciones de apertura de datos.
Tiene como normatividad para la ciencia abierta y la apertura de datos la Ley N° 30035 (República del Perú, 2015), la cual regula el Repositorio Nacional Digital en acceso.
Desarrolla repositorios de datos institucionales.
Pobla sus repositorios con datos observaciones, experimentales y computacionales.
Señala que usa los softwares DSpace y Dataverse para desarrollar repositorios de datos.
Tiene cuatro repositorios registrados en re3data, tiene dos repositorios registrados en Dataverse, 220 items, y 198 datasets; Figshare.com tiene 5,370 items, y 2,186 datasets sobre Perú.
Perú refiere que tiene colaboración con sus bibliotecas universitarias y digitales para desarrollar acciones de apertura de datos.
Tiene como normatividad para la ciencia abierta y la apertura de datos la Política Nacional de Ciencia Abierta (Ribeiro et al., 2016), la cual se centra en trabajar en tres ejes: acceso abierto y datos abiertos, infraestructura y preservación digital, evaluación científica y responsabilidad social.
Desarrolla repositorios de datos disciplinares e institucionales.
Pobla sus repositorios con datos observaciones, experimentales y computacionales.
Señala que usa los softwares CKAN, DSpace, Dataverse, MySQL y propietarios para desarrollar repositorios de datos.
Tiene 15 repositorios registrados en re3data, tiene cuatro repositorios registrados en Dataverse, 1,115 items, y 791 datasets; Figshare.com tiene 1 repositorio institucional registrado en Portugal, 5,340 items, y 1,729 datasets sobre dicho país en Figshare.com.
Refiere que tiene colaboración con sus bibliotecas universitarias y digitales para desarrollar acciones de apertura de datos.
Forma parte de la Declaración de Ciencia Abierta del CSUCA (CSUCA, 2023), y ha publicado su Primera política nacional de datos abiertos (Presidencia de la República Dominicana, 2022), una estrategia que establece los lineamientos para facilitar el acceso, uso, reutilización y redistribución de los datos de carácter público, con la finalidad de garantizar una cultura de apertura e innovación.
Desarrolla repositorios de datos disciplinares e institucionales.
Pobla sus repositorios con datos observaciones, experimentales y computacionales.
No señala qué software usa para desarrollar repositorios de datos.
No tiene repositorios registrados en re3data, no tiene repositorios registrados en Dataverse, sin embargo, tiene 136 items, y 46 datasets registrados en dicha fuente; Figshare.com tiene 204 items, y 37 datasets sobre República Dominicana.
No refiere colaboración con sus bibliotecas para desarrollar acciones de apertura de datos.
Desarrolló la Implementación de la estrategia de datos abiertos de Gobierno de Uruguay (Uruguay, 2022), centrada en desarrollar proyectos para presentar los datos abiertos de forma visual e interactiva, con herramientas que permiten analizar los datos.
Desarrolla repositorios de datos disciplinares e institucionales.
Pobla sus repositorios con datos observaciones, experimentales y computacionales.
Señala que usa el software Dataverse para desarrollar repositorios de datos.
Tiene un repositorio registrado en re3data, tiene un repositorio registrado en Dataverse, 336 items, y 263 datasets; Figshare.com tiene 1,033 items, y 446 datasets sobre Uruguay.
Refiere que colabora con el Sistema Nacional de Repositorios Digitales gestionado la biblioteca para desarrollar acciones de apertura de datos.
De acuerdo con los hallazgos es fundamental considerar que la infraestructura tecnológica para la apertura de la ciencia requiere de la colaboración con diversas áreas del conocimiento para que los canales de comunicación académica se actualicen de acuerdo con el flujo tecnológico contemporáneo y con las tendencias particulares.
En este sentido, se propone que para apoyar la implementación y optimización de los datos de investigación en repositorios, la cooperación de las bibliotecas será fundamental, porque contribuirán a la definición, registro, almacenamiento, recolección y desarrollo de infraestructura de datos de investigación resultados para ser localizables, accesibles, interoperables y reutilizables; y de esta forma, cristalizar una de los objetivos de la ciencia abierta en cuanto a maximizar la reproducibilidad de los resultados de investigación.
Los hallazgos recuperados permiten identificar que la ciencia abierta es implementada por diferentes actores, quienes desarrollan funciones y acciones alineadas con los objetivos, contextos y campos del conocimiento en los que se implementan.
Ante el panorama obtenido, la presente investigación plantea una propuesta de modelo de funciones bibliotecarias para promover acciones de ciencia abierta y repositorios de datos basado en la gestión de datos de investigación (GDI).
La propuesta del modelo se muestra en la Figura 1 y propone la fusión de las funciones principales de las bibliotecas académicas alineadas con las funciones de GDI para implementar repositorios de datos.

El supuesto de esta propuesta en la perspectiva de la bibliotecología y de los estudios de la información es que ambas actividades -bibliotecarias y GDI- tienen similitudes en sus procesos y objetivos para lograr el objetivo común de desarrollar repositorios de datos para maximizar la transparencia, reproducibilidad, integridad, apertura y utilidad de los resultados de la investigación.
Por lo anteriormente expuesto, en este apartado se presenta y describe el modelo de funciones sobre los aportes de las bibliotecas al desarrollo de repositorios de datos de investigación:
Las bibliotecas pueden contribuir a la armonización de las normas de ciencia abierta en el marco de la legalidad, basándose en los siguientes factores:
Garantías legales. La colaboración de las bibliotecas será la recuperación de garantías legales por parte de los gobiernos, las IES y la CI para apoyar la implementación, la transparencia y la rendición de cuentas de las acciones de ciencia abierta. Esto tiene como evidencia el ODS 16.10 y su indicador 16.10.2, (United Nations, 2015) que señaló que las leyes nacionales son instrumentos relevantes para garantizar el libre acceso a la información.
Derechos laborales. Son garantías que indican que los productos y/o manifestaciones fueron desarrollados en alguna institución y que el personal ha sido remunerado económicamente por los mismos; a la institución le corresponde en mayoría de parte los derechos patrimoniales de dichos productos (OMPI, 2016) (distribución, comunicación, difusión y remuneración).
Licencias Creative Commons. Son garantías y permisos que el autor de las manifestaciones elige y asigna para que estén disponibles. A la fecha, para acciones de ciencia abierta se recomienda asignar la licencia CC Zero para datos y resultados de investigación para que sean FAIR en las plataformas y registren esta buena práctica en los planes GDI.
Políticas para Datos Abiertos. Tendencia que sugiere asociar la apertura con normas educativas, científicas y de información. A la fecha, las políticas de datos cuentan con pocos estudios; y existen algunos modelos y guías (Ball, 2016), tales como: Declaración de Denton (UNT, 2020); Desarrollo de políticas para la ciencia abierta (UNESCO, 2022); y la Declaración de la IFLA sobre Datos Bibliotecarios Abiertos (IFLA, 2022), entre otros.
La finalidad de la función de administración y planificación de proyectos de ciencia abierta con apoyo de las bibliotecas será establecer bases de colaboración con los autores para formalizar su autorización y promover acuerdos en el marco de la legalidad de los derechos morales, patrimoniales y laborales para que las colecciones de datos abiertos están formalmente disponibles en accesos sin barreras en los repositorios de datos.
En el marco de los repositorios de datos, los procesos de selección y adquisición de colecciones bibliotecarias promoverán un cambio sustancial y de actualización de dichas actividades, dado que gran parte de los datos y publicaciones científicas que se producen actualmente están objetivados en formato digital (Campbell, 2021).
En este sentido, es pertinente implementar criterios bibliotecarios de selección y adquisición a los repositorios de datos, tales como son los siguientes:
Selección
Tipología. Delimitar los tipos de datos que serán seleccionados para estar disponibles en los repositorios.
Calidad. Garantizar que el contenido de los datos sea confiable. Puede tener revisión por pares y/o ser pre-print.
Fiabilidad. Garantizar la confiabilidad del responsable y dominio del contenido de los datos, así como la del dominio del recurso.
Objetividad. Identificar que el contenido de los datos es una versión formal, válida y verificable.
Fecha. Asegurarse de que los datos contengan información actualizada consistente con el campo de conocimiento.
Funcionalidad. Asegurarse de que los enlaces a datos referidos y/o citados funcionen (UNT, 2020).
Adquisición:
Identificar que los datos fueron desarrollados con fondos públicos.
Identificar que el autor de los datos tiene una relación formal con una institución.
Identificar que los datos están relacionados con una institución.
Garantizar que los datos tengan licencias abiertas.
El conjunto de criterios propuestos permite enfatizar la premisa de que las acciones de apertura de la ciencia tienen repercusiones en términos económicos, ya que para los presupuestos de las bibliotecas se reducen costos de suscripción, se erradica la temporalidad del acceso a contenidos y adquisición de materiales, entre otros. Además, se recomienda que los criterios y procesos de DC determinen la selección y adquisición de datos y productos académicos porque “la biblioteca debe seguir siendo el “lugar” donde se pueden descubrir, acceder, leer y utilizar materiales académicos” (Mullen, 2011).
La columna vertebral de los repositorios de datos abiertos es la OI, para que los datos y las publicaciones sean: localizables, identificables, seleccionables, accesibles, y navegables en cualquier plataforma de información (IFLA, 2009).
Una premisa de los repositorios de datos de investigación es implementar los principios FAIR, con los siguientes propósitos: (GoFAIR, 2016) (Guajardo, 2020).
Localizable: que los datos sean fáciles de encontrar tanto para los humanos como para los programas informáticos, y para ello se promueve el uso de identificadores persistentes únicos.
Accesible: saber cómo se puede acceder a los datos, posiblemente incluyendo autenticación y autorización.
Interoperable: los registros de los datos deben realizarse con metadatos para interoperar en diferentes plataformas.
Reutilizable: hacer descripciones claras con lenguaje sencillo.
La armonización entre los principios FAIR y las OI muestra que los procesos de apertura de la ciencia necesitan actualizarse, y algunas tendencias sobre dicha relación son las siguientes (Smith, 2020):
Fomentar que el “control de autoridad” pase a la “gestión de identidad” basada en la interoperabilidad.
Fomentar que los recursos de información vayan “de adentro hacia afuera” (Dempsey, 2021).
Desarrollar servicios basados en metadatos, tales como consultoría, estadística, gestión, bibliometría, indexación y otros.
Actualizar sintaxis y reducir el uso de términos ambiguos.
Analizar esquemas de metadatos para datos y resultados de investigación: a nivel global varias organizaciones han desarrollado esquemas para datos, y tres esquemas de metadatos para datos de investigación relevantes son los siguientes: OpenAIRE, Dublin Core y Research Data Alliance; mismos esquemas que tienen en común el desarrollo de 16 y 17 metadatos básicos para datos.
Este conjunto de tendencias posiciona a los metadatos y las OI como elementos transversales de los entornos bibliotecarios relacionados con el tratamiento de datos y publicaciones académicas en repositorios y para estar basados en servicios de información innovadores.
La ciencia abierta es un movimiento dinámico que requiere de servicios de información (SI), los cuales cristalizan el compromiso social de las bibliotecas al ser espacios que ofrecen rutas de acceso abierto a diversos recursos de información académicos en beneficio de las sociedades, tanto generales como especializadas. Por lo que un conjunto de servicios bibliotecarios para la ciencia abierta, son los siguientes::
Las bibliotecas pasan de ser proveedoras de información a ser colaboradoras en el intercambio de recursos y procesos de aprendizaje y actores en la construcción del conocimiento. (Revez, 2018 p. 4).
Reforzar la premisa de que los recursos de información van “de adentro hacia afuera”: es decir, todos aquellos recursos financiados con fondos públicos tienen que estar disponibles sin restricciones y ser visibles (Dempsey, 2021).
Repositorios de datos. Gestionado por bibliotecas para implementar los principios bibliotecológicos de organización de información y garantizar la comunicación, almacenamiento y preservación de los productos de la investigación.
Plan de estudios y habilidades científicas. Sensibilizar a las comunidades de usuarios sobre las prácticas de apertura (UNESCO, 2021 p. 6; ALA, 2021; LERU, 2018).
Planes de gestión. Basado en el asesoramiento de las bibliotecas, alentar a las comunidades a compartir resultados de investigación para apoyar el ciclo de investigación (Xu, 2022).
Indudablemente, los SI bibliotecarios son actividades relevantes para el establecimiento de redes de cooperación institucional, que va desde fomentar relaciones hasta compartir procesos que impactan en el ciclo de investigación y ampliar el acceso, intercambio, reproducción y difusión de productos académicos, para que las comunidades se beneficien.
La ciencia abierta fomenta un cambio de paradigma sobre las funciones centrales y la legitimación de la apertura, el libre acceso y la transparencia de los contenidos financiados con fondos públicos.
Los repositorios de datos de investigación son cada vez más relevantes y es necesario seguir estudiándolos debido a que la eficacia de su implementación dependerá de su constante estudio y actualizaciones.
Los softwares con que se implementan repositorios de datos de investigación muestran evidencia de ser similares a los softwares aplicados a los repositorios de publicaciones, por lo que se puede concluir que ambos tipos de repositorios tienen objetivos comunes para ampliar la apertura de recursos de información financiados con fondos públicos.
Los hallazgos del análisis de la ciencia abierta en Iberoamérica permiten concluir que su avance es paulatino y su implementación necesita de un conjunto de elementos de tipo regulatorio, con el objetivo de garantizar su desarrollo e implementación; de ahí la propuesta de modelo para coadyuvar las acciones bibliotecarias con el desarrollo de acciones de apertura de la ciencia mediante repositorios de datos.
Finalmente, las bibliotecas son laboratorios de la ciencia abierta porque cuentan con elementos que fomentan la apertura y los repositorios de datos; por lo que son actores propios de ser reconocidos en las taxonomías de este movimiento.


