Recepção: 26 Fevereiro 2019
Aprovação: 16 Julho 2019
DOI: https://doi.org/MariaGiovannaGuedesFarias
Resumo: Web of Science
Palavras-chave: Gestão de dados de pesquisa, Curadoria de dados, Bibliotecário de dados, Ciência da Informação.
Abstract: This articles presents a survey on the role of the librarian in research data management and curation. This is a bibliographic research based on the methodology of systematic review and whose search was conducted in the Web of Science database. Among the documents analyzed were studies, researches and experience reports on research data management and curation, and on training of librarians to act in this new niche of work. The results show that there are still few articles retrieved from that database that explicitly mention the term data librarian, although there are many studies on Data Management and curation. Few documents have been found that have featured the phrases data manager and data curator. The review showed that in the United States and Europe the discussions and actions of librarians acting as curators and research data managers are already well advanced, unlike in Brazil and in other Latin American countries. On the other hand, in the United States and Europe, open-access policies and strategies were very slow in comparison to Latin American countries, where Brazil is a pioneer and has had active participation in the open access movement. Librarians are shown to perform a new role as specialists in documentation and information, as data specialists and as specialists in the creation of repositories, giving proof of their experiences in data description, in the implementation of data services and in the support of researchers’s needs.
Keywords: Research Data Management, Data curation, Data librarian, Information Science.
Resumen: Presenta una encuesta sobre el papel del bibliotecario en curaduría y la gestión de los datos de investigación. Se trata de una investigación bibliográfica basada en la metodología de revisión sistemática y cuya búsqueda se llevó a cabo en la base de datos Web of Science. El análisis de los documentos recayó sobre los textos que aportan estudios, investigaciones e informes de experiencia sobre la gestión y curaduría de los datos de investigación, y la formación de bibliotecarios para actuar en este nuevo nicho de trabajo. Los resultados demuestran que todavía hay pocos artículos recuperados sobre la base que mencionan explícitamente el término bibliotecario de datos, aunque hay muchos estudios sobre gestión de datos y Curatorship. Se han encontrado pocos documentos que han explicado el Syntagma Administrador de datos y conservador de datos. La revisión mostró que en los Estados Unidos y Europa las discusiones y acciones de los bibliotecarios que actúan como Comisarios y gestores de datos de investigación ya están bien avanzadas, a diferencia de la realidad brasileña y otros países latinoamericanos. Por otra parte, en los Estados Unidos y en Europa, las políticas y estrategias de acceso abierto fueron muy lentas en relación con los países latinoamericanos, donde Brasil es pionero y ha participado activamente en el movimiento de acceso abierto. Los estudios demuestran que el bibliotecario puede asumir una nueva configuración en su desempeño, como especialista en documentación e información, especialista en datos, en la creación de repositorios, además de mostrar experiencias en la descripción de los datos y en la implementación de Servicios de datos y apoyo a los investigadores.
Palabras clave: Gestión de datos científicos, Curaduría de datos, Bibliotecario de datos, Ciencia de la Información.
1 Introdução
A trajetória histórica do conhecimento humano tem relação com as bibliotecas. Na Antiguidade, procurava-se nelas salvaguardar os documentos por elas custodiados, enquanto a função dos copistas era transcrever o conteúdo dos códices, papiros, entre outros, a fim de reproduzi-los e com o intuito de preservar esses conteúdos e evitar a sua perda ou destruição, isto é, uma espécie de backup à moda antiga.
Entretanto, a história das bibliotecas está repleta de acontecimentos que revelam como foram poucos os materiais que restaram, seja pela deterioração ao longo do tempo, seja por destruição humana, seja por catástrofes naturais, seja até mesmo pelas alterações e interferências feitas pelos copistas em alguns escritos.
Qualquer dado é suscetível a perdas ou alterações e, muitas vezes, fazer uma cópia ou realizar um backup não é suficiente para garantir a existência, integridade e perenidade do documento. Cada mídia tem um determinado período de duração ou logo se torna obsoleta, portanto, também não oferece garantias para o acesso a esses dados no futuro.
Mais tarde, grandes transformações aconteceram a partir da Segunda Guerra Mundial, decorrentes das evoluções científicas e dos avanços tecnológicos ocorridos em diversas áreas. Com o advento da internet, o surgimento das grandes redes e dos sistemas de informação resultou em fenômenos como o dilúvio de informações, o Big Data e a e-Science. Nesse cenário, termos como open science (Ciência Aberta), humanidades digitais, compartilhamento, repositórios digitais, interoperabilidade, gestão de dados científicos e curadoria digital têm sido cada vez mais utilizados pela comunidade científica e têm lançado novos desafios para a atuação do bibliotecário no panorama da Ciência Aberta e na gestão de dados de pesquisa.
Assim, questiona-se: como a literatura nacional e internacional está evidenciando o papel do bibliotecário na gestão e curadoria de dados abertos? Conforme Bécard et al. (2016, p. 2, tradução nossa[1]), a gestão de dados abertos “[...] consagra o compartilhamento e a reutilização da produção científica como princípio básico para a participação da ciência em uma sociedade mais aberta, inovadora e inclusiva”. Por sua vez, Mesguich et al. (2012, p. 25, tradução nossa[2]) afirmam que “[...] a curadoria consiste em identificar vários conteúdos digitais de acordo com um determinado tema, selecionar e filtrar os mais relevantes, organizá-los, estruturá-los[...]” por meio de dispositivos digitais visando a promover sua disseminação e uso.
Assim, o objetivo deste artigo é realizar uma busca na base de dados Web of Science (WoS) a fim de subsidiar uma revisão sistemática de literatura e de, com isso, vislumbrar o cenário nacional e internacional da atuação do bibliotecário na gestão de dados de pesquisa e investigar, por um lado, o que a literatura científica evidencia a respeito da relação entre a gestão de dados científicos e o envolvimento do bibliotecário e também, por outro lado, se há trabalhos que traçam um novo perfil para atuar nessa área e se há uma nomenclatura específica que define o bibliotecário de dados ou se a literatura indica o bibliotecário acadêmico como o mais adequado ou as bibliotecas universitárias como as mais adequadas para atender a essa demanda.
2 Contextualização do tema
Atualmente, os cientistas de todas as áreas do conhecimento têm como desafios gerenciar e armazenar o enorme volume de dados gerados em suas pesquisas. As principais agências de fomento do mundo (National Science Foundation; Economic and Social Research Council; entre outras) e também do Brasil (Fundação de Amparo à Pesquisa do Estado de São Paulo) passaram a exigir que os pesquisadores submetam o plano de gestão de dados[3], documento formal em que se descreve como os dados produzidos pela pesquisa serão gerenciados, armazenados, preservados e divulgados em repositórios confiáveis de dados, pressupondo-se que, além do gerenciamento, “Os dados devem ser tão abertos quanto possível e tão fechados quanto necessário.” (DIGITAL SCIENCE; FIGSHARE, 2017, p. 5, tradução nossa[4]).
Nessa perspectiva, a Royal Society of London (2012) afirma que a pesquisa aberta é o cerne da atividade científica; portanto, a publicação de teorias científicas, de dados experimentais e observacionais etc., corroborando o pensamento de Karl Popper (1999) de que os cientistas devem pôr a sua teoria à prova, permitindo assim que outros identifiquem erros nela ou a apoiem, rejeitem ou refinem também pode ser aplicada à reutilização de dados para maior compreensão e conhecimento.
Seguindo esse raciocínio da abertura dos dados e da ciência em diferentes esferas e níveis da sociedade, diversos periódicos científicos eletrônicos internacionais, os megajournals e os overlay journals (revistas de sobreposição, em tradução literal) também passaram a exigir de seus autores a disponibilização dos dados de pesquisa em repositórios de acesso aberto, sendo esta mais uma forma de seguir os princípios da Ciência Aberta, com avaliação aberta por pares, e de prevenir más condutas, fraudes e fabricação nos dados de pesquisa.
O incentivo à adoção das práticas de compartilhamento da Ciência Aberta também se relaciona com a e-Science, movimento que estimula o uso de plataformas computacionais avançadas como ferramenta de apoio à pesquisa e que fomenta as práticas de produção colaborativa do conhecimento científico. A e-Science define-se como a infraestrutura que visa permitir aos cientistas e pesquisadores acessar remotamente os dados científicos primários, movê-los, manipulá-los, extraí-los e inclusive criar, a partir deles, novas aplicações (HEY; HEY, 2006). No entanto, a Ciência Aberta defende uma infraestrutura e um uso de softwares open source, enquanto a e-Science admite o uso de ferramentas proprietárias para a manipulação dos dados.
Diante desse panorama, Costa e Cunha (2014) esclarecem que o bibliotecário lidará com uma série de implicações relacionadas aos dados e à comunicação científica, ademais, serão gerados efeitos nos serviços e produtos de informação, nas bibliotecas digitais, nas bases de dados, nas ações em preservação digital, na atuação bibliotecária, entre outros. Ainda de acordo com esses autores, os dados brutos oriundos de pesquisas científicas podem ser reutilizados e assim podem servir de base para novas pesquisas e expor novos olhares e perspectivas de ideias ou teorias não desenvolvidas pelos pesquisadores originais. Por esse prisma, no contexto da Ciência Aberta, o compartilhamento e reuso dos dados também visa à inovação.
Desse modo, as ideias supracitadas se relacionam com o pensamento de Thomas Kuhn (2011), em seu livro A estrutura das revoluções científicas e com a noção de mudança de paradigma. Apesar das críticas por parte de diversos estudiosos e da polissemia gerada pelo uso desse termo pelo próprio autor na obra, há um conceito basilar que constituiu a história da ciência: a ciência passa por períodos de crise e revoluções; portanto, não evolui gradualmente para a verdade. Assim, para ilustrar de que maneira uma mudança de paradigma poderia fazer com que a mesma informação fosse vista de forma diferente, Kuhn (2011) usou uma famosa ilustração[5] que também foi utilizada por Wittgenstein (Figura 1).
Os dados podem ser usados e interpretados de formas diferentes por cada indivíduo, assim como se permite reutilizá-los em diferentes contextos e por diversos pesquisadores. Os olhares e as perspectivas para os mesmos dados ampliam-se, contribuindo para o avanço da ciência e para o surgimento de novas descobertas e de novos paradigmas.
Logo, para que o bibliotecário possa lidar com essa realidade, será preciso investigar quais são as estratégias que vêm sendo adotadas em outras bibliotecas mundialmente e de que forma o profissional tem se reinventado a fim de atuar no atendimento dessas demandas. A seguir, apresentar-se-á o processo de busca realizado a fim de recuperar materiais que mostram de que forma o bibliotecário tem se inserido nos serviços relacionados à gestão dos dados de pesquisa
3 Materiais e métodos
Para a construção deste artigo, utilizou-se como método a revisão sistemática porque permite potencializar o processo de busca, auxilia na construção da revisão de literatura e permite encontrar resultados de forma sistemática e organizada, além de estabelecer critérios de seleção mais adequados para o desenho e análise do estudo. Não se trata apenas de uma exposição linear e descritiva sobre um tema; a revisão sistemática deve constituir-se na forma de um trabalho reflexivo, crítico e revelador do devido grau de compreensão acerca do material analisado e previamente selecionado no processo de busca sistemática. (COSTA; ZOLTOWSKI, 2014; FERNÁNDEZ-RÍOS; BUELA-CASAL, 2009).
A revisão sistemática é um levantamento de estudos publicados anteriormente e relacionados com um tema específico. Comumente, os dados levantados são sumarizados, apresentados e discutidos e são apontadas possíveis lacunas na literatura científica. O intuito é buscar respostas, geralmente, ligadas à questão de pesquisa daquele que empreende uma investigação em que se utiliza a revisão sistemática. Para tal, definir claramente um problema/pergunta é uma das primeiras estratégias de busca desse tipo de método. Posteriormente, podem ser estabelecidos critérios de inclusão e exclusão, tais como intervalo de tempo (últimos cinco anos, por exemplo), escolha de descritores, bases de dados e outras características que possam ajudar no delineamento da pesquisa, para análise futura, síntese e interpretação dos resultados. (COSTA; ZOLTOWSKI, 2014; HOHENDORFF, 2014; PETTICREW; ROBERTS, 2006; SAMPAIO; MANCINI, 2007).
A revisão sistemática difere de um artigo de revisão de literatura: este último caracteriza-se por um vasto levantamento da literatura sobre um determinado tema em que se apresentam todas as correntes de pensamento e em que se faz a análise crítica desses materiais já publicados; nessa análise, destaca-se o avanço das pesquisas na temática abordada. A revisão de literatura pode, inclusive, englobar revisões sistemáticas e metanálises, isto é, sumariza estudos anteriores para os leitores a fim de mostrar o estado da arte em determinada área de estudo (AMERICAN PSYCHOLOGICAL ASSOCIATION, 2012; BEM, 1995; EISENBERG, 2000; HOHENDORFF, 2014; PETTICREW; ROBERTS, 2006).
A revisão sistemática, necessariamente, define critérios de busca específicos, tais como bases de dados ou outras fontes de informação, escolha de descritores, abrangência (ano, local de publicação, idioma etc.); além disso, tem foco principal na apresentação dos dados referentes a esse processo sistemático de busca, em que se discriminam quantos registros foram recuperados, quais os estudos realizados, assim como demonstra as lacunas identificadas na literatura. Já as metanálises analisam estatisticamente o agrupamento dos resultados de estudos prévios sobre uma temática (HOHENDORFF, 2014).
Diante do exposto, nota-se que a revisão sistemática estabelece etapas básicas a serem seguidas para a execução da investigação, conforme os passos descritos na Figura 2 a seguir.
Considerando o bibliotecário um ator importante no contexto da gestão e na curadoria de dados de pesquisa, optou-se por realizar uma revisão sistemática da literatura com a finalidade de verificar as produções no âmbito internacional e nacional na base de dados Web of Science (WoS). A Web of Science é uma base de dados referencial com resumos, multidisciplinar, que possui mais de nove mil periódicos indexados e está disponível no Portal de Periódicos da Capes. É composta pelas bases Science Citation Index Expanded; Social Sciences Citation Index; Arts and Humanities Citation Index; Conference Proceedings Citation Index-Science (CPCI-S); Conference Proceedings Citation Index-Social Science & Humanities (CPCI-SSH).
Para a sistematização da etapa inicial de busca, foram utilizados os descritores: librar*, research data management e research data, e por fim, estruturou-se a string (librar*) AND TÍTULO: (research data management) OR TÍTULO: (research data). Utilizou-se o prefixo librar acompanhado do sinal de * (asterisco) para recuperar todas as variações da palavra library (biblioteca) e librarian (bibliotecário). Obtiveram-se, como resultado desta primeira etapa, 955 registros (Figura 3), dos quais a maioria é composta por artigos estrangeiros e um número pequeno é de artigos nacionais.
Dando continuidade à etapa de filtragem e seleção dos artigos, de acordo com a figura supracitada, aplicaram-se os seguintes filtros: a) Tipos de documento: (article); b) Categorias da Web of Science: (Information Science Library Science); c) Anos de publicação: (2014 a 2018); d) Tipos de idiomas: (inglês, português, espanhol). Após essa fase, foram recuperados 77 artigos.
Estabeleceram-se os seguintes parâmetros e critérios de inclusão nessa busca: a) Presença dos descritores supracitados no título; b) Apresentação dos conceitos de research data management (gestão de dados de pesquisa) e research data (dados de pesquisa) presentes no texto. Evidentemente, a busca poderia ter contemplado a localização de materiais em qualquer parte do texto e não apenas no título, mas, para os fins deste artigo, optou-se pela busca de trabalhos que contivessem os termos escolhidos inter-relacionados no título.
Como critério de exclusão, eliminaram-se as categorias Computer Science Information Systems, Computer Science Interdisciplinary Applications, Health Care Sciences Services e Medical Informatics, que ainda apareciam atreladas aos resultados filtrados na opção de análise dos resultados na WoS. Por fim, obteve-se o total de 61 artigos. Após essa etapa, excluiu-se mais um artigo, pois o assunto principal não era condizente com a temática a ser abordada, e excluíram-se mais sete registros por serem duplicações, perfazendo o número final de 54 artigos[6] (Figura 3).
A partir dos resultados obtidos na base de dados Web of Science, também é possível fazer cruzamentos e análise dos dados recuperados em sua própria interface, portanto, isso também auxiliou nos procedimentos e na instrumentalização da revisão sistemática.
Por fim, para o processamento dos dados textuais obtidos por meio da busca, optamos pelo software Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires (Iramuteq) porque oferece vários tipos de análises, tais como: estatísticas textuais clássicas; cálculo da quantidade, frequências, redução de palavras; identificação de formas ativas como verbos, substantivos e adjetivos e suplementares, como artigos, preposições e conjunções; especificidades, associação de palavras e variáveis de caracterização; classificação hierárquica descendente, entre muitas outras funções específicas de análise textual.
4 Resultados e discussão
Inicialmente, a análise dos artigos selecionados realizou-se por meio da leitura integral dos resumos e dos estudos para a localização de termos e conceitos relacionados ao papel do bibliotecário na gestão e curadoria de dados de pesquisa presente nesses estudos. Posteriormente, os resumos desses trabalhos foram sistematizados em um corpus textual e processados no Iramuteq (Figura 4). O corpus analisado foi composto por 54 textos, representando os resumos dos 54 artigos, com uma média de 193,15 ocorrências por texto, totalizando 11.782 ocorrências (número total de palavras contidas no corpus).
Outro recurso utilizado foi a criação de uma nuvem de palavras com o maior número de ocorrências nos corpora textuais. Para ilustrar, vejamos o exemplo na Figura 5
O Quadro 2 apresenta as cinco palavras mais recorrentes em todos os textos selecionados, assim como a devida tradução, o número de ocorrências e a sua concordância e relações do termo com os assuntos tratados nos textos.
Vale ressaltar que, nos 54 textos, a palavra academic ocorre sempre próxima ou associada a librarian (bibliotecário) e a library (biblioteca), entretanto, nem todos os textos apresentaram o termo data librarian. Portanto, pode-se inferir, a partir desses indícios, que a tarefa de gerenciar dados de pesquisa vem sendo cada vez mais atribuída ao bibliotecário que atua em bibliotecas universitárias, apesar de não se limitar apenas a este.
No Quadro 3 a seguir, dispõem-se os registros recuperados na base de dados Web of Science. Há textos sobre gestão de dados de pesquisa e sobre curadoria de dados, muitos relatos de experiência e capacitação dos bibliotecários para atuar nesse novo nicho, pesquisas relacionadas ao estabelecimento de padrões e políticas de gestão de dados, estudos métricos e citações relacionadas aos dados, ciclo de vida dos dados e da pesquisa etc. Entretanto, em poucos dos artigos recuperados na base menciona-se de forma explícita o termo bibliotecário de dados, com ocorrências mínimas, portanto, denotando bastante atenção e foco nas práticas e processos para a implantação de serviços em gerenciamento de dados científicos.
Talvez, isso ocorra porque os estudos recuperados, em sua maioria, são relatos de experiências, tratam de questões pragmáticas e operacionais, sem se prender estritamente aos aspectos ligados às competências que o bibliotecário deve ter para atuar no gerenciamento de dados de pesquisa. Embora alguns desses artigos abordem o assunto, há maior ênfase na capacitação da equipe para lidar com essa nova demanda. O Quadro 3 apresenta os registros selecionados no processo de busca, assim como as relações estabelecidas entre as publicações.
Num dos artigos recuperados, de Xia e Wang (2014), são apontadas as responsabilidades e competências do bibliotecário de dados para atuar no gerenciamento de dados de pesquisa das Ciências Sociais. Assim, o estudo elenca como requisito que os profissionais tenham experiência em métodos e softwares estatísticos; em serviços de bibliotecas universitárias; em dados espaciais, dados numéricos e informação governamental; em desenvolvimento de pesquisas acadêmicas; em gestão, supervisão e liderança; em conhecimento em Tecnologia da Informação (Web e programação); em serviços de dados; em ensino e treinamento; em arquivamento e preservação digital; em repositórios de dados; em documentação de dados e metadados, gerenciamento de dados; em concessões de dados; em bases de dados; em análise de dados; em criação e coleta de dados e em compras e contratos relacionados a dados.
Os autores supracitados fornecem evidências de que as principais qualificações exigidas dos bibliotecários de Ciências Sociais são competências técnicas, embora também tenham sido identificadas outras competências comportamentais, a exemplo de comunicação, gestão e liderança.
No estudo de Hans Jørn Nielsen e Birger Hjørland (2014), discutem-se a curadoria de dados, o papel do bibliotecário e as responsabilidades das bibliotecas nessa atividade, além de serem apresentados alguns conceitos e tipologias sobre dados apoiados na tríade dados-informação-conhecimento. De todos os artigos recuperados na WoS, este tem uma conclusão interessante: os autores abordam a curadoria e gestão de dados de pesquisa na perspectiva das bibliotecas de pesquisa (research libraries) e consideram ser difícil para as bibliotecas e para os profissionais da informação assumir um papel de liderança na curadoria de dados, uma vez que as qualificações dos profissionais da informação a serem exigidas mudarão o seu papel, dando lugar a uma outra faceta como especialista em documentação científica ou em dados e ainda como especialista em informação e conhecimento.
Nesse artigo, os autores consideram importante a atuação do bibliotecário na gestão de dados, como na criação e coleta de dados e no processo de curadoria. Sobre a curadoria de dados, Nielsen e Hjørland (2014) advertem que esse processo é diferente da indexação de um documento; portanto, devem ser considerados os conceitos e ideias que os bibliotecários têm sobre o que é um documento. Os autores, inclusive, recorrem à obra seminal de Suzanne Briet, intitulada O que é a documentação?, para apoiar o seu argumento.
A fim de comprovar a relação dos temas extraídos a partir das cinco palavras com maior ocorrência, utilizou-se o grafo da análise de similitude (Figura 6). Esse tipo de análise baseia-se na teoria dos grafos e é frequentemente utilizado para identificar as coocorrências entre as palavras, e seu resultado traz indicações das relações entre as palavras, auxiliando na identificação da estrutura do conteúdo de um corpus textual. Além disso, permite identificar as partes comuns e as especificidades em função das variáveis descritivas identificadas na análise.
Grafo da análise de similitude
Fonte: Dados da pesquisa.Dentro do recorte dos últimos cinco anos e de idioma (inglês, português e espanhol) sobre a produção em gestão de dados de pesquisa, os textos estão majoritariamente em língua inglesa; apenas dois artigos estão em português do Brasil e dois em espanhol.
Diante da diversidade de instituições produtoras de conhecimento em gestão de dados científicos e da predominância de zonas geográficas como os Estados Unidos e Europa, destaca-se a pesquisa internacional empreendida por Cox et al. (2017), na qual os autores relatam um estudo sobre as atividades, os serviços e os recursos de gerenciamento de dados de pesquisa em bibliotecas do ensino superior. A pesquisa foi aplicada em bibliotecas universitárias da Austrália, do Canadá, da Alemanha, da Irlanda, da Holanda, da Nova Zelândia e do Reino Unido. Nestes países, há a predominância de serviços em consultoria e suporte a planejamento de gerenciamento de dados e de realização de treinamentos, com forte apelo para a conscientização e o advocacy para o compartilhamento e gestão de dados de pesquisa ao invés do foco em serviços técnicos, por exemplo, a disponibilização de um catálogo de dados e curadoria de dados.
A pesquisa revela que as habilidades necessárias para a curadoria de dados ainda estão sendo desenvolvidas, porque, afinal, não se encontram em estágio consistente e estabelecido, sendo uma das grandes preocupações das bibliotecas pesquisadas. Outros desafios são apresentados no estudo dos autores, como a mobilização de recursos, os serviços de suporte e a contratação de pesquisadores e de outros profissionais para montar a equipe.
Faniel e Connaway (2018) fizeram uma pesquisa qualitativa a respeito da experiência em gestão de dados científicos nos Estados Unidos. A pesquisa evidenciou que os bibliotecários já tinham experiência no gerenciamento de dados e que costumavam fornecer auxílio aos pesquisadores e dar suporte em suas pesquisas, elaborando planos de gestão de dados ou gerindo dados de pesquisa, além de ajudarem no depósito dos dados em repositórios etc., principalmente na oferta do apoio através de consultas, treinamentos e divulgação.
Contudo, as autoras mostram que muitos bibliotecários alegaram não ter tempo, verba ou todos os conhecimentos necessários para prestar todos os serviços relacionados aos dados. Até os repositórios digitais foram alvo de observação nas respostas dos bibliotecários participantes da pesquisa: os bibliotecários veem o repositório como facilitador no armazenamento e preservação dos dados, reconhecem os repositórios disciplinares existentes e confiam neles, mas existe a preocupação daqueles que desejam utilizar o repositório institucional de precisar considerar todos os requisitos técnicos e de segurança, os protocolos e as estratégias de preservação digital, além do espaço de armazenamento para a preservação dos dados.
Yoon e Schultz (2017), por sua vez, examinaram 185 sites de bibliotecas universitárias americanas para saber se estas já forneciam informações e divulgavam serviços especializados para o gerenciamento de dados de pesquisa. Os resultados desse estudo mostram que há variações entre os serviços e programas de gestão de dados das bibliotecas e que ainda é preciso melhorar a oferta de informações online; de forma mais ativa, a prestação do serviço e os treinamentos.
Tripathi, Shukla e Sonker (2017) buscaram estudar os serviços de gerenciamento de dados implantados nas melhores bibliotecas universitárias do mundo. A partir da identificação das estratégias, das práticas e das ferramentas indicadas por essas bibliotecas, os autores recomendaram uma série de passos para que as bibliotecas indianas possam seguir para a implantação dos mesmos serviços relacionados ao gerenciamento de dados.
Van den Eynden e Corti (2017) apresentam uma realidade privilegiada e distinta de outros países ao declarar que o compartilhamento e a publicação de dados de pesquisa em Ciências Sociais têm uma longa história no Reino Unido, pois, nesse país, isso é uma exigência, e inclusive são comuns os acordos com as agências de fomento à pesquisa e do governo para compartilhar dados de pesquisa e para prover infraestrutura e serviços de dados com o apoio do Conselho de Pesquisa Econômica e Social, além de já ter sido estabelecida uma política de dados.
Isso só é possível porque no Reino Unido há uma antiga tradição de desenvolvimento de procedimentos e protocolos de gerenciamento, processamento, documentação e publicação de dados, já que os dados seriam reutilizados internamente. Esse modelo, aliás, serviu como exemplo para a criação de dados mais robustos na atualidade e para a implantação de repositórios como o ReShare no país.
Wolski, Howard e Richardson (2017) trazem a gestão de dados de pesquisa inserida num contexto maior: a Ciência Aberta. De acordo com os autores, há um interesse mundial no potencial da Ciência Aberta para aumentar a qualidade, o impacto e os benefícios da ciência e das pesquisas, visto que ela prima por aspectos como a transparência, a qualidade e a proveniência dos dados.
Os autores fazem uma revisão crítica da literatura e se baseiam na questão da confiança no ambiente acadêmico aberto, utilizando laboratórios virtuais como foco para a discussão. A partir disso, propõem um modelo das questões relevantes dentro dos serviços e ferramentas de dados e pesquisas online.
Morgan, Duffield e Hall (2017) realizaram uma pesquisa sobre gestão de dados de pesquisa em bibliotecas australianas. As autoras destacaram que apesar das diferenças entre as instituições, climas organizacionais e políticos, cada uma das bibliotecas desenvolveu à sua própria maneira estratégias e serviços que funcionaram bem dentro de sua realidade. Além disso, algumas apostaram no atendimento individualizado e personalizado do seu público.
Outras pesquisas apontam a necessidade de estabelecer padrões e políticas de gestão de dados para periódicos científicos, envolvendo inclusive a revisão por pares, conforme os estudos de Sturges et al. (2015), Naughton e Kernohan (2016) e Murphy (2016), recuperados na WoS.
Naughton e Kernohan (2016) apresentam os resultados da primeira fase do projeto Journal of Research Data policy bank (JoRD)[7]. O projeto executou uma análise de 250 políticas de dados de pesquisa em periódicos científicos com a finalidade de viabilizar um registro de políticas para auxiliar pesquisadores e equipes de suporte no cumprimento de requisitos de publicação de dados científicos.
Os autores evidenciaram que o ecossistema atual das políticas de dados de pesquisa necessita urgentemente de padronização, principalmente, antes da criação de serviços de dados. Assim, propõem avançar na infraestrutura de pesquisa baseada em políticas legíveis por máquina que suportem um ambiente de comunicação aberto.
Verbaan e Cox (2014) entrevistaram funcionários de bibliotecas, equipes de Tecnologia da Informação (TI) e administradores para entender a visão de cada um desses atores a respeito da gestão de dados de pesquisa. Essa investigação mostrou que apenas os bibliotecários reivindicavam seu lugar no gerenciamento de dados de pesquisa, especialmente na preservação e em advocacy. As equipes de TI estavam circunscritas apenas à preocupação com o espaço de armazenamento em curto prazo e à infraestrutura necessária para a implantação desses serviços. Outros departamentos alegaram falta de recursos para empreender esse tipo de projeto.
Em suma, o bibliotecário tem exercido o seu papel na gestão e curadoria de dados através do apoio e auxílio aos pesquisadores, na implantação de serviços de dados, com a criação de repositórios ou em orientações sobre qual a melhor escolha para depósito de dados de pesquisa, na descrição de metadados e dos dados científicos, na formação de competências necessárias para que os usuários aprendam a utilizar dados de pesquisa de forma eficiente, no estabelecimento de políticas e diretrizes para uma gestão, preparação e compartilhamento dos dados de maneira mais eficiente e eficaz, entre outras atividades. Todos os artigos recuperados na WoS afirmam a relevância da capacitação dos bibliotecários e de sua equipe para atuar nesses serviços.
5 Conclusão
A gestão de dados de pesquisa possui um amplo escopo, demonstrando-se um assunto multidisciplinar e que não é exclusividade da área de Biblioteconomia e Ciência da Informação, conforme foi evidenciado nas primeiras estratégias de busca na WoS e antes da aplicação dos critérios de seleção e exclusão dos artigos. Logo, há estudos sobre esse assunto em diferentes áreas, inclusive na área médica, com destaque para os registros e prontuários de paciente, e até em medicina veterinária.
Ademais, é necessário enfatizar que, no panorama internacional, a temática não é nova e isso se reflete no número de artigos que abordaram relatos de experiências e iniciativas voltadas para a curadoria e gestão de dados de pesquisa e o papel das bibliotecas, dos bibliotecários e dos demais autores envolvidos (instituições, governo, pesquisadores etc.).
No Brasil a temática vem crescendo e ganhando contornos cada vez mais interessantes, apesar do baixo número de artigos brasileiros recuperados na WoS. São muitas as perspectivas e ramos em que o bibliotecário pode atuar na gestão de dados de pesquisa, e isso é deveras sinalizado em todos os estudos recuperados.
Outra evidência encontrada é o uso do termo bibliotecário de dados em outros estudos e em livros sobre o gerenciamento de dados de pesquisa em outras fontes e bases de dados – livros inclusive mais antigos do que o intervalo de datas selecionado.
Também já é possível encontrar em alguns estudos brasileiros o termo bibliotecário de dados: a) em estudos de Murilo Bastos da Cunha do ano 2010, em que o pesquisador já chamava a atenção para a importância de a biblioteca e o bibliotecário se preocuparem com a gestão de dados de pesquisa; b) em estudos mais recentes, tais como o de Luís Fernando Sayão, Luana Farias Sales e Fabiano Couto Corrêa Silva. Contudo, nem todos estes estudos citados foram recuperados na busca empreendida na WoS.
Apesar disso, o que se percebe na qualidade dos estudos internacionais sobre o tema em relação ao Brasil e a outros países da América Latina é que nos Estados Unidos e na Europa, os dados de pesquisa já estão bem avançados em termos de discussões e ações eficazes. Por outro lado, nos Estados Unidos e na Europa, as políticas e estratégias de acesso aberto foram bastante lentas em relação aos países da América Latina, onde nosso país é pioneiro e tem tido participação ativa.
Sobre os repositório de dados, há oito que são brasileiros registrados no Registry of Research Data Repositories (RE3Data)[8]; entretanto, apenas alguns são genuinamente do Brasil e não têm parceria com outros países, a exemplo do Dataverse do Instituto Brasileiro de Ciência e Tecnologia (Ibict)[9], a Base de Dados Científicos da Universidade Federal do Paraná (UFPR)[10] e o Centro de Documentação e Acervo Digital da Pesquisa (Cedap) da Universidade Federal do Rio Grande do Sul (UFRGS)[11]. Estes dois últimos repositórios implantaram serviços de gestão de dados de pesquisa.
No Brasil e em outros países da América Latina, por exemplo, as discussões e ações estão em curso, mas ainda são incipientes se compararmos ao cenário atual. Esse contraste revela que os países latino-americanos têm pouca visibilidade e representatividade na arena internacional da curadoria e gestão de dados científicos, principalmente em relação aos papéis que o bibliotecário precisa desempenhar para acompanhar essa tendência.
Especialmente o Brasil, país líder em acesso aberto, livre e gratuito em suas publicações científicas, precisa buscar sua inserção nesse cenário, precisa buscar meios de planejar, estudar e implantar a gestão de dados de pesquisa. Então, qual seria a estratégia inicial recomendada? O que deveria ser uma prioridade para o Brasil e para outros países da América Latina para avançar nas discussões e ações de implementação para o gerenciamento de dados de pesquisa?
Não temos todas as respostas, mas apostamos no engajamento dos pesquisadores e profissionais da área de Biblioteconomia e Ciência da Informação e na necessidade de estudo, treinamento e capacitação de todos os atores envolvidos na gestão de dados de pesquisa, (pesquisadores, bibliotecários, gestores, governantes etc.) visando adquirir novas competências. Afinal, há novas vertentes a explorar e com as quais aprender nas tarefas envolvidas na gestão de dados de pesquisa.
Referências
AKOBENG, A. K. Understanding systematic reviews and meta-analysis. Archives of Disease in Childhood, [s.l.], v. 90, p. 845-848, 2005.
AMERICAN PSYCHOLOGICAL ASSOCIATION. Manual de publicação da APA. 6. ed. Porto Alegre: Penso, 2012.
BÉCARD, N. et al. Ouverture des données de la recherche. Guide d'analyse du cadre juridique en France. 2016. Disponível em: https://prodinra.inra.fr/ft?id={E391647B-3125-4020-96C4-2E4EA78CCA66}&original=true. Acesso em: 08 fev. 2019.
BEM, D. J. Writing a review article for Psychological Bulletin. Psychological Bulletin, [s.l.], v. 118, n. 2, p. 172-177, 1995.
COSTA, A. B.; ZOLTOWSKI, A. P. C. Como escrever um artigo de revisão sistemática. In: KOLLER, S. H.; COUTO, M. C. P. P.; HOHENDORFF, J. V. (org.). Manual de produção científica. Porto Alegre: Penso, 2014. Cap. 3.
COSTA, M. M.; CUNHA, M. B. O bibliotecário no tratamento de dados oriundos da e-science: considerações iniciais. Perspectivas em Ciência da Informação, Belo Horizonte, v. 19, n. 3, p. 189-206, 2014.
COX, A. M. et al. Developments in research data management in academic libraries: towards an understanding of research data service maturity. Journal of the Association for Information Science and Technology, [s.l.] v. 68, n. 9, p. 2182-2200, 2017.
CUNHA, M. B. A biblioteca universitária na encruzilhada. DataGramaZero, Rio de Janeiro, v. 11, n. 6, dez. 2010.
DIGITAL SCIENCE. Figshare. The State of Open Data 2017: a selection of analyses and articles about open data. London: Figshare, 2017.
EINSENBERG, N. Writing a literature review. In: STERNBERG, R. J. Guide to publishing in psychology journals. Cambridge: Cambridge University Press, 2000. p. 17-34.
FANIEL, I. M.; CONNAWAY, L. S. Librarians’ perspectives on the factors influencing research data management programs. College & Research Libraries, [s.l.] v. 79, n. 1, p. 100, jan. 2018.
FERNÁNDEZ-RÍOS, L.; BUELA-CASAL, G. Standards for the preparation and writing of Psychology review articles. International Journal of Clinical and Health Psychology, [s.l.] v. 9, p. 329-344, 2009.
HEY, T.; HEY, J. e-Science and its implications for the library community. Library Hi Tech, Bingley, v. 24, n. 4, p. 515-528, 2006.
HOHENDORFF, J. V. Como escrever um artigo de revisão de literatura. In: KOLLER, S. H.; COUTO, M. C. P. P.; HOHENDORFF, J. V. (org.). Manual de produção científica. Porto Alegre: Penso, 2014. Cap. 2.
KUHN, T. A estrutura das revoluções científicas. 11. ed. São Paulo: Perspectiva, 2011. 260 p.
MESGUICH, V. et al. Enjeux et dimensions. Documentaliste-Sciences de l'Information, Paris, v. 49, n. 1, p. 24-45, 2012.
MORGAN, A.; DUFFIELD, N.; HALL, L. W. Research data management support: sharing our experiences. Journal of the Australian Library and Information Association, [s.l.], v. 66, n. 3, p. 299-305, 2017.
MURPHY, F. An update on peer review and research data. Learned Publishing, [s.l.] v. 29, n. 1, p. 51-53, 2016.
NAUGHTON, L.; KERNOHAN, D. Making sense of journal research data policies. Insights, [s.l.] v. 29, n. 1, p. 84–89, 2016.
NIELSEN, H. J.; HJØRLAND, B. Curating research data: the potential roles of libraries and information professionals. Journal of Documentation, [s.l.] v. 70, n. 2, p. 221-240, 2014.
PETTICREW, M.; ROBERTS, H. Systematic reviews in the social science: a pratical guide. Malden, MA: Blackwell Publishing, 2006.
POPPER, K. Conhecimento objetivo: uma abordagem evolucionária. Belo Horizonte: Itatiaia, 1999. 394 p.
ROYAL SOCIETY OF LONDON. Royal Society Science Policy Centre. Science as an open enterprise: open data for open science. London: Royal Society of London, 2012.
SAMPAIO, R. F.; MANCINI, M. C. Estudos de revisão sistemática: um guia para síntese criteriosa de evidência científica. Revista Brasileira de Fisioterapia, São Carlos, v. 11, n. 1, p. 83-89, 2007.
STURGES, P. et al. Research data sharing: developing a stakeholder-driven model for journal policies. Journal of the Association for Information Science and Technology, [s.l.], v. 66, n. 12, p. 2445–2455, 2015.
TRIPATHI, M.; SHUKLA, A.; SONKER, S. Research data management practices in University libraries: a study. DESIDOC Journal of Library & Information Technology, [s.l.], v. 37, n. 6, p. 417-424, 7 nov. 2017.
VAN DEN EYNDEN, V.; CORTI, L. Advancing research data publishing practices for the social sciences: from archive activity to empowering researchers. International Journal of Digital Library, [s.l.], v. 18, n. 2, p. 113-121, 2017.
VERBAAN, E.; COX, A. M. Occupational sub-cultures, jurisdictional struggle and Third Space: theorising professional service responses to research data management. The Journal of Academic Librarianship, [s.l.] v. 40, n. 3-4, p. 211-219, 2014.
WIKIMEDIA COMMONS. Duck-Rabbit illusion. 2018.
WOLSKI, M.; HOWARD, L.; RICHARDSON, J. A trust framework for online research data services. Publications MDPI, Basel, v. 5, n. 2, p. 14-16, jun. 2017.
XIA, J.; WANG, M. Competencies and responsibilities of Social Science data librarians: an analysis of job descriptions. College & Research Libraries, [s.l.], v. 75, n. 3, p. 362-388, maio 2014.
YOON, A.; SCHULTZ, T. Research data management services in academic libraries in the US: a content analysis of libraries’ websites. College & Research Libraries, [s.l.], v. 78, n. 7, p. 920, out. 2017.
Notas
https://www.re3data.org/search?query=&countries[]=BRA.
https://cedap.ufrgs.br/jspui/handle/2050011959/90.
Autor notes
juliana.lima@ufc.br
vbentes@ufc.br
mgiovannaguedes@gmail.com