Artigo Original
Recepção: 03 Novembro 2021
Aprovação: 26 Janeiro 2022
Publicado: 10 Fevereiro 2022
DOI: https://doi.org/10.5007/1518-2924.2022.e79971
RESUMO
Objetivo: Evidenciar a relevância da recuperação de informação de fontes de dados de terceiros para reuso com propósito de alcançar os Objetivos de Desenvolvimento Sustentável no Brasil.
Método: Desenvolve-se pesquisa exploratória e descritiva de cunho bibliográfico e documental, inspirada nos autores Saracevic e Hjørland, para abordar as noções de relevância aplicadas aos conceitos de metadados e dados de pesquisa e nos processos de representação, recuperação e reuso desses dados, reflete-se qualitativamente sobre conceitos e fenômenos e analisa-se documentos nacionais que contemplem resultados sobre o desenvolvimento sustentável no Brasil e internacionais que possibilitem o reuso de dados.
Resultado: Salienta-se que o reuso de dados de pesquisa científica está assinalado na metodologia dos assuntos apresentados no Relatório Luz 2020 sobre a Agenda 2030 do Grupo de Trabalho da Sociedade Civil e que o Relatório da Oliver Wyman aponta serem as fontes de dados de terceiros, um complemento essencial para os dados tradicionais coletados pelas Organizações Nacionais de Estatística.
Conclusões: A partir dos resultados assinalados, constata-se a necessidade dos dados de pesquisa serem registrados em plataformas de gestão de dados para reuso e a importância do conhecimento prévio do assunto para obtenção de resultados relevantes e eficazes na recuperação da informação para constatação de resultados rumo à Agenda 2030.
PALAVRAS-CHAVE: Reuso de Dados, relevância, recuperação da Informação, agenda 2030.
ABSTRACT
Objective: It highlights the relevance of retrieving information from third party data sources for reuse in order to achieve the Sustainable Development Goals in Brazil.
Methods: exploratory and descriptive research of bibliographic and documentary nature is developed, inspired by the authors Saracevic and Hjørland, to address the notions of relevance applied to the concepts of metadata and research data and in the processes of representation, recovery and reuse of these data, reflects qualitatively about concepts and phenomena and national documents that contemplate results on sustainable development in Brazil and international ones that enable data reuse are analyzed.
Results: It should be noted that the reuse of scientific research data is indicated in the methodology of the subjects presented in the Luz 2020 Report on the 2030 Agenda of the Civil Society Working Group and that the Oliver Wyman Report points out that they are the data sources of third parties, an essential complement to the traditional data collected by the National Statistical Organizations.
Conclusions: Based on the results indicated, there is a need for research data to be registered on data management platforms for reuse and the importance of prior subject knowledge in order to obtain relevant and effective results in the information retrieval to verify results towards the 2030 Agenda.
KEYWORDS: Data Reuse, relevance, information Retrieval, 2030 Agenda.
INTRODUÇÃO
No processo contemporâneo de gestão, curadoria, disponibilização, compartilhamento e reuso de dados científicos, analisa-se a relevância da informação como a “alquimia” da quadríade dado-informação-sociedade-governo que mensura a eficácia entre a origem e o destino do processo de comunicação. A relevância na Recuperação de Informação (RI) circunda a motivação, a representação e a interpretação e os assuntos que fazem parte do conjunto de dados científicos e governamentais arquivados em uma plataforma de gestão. Para Saracevic (1975), relevância foi a noção-chave no surgimento da Ciência da Informação (CI) e permanece como fundamento básico na maioria de suas teorias e em toda a sua prática.
A partir dessas perspectivas, possibilitar a RI eficaz, em sistemas de informação que sejam constituídos por dados de pesquisas científicas e governamentais, é ação necessária e indispensável para o desenvolvimento global, a transparência das informações e a sustentabilidade da sociedade.
O lançamento, em 2015, da Agenda 2030 para os Objetivos de Desenvolvimento Sustentável (ODS) proporcionou aos governos uma estrutura organizada e unificada para abordar questões de desenvolvimento interligadas, como pobreza, desigualdade econômica, educação, crise climática, paz, justiça, consumo responsável e produção (ONUBR, 2015).
Em consonância com tais intenções, encontra-se a avaliação realizada pelo Grupo de Trabalho da Sociedade Civil para a Agenda 2030, na IV edição do Relatório Luz da Sociedade Civil sobre a Agenda 2030 no Brasil, que registra dados e a ausência destes em um momento extremamente desafiador na história recente global - a pandemia da Covid19 -, que expõe de forma cruel os desafios de um país marcado por imensas desigualdades (GT AGENDA 2030, 2020).
Soma-se a tal estudo, o recente relatório Implementation of sustainable development goals: addressing the data disaggregation challenge in the GCC, publicado pela Oliver Wyman, que enfatiza a existência de várias barreiras nos países para coleta de dados em torno dos Objetivos de Desenvolvimento Sustentável. O relatório indica a necessidade dos governos de realizarem um processo sistemático de verificação de dados, aumentarem as capacidades das Organizações Nacionais de Estatística (ONE) e ressaltaram a importância do uso de dados de terceiros (SAMMAKIEH; YOUSSEF; SALEM, 2021). Entende-se, neste contexto, dados de terceiros como toda fonte que observe os critérios de série histórica e apresenta metodologia contextualizada e consolidada em sua comunidade sociocientífica, podendo ser decorrente de estudos produzidos pela sociedade civil, organizações não governamentais e pesquisas acadêmicas catalogadas em bibliotecas como SciELO e Portal Capes.
Tais resultados apontam para a necessidade de indexação padronizada por área para a recuperação eficaz nos sistemas de informação que sejam compostos por dados privados, públicos e científicos.
Considerando o reuso como como “todo novo uso de qualquer recurso de pesquisa/coleção de dados” - conforme proposta de Van de Sandt e colaboradores (2019) e citado por Curty (2019) - neste estudo, é dada significativa atenção para o reuso de fontes de dados de terceiros, para demonstração de resultados da implementação e do desenvolvimento de políticas públicas nacionais, não só para avaliação de como está o Brasil em seu percurso para atingir ou não os objetivos de desenvolvimento sustentável, mas também para o avanço científico e governamental.
Para tanto, questiona-se: como a recuperação de informação de fontes de dados de terceiros passa a ser percebida como relevante no rastreamento do progresso dos Objetivos de Desenvolvimento Sustentável no Brasil? De que forma uma plataforma de gestão de dados de terceiros possibilita o reuso de dados e complementa as fontes de dados tradicionais normalmente coletadas por organizações governamentais brasileiras? Por que a visão do conhecimento prévio do assunto pode auxiliar a busca por dados relevantes e informações eficazes para consolidação de relatórios e pesquisas institucionais?
Com o objetivo de evidenciar a relevância da recuperação de informação de fontes de dados de terceiros para reuso, com o propósito de alcançar os Objetivos de Desenvolvimento Sustentável no Brasil, a presente pesquisa reflete sobre o conceito de dados e metadados e analisa registros nacionais que contemplem resultados sobre o desenvolvimento sustentável no Brasil e internacional que trate de reuso de dados. Além disso, investiga a noção de relevância à luz dos autores Saracevic (1975; 2017) e Hjørland (2010), para demonstrar a importância de uma representação consistente dos dados no que tange à eficácia da recuperação de informação. Sublinha-se que essa representação consistente é realizada por meio da atribuição de metadados e da adoção de padrões que devem ser conhecidos tanto pelo produtor quanto pelo consumidor dos dados e informações, ampliando assim sua relevância e a possibilidade de reuso. Por fim, apresenta considerações registradas no Relatório Luz 2020 sobre a Agenda 2030, do Grupo de Trabalho da Sociedade Civil, e no relatório publicado pela Oliver Wyman.
A presente pesquisa é de natureza exploratório-descritiva, valendo-se de uma abordagem qualitativa para o estudo dos conceitos e fenômenos encontrados. Inicialmente, realizam-se pesquisas bibliográfica e documental. A pesquisa bibliográfica é realizada com o intuito de levantar e explorar o conceito de relevância e suas confluências com recuperação da informação, dados e reuso de dados de pesquisa na produção acadêmica brasileira na Ciência da Informação. Utiliza-se como fonte de pesquisa a Base de Dados em Ciência da Informação (BRAPCI), no mês de janeiro de 2021. Como estratégia para o levantamento, usa-se a opção “resumo” e a busca por dois conjuntos de termos: (1) “relevância” and “recuperação da informação” e (2) “relevância” and “dados” and “reuso de dados”. Recupera-se, com o primeiro conjunto, 29 documentos e, com o segundo, 2 documentos. A análise dos 31 textos permitiu identificar que a abordagem realizada neste estudo apresenta propostas singulares para se pensar a relevância da recuperação de informação, reuso de dados e os Objetivos de Desenvolvimento Sustentável. Já a pesquisa documental na web é elaborada primeiramente com a finalidade de verificar aspectos sobre dados e metadados em instituições/comunidades de pesquisa que reunissem dados científicos, dados em humanidades e dados em saúde em razão da pandemia da Covid19. A partir dessas premissas, elege-se, para ponderações, o National Science Foundation (NSF), o National Institutes of Health (NIH) e o National Endowment for the Humanities (NEH) e, em um segundo momento, investiga-se documentos substanciais que apresentem abordagens referentes ao reuso de dados de terceiros em alusão aos resultados necessários para se alcançar os ODS da Agenda 2030.
1 NUANCES SOBRE DADOS E METADADOS
Os dados podem assumir formas diferentes, e as definições de dados de pesquisa podem variar de acordo com o domínio do campo e a comunidade de pesquisa.
No âmbito internacional, no campo científico, a definição da NSF descreve os dados como algo "determinado pela comunidade de interesse através do processo de revisão por pares e gestão de programas". Exemplos de dados fornecidos pela NSF incluem dados, amostras, coletas físicas, software, modelos, entre outros.
Conforme a NSF, o acesso público aos dados tem como objetivo acelerar a disseminação de resultados de pesquisas fundamentais que irão avançar as fronteiras do conhecimento e ajudar a garantir a prosperidade futura da nação. A política de gestão de dados da NSF é baseada na compreensão de que a comunicação clara e aberta dos resultados da pesquisa é fundamental para cumprir a missão principal do organismo, de promover o progresso da ciência (NSF, 2015).
Atuando no campo da saúde, o NIH, define os dados da pesquisa como "material factual registrado comumente aceito na comunidade científica como necessário para documentar e apoiar os achados da pesquisa" (NIH, 2021).
De acordo com o NIH, a validação e o progresso na pesquisa biomédica - a pedra angular do desenvolvimento de novas estratégias de prevenção, tratamentos e curas - dependem do acesso a dados científicos. O compartilhamento desses dados ajuda a validar os resultados da pesquisa, permite que os pesquisadores combinem os tipos de dados para fortalecer as análises, facilita a reutilização de dados difíceis de gerar ou de fontes limitadas e acelera as ideias para pesquisas futuras. Central para compartilhar dados científicos é a necessidade reconhecida de tornar os dados o mais disponíveis possível, garantindo que a privacidade e a autonomia dos participantes da pesquisa sejam respeitadas e que os dados confidenciais/proprietários sejam protegidos de forma adequada (NIH, 2021).
O NEH, cuja missão é "desenvolver um sistema prático de coleta de informações e dados nacionais sobre humanidades, acadêmicos, grupos educacionais e culturais e seus públicos” (NEH, 2020), projeta, apoia e dirige uma variedade de projetos de coleta de dados e pesquisa, incluindo pesquisas periódicas. Neste sentido, define dados de pesquisa como "materiais gerados ou coletados durante a realização de pesquisas" e fornece uma variedade de aspectos sobre os dados: estes devem ser válidos, compartilhados, heterogêneos e contextualizados dentro das comunidades de pesquisa.
No entanto, dados só possuem sentido e podem ser utilizados, se um tratamento adequado a eles for fornecido. Esse tratamento se refere à atribuição de “informações suplementares e descrições que informem sobre características como, por exemplo, a proveniência dos dados e o contexto em que eles foram obtidos, os métodos para coleta, registros, transcrição, codificação e/ou processamento dos dados, suas diferentes versões, entre outros” (CURTY, 2019, p.179). Essas informações são registradas pelos metadados.
Entende-se metadados como itens estruturados que descrevem, explicam, localizam e representam outra coisa. Metadados são signos que permitem que os dados sejam encontrados e interpretados, tornando-os informação.
Dentre os muitos modelos existentes de metadados usados na representação de dados de pesquisa, elege-se, para evidenciar características e considerações, o Dublin Core Metadata Initiative (DCMI) por apresentar padrão genérico que oferece a possibilidade de uso em vários perfis de aplicação, permitindo sua adaptação a diversos contextos, objetos e usos e o Data Documentation Initiative (DDI), por ser um padrão de metadados bastante usado na representação de dados de pesquisas em ciências sociais e humanidades - área que muito se vale de dados governamentais no desenvolvimento de suas pesquisas. Tanto o DCMI como o DDI são padrões de metadados que atendem a necessidade do reuso de dados de pesquisa que sejam representativos para demonstração do desenvolvimento local, nacional ou global, nos contextos social, econômico, político e de saúde, atinentes ao interesse desta pesquisa.
O DCMI oferece a facilidade de suporte através de uma página atualizada de Metadata Basics, que destaca as tendências atuais em metadados descritivos no estilo do Dublin Core, visando promover a interoperabilidade por meio do uso de vocabulários compartilhados globalmente, com base nos princípios de linked data. Interessados também podem explorar uma página de glossário, um índice de competência em linked data que enumera as principais habilidades a serem aprendidas para relacionar dados, além de um guia para usuários de termos de metadados DCMI, webinars ocasionais e tutoriais em conferências anuais (DCMI, 2021).
E o DDI, iniciado em 1995, é um padrão internacional para descrever os dados produzidos por pesquisas e outros métodos de observação nas ciências sociais, comportamentais, econômicas e da saúde. A iniciativa é gratuita e pode documentar e gerenciar diferentes estágios do ciclo de vida dos dados de pesquisa, como conceituação, coleta, processamento, distribuição, descoberta e arquivamento. Documentar dados com DDI facilita a compreensão, interpretação e uso - por pessoas, sistemas de software e redes de computadores.
O DDI possibilita gerar livros de código interativos, implementar catálogos de dados, criar bancos de perguntas, criar mapeamentos de concordância, harmonizar e comparar dados e gerenciar conjuntos de dados longitudinais. A segunda versão, também chamada de Codebook do padrão DDI, foi implementada em repositório de dados como Dataverse e em arquivos de dados do Consórcio Interuniversitário para Pesquisa Política e Social (DDI, 2021).
De acordo com Sayão (2010), parcela significativa de autores que registram suas pesquisas sobre o assunto concorda que metadados se encontram em uma tríade conceitual categórica: metadados descritivos, metadados estruturais e metadados administrativos. Apesar dessa divisão possibilitar entendimentos sobre o delineamento das informações encontradas nos dados, ainda pode haver imprecisão nos contornos definidos. Segue a definição do autor de cada categoria:
Metadados descritivos: é a face mais conhecida dos metadados, são eles que descrevem um recurso com o propósito de descoberta e identificação; podem incluir elementos tais como título, autor, resumo, palavras-chave e identificador persistente. Metadados estruturais: são informações que documentam como os recursos complexos, compostos por vários elementos, devem ser recompostos e ordenados. Por exemplo, como as páginas de um livro, digitalizadas separadamente, são vinculadas entre si e ordenadas para formar um capítulo. Metadados administrativos: fornecem informações que apoiam os processos de gestão do ciclo de vida dos recursos informacionais. Incluem, por exemplo, informações sobre como e quando o recurso foi criado e a razão da sua criação. Nessa categoria, estão metadados técnicos que explicitam as especificidades e dependências técnicas do recurso; inclui também os metadados voltados para apoio à gestão dos direitos relacionados ao recurso (SAYÃO, 2010, p. 5).
O gerenciamento adequado de dados deve ocorrer em todo o ciclo de vida dos dados de pesquisa, o que pode ser representado de várias maneiras diferentes, do simples ao complexo. Esse gerenciamento é feito através da atribuição correta dessas três categorias de metadados. Além de servirem como pontos de acesso para recuperação do dado, esses metadados fornecem uma maneira útil de preservar seu significado e guardar o histórico de modificações pelo qual o dado passa ao longo da pesquisa, isto é, sua proveniência.
Para a DDI, as principais fases do ciclo de vida dos dados da pesquisa incluem: Descoberta e Planejamento, Coleta inicial de Dados, Preparação e Análise de Dados, Publicação e Compartilhamento, e Gerenciamento de Longo Prazo. O uso do padrão DDI na gestão do dado de pesquisa pode simplificar o fluxo de trabalho do repositório, auxiliando a admissão, a curadoria e a recuperação eficiente de dados (DDI, 2021).
Como se pode perceber, o aprimoramento de padrões para organização do conhecimento - atendendo as prescrições descritivas, estruturais e administrativas de formato dos metadados - impacta não apenas nas noções de relevância da informação recuperada, mas também na necessidade de um arquivamento adequado dos dados e, consequentemente, no reuso desses dados. Afinal, um dado só é reutilizado quando é preservado, recuperado, acessado e como afirma Curty (2019, p. 179) incluem aspectos como relevância, completude, compreensibilidade e confiabilidade para o escopo da pesquisa.
3 NOÇÕES DE RELEVÂNCIA E SEU IMPACTO NO REÚSO DE DADOS DE PESQUISA
No campo da CI, os estudos que abordam o tema relevância demonstram preocupações com a recuperação da informação. Portanto, relevância, como noção-chave da CI, é considerada uma medida da eficácia do contato entre uma origem e um destino em um processo de comunicação (SARACEVIC, 1975). No que tange à gestão de dados de pesquisa, um dado/informação pode ser considerado relevante quando ele atende às necessidades do pesquisador.
Neste estudo, entende-se a relevância como princípio métrico da recuperação da informação que determina a eficácia do processo de localização e acesso do dado, sua compreensão como informação e sua transformação em conhecimento - o que se estabelece através da interdisciplinaridade ofertada pela interoperabilidade e pelo reuso dos dados de pesquisa,
Quanto à interdisciplinaridade, Saracevic assevera que:
A Ciência da Informação é um campo e uma disciplina que se preocupa com os problemas que surgem na comunicação do conhecimento em geral e com os registros dessa comunicação em particular, tanto do ponto de vista aplicado como do básico. Compartilha essa preocupação com outros campos, notadamente os da biblioteconomia e da documentação [...] (SARACEVIC, 1975, p. 323, tradução nossa).
Destaca-se a importância da elaboração teórico-conceitual no tocante aos dados científicos baseados na análise de domínio. Considerando as peculiaridades dos dados - que são gerados, coletados, processados e analisados de forma diferente, de acordo com a área, com a metodologia e com o contexto da pesquisa -, elaborar um estudo do domínio para cada campo dos dados representa uma curadoria mais eficaz, com maior possibilidade de compreensão do dado recuperado nos sistemas de informação.
A visão da relevância com especificidades na análise de domínio, mais precisamente com o termo “subject knowledge view of relevance”, foi inicialmente desenvolvida no campo da CI por Saracevic, em 1975, e posteriormente abordada em estudos desenvolvidos por Hjørland e Alrechtsen (1995), Hjørland (2001), Hjørland (2002), Hjørland (2010) e, recentemente, retomado por Saracevic (2017) como “topical relevance”.
Contudo, Saracevic (1975) alerta sobre a dificuldade de se estabelecer os critérios da informação relevante ou não, e tal fato se deve aos diversos pontos de vista com os quais se pode olhar a relevância. Para o autor, a relevância é relativa e depende muito do que já se sabe e do que geralmente se conhece, daí a importância da análise de domínio.
Admitem-se vários aspectos na determinação da relevância da informação perquirida, tais como: o que se pensa que se quer e como se pede; como se entende o que é perguntado e o que se pensa que é realmente perguntado; o que é desejado em contraste com o que é realmente necessário; quem é perguntado, quem está perguntando; qual é a situação; e o que será feito com o que é fornecido.
Por outro lado, quando se trata de gestão e curadoria de dados de pesquisa científica e do processo de transformação de informação em conhecimento, a relevância dos dados de pesquisa recuperados pode ser prejudicada pela ausência de conexão desses dados com as publicações científicas onde são discutidos (SALES; SAYÃO, 2012).
Isto acontece porque as publicações ajudam a dar contexto aos dados, assim como os metadados e demais documentos associados. Além disso, a relação desses dados com o seu contexto, amplia o grau de relevância dos dados recuperados para o pesquisador. Isso significa que, quando o artigo científico e seu dataset se encontram em sistemas de gestão distintos, sem conexão e sem a integração sistêmica necessária, o julgamento quanto à relevância se torna prejudicado pela ausência de relação entre os achados.
De acordo com Saracevic, pode-se “pensar no conhecimento público como sendo organizado em uma estrutura de assuntos, representados em uma linguagem e registrados em uma literatura, cujos elementos podem ser chamados de documentos” (SARACEVIC, 1975, p. 325, tradução nossa). Dados públicos, por sua vez, são aqueles disponibilizados abertamente, com licença explícita para reuso ou não.
No entanto, para que esses dados públicos possam ser transformados em conhecimento, eles também precisam ser organizados, estruturados e representados através de normas e padrões que os tornem compreensíveis pelo cidadão e passíveis de serem reusados.
A possibilidade do reuso de dados de pesquisa está muito bem representada por Saracevic (1975), ao considerar quais fatores e relações estão envolvidos na relevância. Para reusar dados existentes, é preciso explicitar vários elementos e aspectos da relevância, tais como: “conhecimento do assunto, literatura do assunto, qualquer outra representação linguística ou simbólica, fonte, especialmente o arquivo ou arquivos, destino, especialmente o arquivo ou arquivos, sistemas de informação, ambientes, realidades, funções e valores” (SARACEVIC, 1975, p. 326, tradução nossa).
Hjørland (2010) alerta que as questões de relevância estão intimamente relacionadas com a determinação do assunto de um documento. No que tange aos dados, tal conjectura explicita a necessidade de Sistemas de Organização do Conhecimento (SOCs) construídos levando-se em consideração as especificidades do domínio e as características dos dados gerados nesse domínio.
Consequentemente, é importante a análise de comunidades discursivas nas quais seus membros desenvolvem processos cognitivos específicos em relação à organização do conhecimento, aliados à identificação da necessidade de informação, estrutura, padrões de cooperação, linguagem e formas de comunicação (HJØRLAND; ALBRECHTSEN, 1995). Isto significa dizer que os SOC construídos com a finalidade de gestão e curadoria de dados devem considerar a terminologia própria do domínio do dado gerado. Os critérios de relevância, portanto, são criados a partir de reflexões sobre os objetos de pesquisa de comunidade, grupos ou redes de pesquisa, evidenciando o conhecimento compartilhado sobre os assuntos.
Dessa forma, os critérios de relevância, segundo Hjørland (2002), são agora construídos em comunidades de discursos. Nas comunidades, ocorrem os processos de comunicação estruturados por elementos conceituais e efetua-se o compartilhamento de paradigmas. Consequentemente, a relevância é determinada por tendências teóricas e epistemológicas em um campo de conhecimento (HJØRLAND, 2001).
No tocante aos dados de pesquisa, soma-se a assertiva de que “as infraestruturas de dados só se tornam efetivas se considerarem as idiossincrasias de cada área em relação aos seus fluxos de geração/coleta de dados e de compartilhamento” (SALES; SAYÃO, 2010). Efetiva-se, dessa forma, a recuperação relevante do assunto por área, em relação aos dados efetivamente reutilizados.
Para Saracevic (2017), a relevância do tópico estabelece relação entre o assunto expresso em uma consulta e o assunto coberto por informações ou objetos de informação recuperados. De acordo com o modelo de referência OAIS, do Consultative Committee for Space Data System (2012), objetos de informação são a soma dos dados (objetos) com sua informação de representação (metadados). Isto porque os metadados são, segundo essa norma, o que dá significado aos dados. Assim, presume-se que os metadados de assunto, usados tanto na descrição dos dados quanto nas consultas, podem ser um critério pelo qual se determina o grau de relevância na recuperação da informação.
Nesse sentido, Hjørland (2010) defende a visão de relevância do conhecimento do assunto (equiparada à relevância tópica) com base em uma teoria pragmática do conhecimento e sugere que a visão recebida pode ser interpretada como variações da epistemologia positivista, uma com foco na opinião de especialistas e a outra nas opiniões dos usuários. Isso acontece porque a compreensão de um assunto pode ser subjetiva, ou seja, um mesmo dado, ainda que descrito sob um vocabulário controlado rígido, pode ser interpretado e re(interpretado) de formas diferentes de acordo com o seu contexto de origem, bem como de acordo com a formação do próprio pesquisador que o recupera com a finalidade de reuso em contexto distinto.
Em vista disso, sistematizar o conhecimento humano, reorganizar e aperfeiçoar são um aspecto intrínseco para promover o reuso de dados - seja no âmbito científico, seja no âmbito governamental - que encontra sua amplitude na “alquimia” da relevância da informação por domínio do conhecimento.
Diante do exposto, apresenta-se a Agenda 2030 e a necessidade de dados e metadados descritivos e temáticos estruturados para se mensurar o desenvolvimento quantitativo de uma nação em busca de alcançar os Objetivos do Desenvolvimento Sustentável.
4 AGENDA 2030 E A NECESSIDADE DE ACESSO PÚBLICO À INFORMAÇÃO E DISPONIBILIZAÇÃO DE DADOS
A Agenda 2030 das Nações Unidas reúne 17 objetivos para se alcançar o desenvolvimento sustentável e 169 metas que demonstram a escala e a ambição de uma agenda universal. Os objetivos e metas são integrados, indivisíveis e equilibram as três dimensões do desenvolvimento sustentável: a econômica, a social e a ambiental.
O processo rumo à agenda de desenvolvimento 2030, cuja implementação teve início a partir de 2015, foi liderado pelos Estados-membros, com a participação dos principais grupos e partes interessadas da sociedade civil. A agenda reflete os novos desafios de desenvolvimento e está ligada ao resultado da Rio+20 - a Conferência da ONU sobre Desenvolvimento Sustentável - realizada em junho de 2012, no Rio de Janeiro, Brasil.
O documento, logo na introdução, em seu item 15, alerta que a disseminação da informação e das tecnologias da comunicação, bem como da interconectividade global, tem um grande potencial para acelerar o progresso humano, para eliminar o fosso digital e para o desenvolvimento de sociedades do conhecimento, assim como para a inovação científica e tecnológica em áreas tão diversas como medicina e energia.
O objetivo 16, “Paz, Justiça e Instituições Eficazes”, corrobora tal preocupação, com a pretensão de promover instituições fortes, inclusivas e transparentes, a manutenção da paz e o respeito aos direitos humanos baseados no Estado de direito para o desenvolvimento humano sustentável, assegurando o acesso público à informação e protegendo as liberdades fundamentais, em conformidade com a legislação nacional e os acordos internacionais.
Aspectos concernentes à informação, acesso e transparência, que são assinalados tanto no item 15 da introdução como no objetivo 16, são ratificados pelo objetivo 17, “Parcerias e Meios de Implementação”, que trata da revitalização de parceria global para o desenvolvimento sustentável, quando pretende, até 2030, aumentar o apoio à capacitação para os países em desenvolvimento, incluindo os países menos desenvolvidos e pequenos Estados insulares em desenvolvimento, para aumentar significativamente a disponibilidade de dados de alta qualidade, oportunos e confiáveis, desagregados por renda, gênero, idade, raça, etnia, status migratório, deficiência, localização geográfica e outras características relevantes em contextos nacionais (ONUBR, 2015, grifo nosso).
Como se pode constatar, a disseminação da informação e das tecnologias da comunicação, o acesso público à informação e a disponibilidade de dados de alta qualidade, oportunos e confiáveis desagregados por renda, gênero, idade, raça, etnia, status migratório, deficiência, localização geográfica e outras características, são fatores preponderantes para se alcançar os Objetivos de Desenvolvimento Sustentável, e demonstrar estatisticamente se o país está no rumo indicado pela Agenda 2030.1
5 RESULTADOS
Para elaboração de políticas públicas rumo à Agenda 2030, o governo brasileiro chegou a criar a Comissão Nacional para os Objetivos de Desenvolvimento Sustentável (CNODS)2 em 2016, extinguindo-a em 2019. Porém, antes de sua extinção, a comissão formou, em 27 de julho de 2018, a Câmara Temática Parcerias e Meios de Implementação (CTPMI) para subsidiar as decisões por meio da elaboração de estudos técnicos e propostas referentes ao desenvolvimento e aperfeiçoamento de políticas e ações (relativas às parcerias e aos meios de implementação) necessárias à concretização dos objetivos e das metas da Agenda 2030.
A CTPMI elaborou um Plano de Ação para o período 2017-2019 (figura 1), com o objetivo de contribuir para a implementação dos ODS em todo o território nacional, além de disseminar a Agenda 2030 e aprimorar as políticas públicas que visavam ajudar o Brasil a alcançar as metas estabelecidas pela ONU (BRASIL, 2017).
O Plano traçou um roteiro de prioridades estabelecidas pela Comissão para apoiar a implementação dos ODS por meio de 5 grandes eixos estratégicos: um transversal, de gestão e governança da Comissão, e outros 4 finalísticos, de disseminação, internalização, interiorização, acompanhamento e monitoramento da Agenda 2030 (BRASIL, 2017).
Implementar os objetivos é uma responsabilidade do governo e de toda a sociedade. A partir dessa premissa, em 9 de setembro de 2014, foi formalizado o Grupo de Trabalho da Sociedade Civil para a Agenda 2030 (GT Agenda 2030). Sob o lema “Não deixe ninguém para trás”, o GT Agenda 2030 “trabalha para fazer da palavra acordada ação efetiva no cotidiano do país”. O grupo foi formado a partir do entendimento de que a definição e a implementação dos ODS devem levar em conta o acúmulo das organizações da sociedade civil. O grupo atua “na defesa de direitos, no combate à desigualdade e no respeito aos limites do planeta” e “na difusão, promoção e monitoramento da Agenda 2030 e busca divulgar os ODS, mobilizar a sociedade civil e incidir politicamente junto ao governo brasileiro e sistema das Nações Unidas para a sua implementação” (GT AGENDA 2030, 2014a).
O GT Agenda 2030 possui uma “carta de princípios” que descreve sua missão, seus objetivos e seus princípios, que são integrados por orientações que implicam em igualdade, diversidade, solidariedade, respeito à pluralidade, autonomia, transparência e confidencialidade (GT AGENDA 2030, 2014b).
O grupo também “comunica e visibiliza a importância dos ODS e o potencial impacto da sua implementação sobre as pessoas e os territórios, além de reunir, analisar e produzir conteúdos que informam sua incidência e ações de controle social, o que inclui a produção [...] do Relatório Luz”. O relatório foi elaborado no início em 2017 e está atualmente em sua quarta publicação, como demonstra a figura 2.

O Relatório Luz sobre a Agenda 2030 no Brasil (2020) está disponível nas versões em português e inglês, e traz alertas quanto à dificuldade de cumprir os objetivos em tempos de pandemia. O relatório aponta a importância de implementar políticas baseadas na coleta, publicação e divulgação proativa de dados. Destaca que não há dados atualizados para avaliar 40 dos 248 indicadores que compõem as metas dos ODS e que 7 indicadores não são aplicáveis ou adequados à realidade nacional. Recomenda valorizar a ciência brasileira, assim como a utilização de evidências e dados, e tomá-la como principal referência para a tomada de decisões em termos de políticas públicas; fortalecer a pesquisa interdisciplinar e a integração entre os centros de pesquisa e organizações da sociedade civil para a padronização de protocolos, melhoramento de banco de dados e divulgação de pesquisas.
A pesquisa conclui que, após análise conjunta e integrada dos dados, informações e análises expostos nesta publicação, pode-se perceber que o Brasil não deve alcançar diversos objetivos e metas da Agenda 2030. Em algumas situações, os dados sugerem retrocessos a estágios pré-2015, particularmente naqueles relacionados à erradicação da pobreza, redução das desigualdades, democratização da governança, acesso aos serviços públicos universalizados, contenção da devastação ambiental e estabelecimento de parcerias para a capacitação humana e o financiamento voltados ao desenvolvimento sustentável (GT AGENDA 2030, 2020).
As considerações apresentadas pelo Relatório 2020 do GT Agenda quanto à necessidade de dados estruturados e disponíveis corrobora estudos apresentados no Relatório da Oliver Wyman, disponibilizado em 2021, no que tange à recuperação, uso, reuso de dados governamentais e de terceiros, nos quais infere-se estarem inclusos os científicos.
O relatório da Oliver Wyman (SAMMAKIEH; YOUSSEF; SALEM, 2021) revisou os fatores críticos para a implementação dos 17 Objetivos de Desenvolvimento Sustentável da Agenda 2030 e traz uma análise das 169 metas a partir de 231 indicadores exclusivos, atualizados em 28 de dezembro de 2020 pelo Inter-agency and Expert Group on SDG Indicators (IAEG-SDGs). Esses indicadores são considerados a métrica fundamental do progresso em relação à Agenda 2030 para o desenvolvimento sustentável global. Eles não são usados apenas para rastrear o progresso, mas também para definir políticas e planos adequados baseados em evidências relacionadas ao desenvolvimento. Uma vez que a maioria dos indicadores é quantitativa, as fontes de dados de terceiros tornaram-se um complemento essencial para os dados tradicionais coletados pelas ONE.
Como exemplo disso, os indicadores encontrados no objetivo 17 medem a capacidade estatística do país para monitoramento de Objetivos de Desenvolvimento Sustentável e se o país possui legislação nacional de estatística em conformidade com os Princípios Fundamentais das Estatísticas Oficiais. Este esforço coletivo cria acesso aos dados no nível de desagregação necessário para que os ODS cumpram seu compromisso de "não deixar ninguém para trás".
As barreiras ao acesso a dados de terceiros exigem que os governos e as ONE adotem uma abordagem pragmática e seletiva no uso de fontes de dados de terceiros. O relatório recomenda algumas ações de mitigação potenciais para obter acesso a fontes de dados de terceiros:
Acessibilidade: dados precisos e de qualidade podem ser de difícil acesso devido a barreiras técnicas, financeiras ou legais, que precisam ser superadas para garantir o acesso oportuno aos dados por ONE;
Disponibilidade: parcerias robustas com provedores de dados adequados são fundamentais para garantir um fluxo consistente de dados ODS;
Confiabilidade: a coleta, a análise e o monitoramento de dados consistentes e confiáveis permitem que os países estabeleçam e monitorem de perto as metas;
Comparabilidade: formatos e estruturas de dados semelhantes entre diferentes provedores de dados semelhantes são essenciais para o monitoramento eficiente de ODS (Figura 3).

Para superar com sucesso os desafios detalhados no documento e alcançar as estratégias de mitigação descritas acima, particularmente vis-à-vis provedores de dados de terceiros devem:
Investir na qualificação certa da força de trabalho para garantir que os funcionários do governo das ONE tenham passado pelos treinamentos corretos e possuam recursos adequados para atender aos requisitos em rápida evolução de gerenciamento de dados;
Atualizar e otimizar sua capacidade, investindo em novos sistemas e processos dentro de ONE que preenchem lacunas entre estruturas de dados de terceiros e do governo, permitindo o processamento de dados de entrada sem problemas, por um lado, e disseminação eficiente de dados relevantes para as partes interessadas, por outro; e
Adotar uma estrutura independente dentro do governo para capacitar a equipe das ONE, reposicionando-as com supervisão mínima, capacitando-as a entregar seu trabalho de forma eficiente (SAMMAKIEH; YOUSSEF; SALEM, 2021).
Os documentos analisados trazem instruções importantes quanto à necessidade de reuso dos dados disponibilizados por instituições públicas e privadas, institutos e agências governamentais, para se avaliar os resultados em atenção às orientações descritas na Agenda 2030.
CONSIDERAÇÕES FINAIS
A Agenda 2030 é um plano para governos, sociedade, empresas, academia e todas as pessoas que foi ratificado pela nação brasileira e está alinhado com os princípios e objetivos apregoados na Constituição Federal de 1988. Contudo, mesmo com a extinção da Comissão Nacional para os Objetivos de Desenvolvimento Sustentável, o último relatório apresentado pelo Grupo de Trabalho da Sociedade Civil para a Agenda 2030 reuniu 51 organizações não governamentais, movimentos sociais, fóruns, redes, universidades, fundações e federações brasileiras demonstrando em seus resultados a relevância do uso de dados oficiais e o reuso de dados de terceiros. Ao descrever a metodologia utilizada para realização dos estudos, por exemplo, o relatório assinalou a utilização de base de dados oficiais, quando disponíveis, e, nos casos em que inexistiam informações oficiais, a utilização de estudos produzidos pela sociedade civil e pela comunidade acadêmica.
Esse fato atesta o quanto a recuperação da informação de fontes de dados de terceiros passa a ser necessária no rastreamento do progresso dos Objetivos de Desenvolvimento Sustentável. Ao reutilizar dados de pesquisas científicas em busca de respostas para demonstrar o andamento das ações implementadas pelo Brasil para alcançar os Objetivos de Desenvolvimento Sustentável, confirma-se a importância de tornar visível em repositórios público ou privado, os dados científicos que fazem parte das pesquisas acadêmicas. O mesmo pode-se dizer sobre os dados governamentais, que devem ser gerenciados e em formato aberto, para que informação relevante possa ser extraída e usada para a constatação de resultados e o progresso da Agenda 2030.
Nessa acepção, plataformas de gestão de dados, com estrutura e adoção de metadados apropriados e utilizados em âmbito nacional e global, permitem a busca por informações relevantes e eficazes para estudos que se valham de dados para demonstração de resultados sociais, econômicos e políticos. Os dados científicos passam a complementar as fontes de dados tradicionais normalmente coletadas por Organizações Nacionais de Estatística, permitindo acompanhar resultados que interessem aos levantamentos realizados em busca de respostas que assinalem ou não o desenvolvimento dos Objetivos de Desenvolvimento Sustentável no Brasil.
Um exemplo de tal aperfeiçoamento realizado pelo governo brasileiro aconteceu no dia 12 de dezembro de 2019, na 8ª Reunião de Acompanhamento do “Compromisso pela Ciência Aberta”, instituído pelo Ministério da Ciência, Tecnologia, Inovações e Comunicações (MCTIC), que estabeleceu mecanismos de governança de dados científicos.
Outra questão revelada por esta pesquisa é a importância da visão do conhecimento prévio do assunto na recuperação da informação para reuso de dados, especialmente em relação aos dados brutos. Esse conhecimento prévio é próprio de quem pertence ao domínio de geração dos dados. Para que um dado bruto possa ser relevante e se transformar em informações eficazes, ele precisa de tratamento que envolve, para além do profissional da informação, o próprio especialista do domínio.
No que tange ao monitoramento e à avaliação das condições de implementação de políticas públicas no Brasil com base nos Objetivos de Desenvolvimento Sustentável, dados governamentais podem ser vistos como dados de pesquisa quando são usados para fins científicos. Da mesma forma, dados gerados e coletados para embasar pesquisas científicas, em certos momentos, podem servir para tomadas de decisão no âmbito governamental e para a criação de políticas públicas de qualidade.
Para tanto, o universo do conhecimento registrado nos dados pode e deve ser reusado, observados os critérios de série histórica, metodologia contextualizada e consolidada em sua comunidade sociocientífica, sendo, portanto, relevante a visão do conhecimento prévio do assunto, a questão-chave para a organização do conhecimento nesta ecologia de dados.
Por fim, registra-se que a investigação não esgota a necessidade de novos estudos com abordagens sobre a importância das plataformas de gestão de dados, dos metadados e do reuso de dados de pesquisa para aferição da condição do Brasil rumo aos Objetivos do Desenvolvimento Sustentável em 2030.
REFERÊNCIAS
BRASIL. Comissão Nacional para os ODS. Plano de Ação 2017-2019. Brasília: CNODS, 2017. Disponível em: Disponível em: http://www4.planalto.gov.br/ods/noticias/comissao-nacional-dosobjetivos-de-desenvolvimento-sustentavel-lanca-plano-de-acao/plano-de-acao. Acesso em: 4 ago. 2020.
BRASIL. Controladoria-Geral da União (CGU). Inovação e governo aberto na ciência - Monitoramento e Execução. Disponível em: Disponível em: http://governoaberto.cgu.gov.br/aogp/planos-de-acao/4o-plano-de-acao-brasileiro/compromisso-3-docs/inovacao-egoverno-aberto-na-ciencia-monitoramento-e-execucao. Acesso em: 11 jan. 2021.
BRASIL. Decreto nº 8.892, de 27 de outubro de 2016. Cria a Comissão Nacional para os Objetivos de Desenvolvimento Sustentável. Diário Oficial da União, Brasília, ed. 209, seção 1, p. 1, 2016. Disponível em: Disponível em: http://www.planalto.gov.br/ccivil_03/_ato20152018/2016/decreto/d8892.htm. Acesso em: 4 ago. 2020.
BRASIL. Decreto nº 10.179, de 18 de dezembro de 2019. Declara a revogação, para os fins do disposto no Art. 16 da Lei Complementar n. 95, de 26 de fevereiro de 1998, de decretos normativos. Diário Oficial da União, Brasília, Seção 1, n. 245, p. 6, 19 dez. 2019. Disponível em: Disponível em: http://www.planalto.gov.br/ccivil_03/_Ato20192022/2019/Decreto/D10179.htm#art1. Acesso em: 4 ago. 2020.
BRASIL. Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT). Cecília Leite faz balanço de 2019 e fala das perspectivas para o próximo ano. Disponível em: Disponível em: https://ibict.br/sala-de-imprensa/noticias/item/2033-cecilia-leite-faz-balanco-de-2019-efala-das-perspectivas-para-o-proximo-ano. Acesso em: 20 jan. 2021.
Consultative Committee for Space Data System. Reference model for an Open Archival Information System (OAIS). Washington: Management Council of the Consultative Committee for Space Data Systems, 2012. Disponível em: Disponível em: https://public.ccsds.org/pubs/650x0m2.pdf. Acesso: 04 abr. 2020.
CURTY, R. G. Abordagens de reúso e a questão da reusabilidade dos dados científicos. Liinc em revista, v. 15, n. 2, 2019. Disponível em: Disponível em: http://revista.ibict.br/liinc/article/view/4777/4315 Acesso em: 20 jan. 2021.
DDI Alliance. Document, Discover and Interoperate. 2021. Disponível em: Disponível em: http://www.ddialliance.org/. Acesso em: 20 jan. 2021.
Dublin Core Metadata Initiative. Inovação em design de metadados, implementação e melhores práticas, 2021. Disponível em: Disponível em: https://www.dublincore.org/. Acesso em: 20 jan. 2021.
GT AGENDA 2030. Grupo de Trabalho da Sociedade Civil para a Agenda. Carta de Princípios. 2014b. Disponível em: Disponível em: https://gtagenda2030.org.br/quem-somos-2/. Acesso em: 20 jan. 2021.
GT AGENDA 2030. Grupo de Trabalho da Sociedade Civil para a Agenda. Carta Quem somos. 2014a. Disponível em: Disponível em: https://gtagenda2030.org.br/quem-somos-2/. Acesso em: 20 jan. 2021.
GT AGENDA 2030. Grupo de Trabalho da Sociedade Civil para a Agenda. Carta Relatório Luz. 2020. Disponível em: Disponível em: https://gtagenda2030.org.br/relatorio-luz/. Acesso em: 20 jan. 2021.
HJØRLAND, B. Epistemology and the socio-cognitive perspective in Information Science. Journal of the American Society for Information Science and Technology, v. 53, n. 4, p. 257-270, 2002.
HJØRLAND, B. The foundation of the concept of relevance. Journal of the American Society for Information Science and Technology, v. 61, n. 2, p. 217-237, 2010.
HJØRLAND, B. Towards a theory of aboutness, subject, topicality, theme, domain, field, content… and relevance. Journal of the American Society for Information Science and Technology, v. 52, n. 9, p. 774-778, 2001.
HJØRLAND, B.; ALBRECHTSEN, H. Toward a new horizon in Information Science: domain-analysis. Journal of the American Society for Information Science and Technology, v. 46, n. 6, p. 400-425, 1995.
NAÇÕES Unidas Brasil (ONUBR). Transformando Nosso Mundo: A Agenda 2030 para o Desenvolvimento Sustentável. 2015. Disponível em: Disponível em: https://brasil.un.org/sites/default/files/2020-09/agenda2030-pt-br.pdf. Acesso em: 26 jan. 2021.
NATIONAL Endowment for the Humanities (NEH). Guidelines for Ensuring and Maximizing the Quality, Objectivity, Utility, and Integrity of Information Disseminated by the National Endowment for the Humanities, 2021. Disponível em: Disponível em: https://www.neh.gov/about/guidelines-for-information-disseminated-by-nationalendowment-for-humanities. Acesso em: 26 jan. 2021.
NATIONAL Institutes of Health (NIH). NIH Data Sharing Policy and Implementation Guidance, 2021. Disponível em: Disponível em: https://grants.nih.gov/grants/policy/data_sharing/data_sharing_guidance.htm#fin. Acesso em: 26 jan. 2021.
NATIONAL Science Foundation (NSF). Today’s Data, Tomorrow’s Discoveries: increasing access to the results of research funded by the National Science Foundation, March 18, 2015. Disponível em: Disponível em: https://www.nsf.gov/pubs/2015/nsf15052/nsf15052.pdf. Acesso em: 26 jan. 2021.
SAMMAKIEH, S.; YOUSSEF, J.; SALEM, J. Implementation of Sustainable Development Goals: addressing the data disaggregation challenge in the GCC. Nova York: Oliver Wyman, 2021. Disponível em: Disponível em: https://www.oliverwyman.com/ourexpertise/insights/2021/jan/implementation-of-sustainable-development-goals.html. Acesso em: 26 jan. 2021.
SARACEVIC, T. Relevance: A review of and a framework for the thinking on the notion in information science. Journal of the American Society for Information Science, v. 26, n. 6, p. 321-343, 1975. Disponível em: Disponível em: https://tefkos.comminfo.rutgers.edu/Saracevic_relevance_75.pdf. Acesso em: 26 jan. 2021.
SARACEVIC, T. The Notion of Relevance in Information Science: Everybody knows what relevance is. But, what is it really? Gary Marchionini (ed.). San Raphael: Morgan & Claypool Publishers, 2017. (Synthesis lectures on information concepts, retrieval, and services, 50)
SALES, L. F.; SAYÃO, L. F. O impacto da curadoria digital dos dados de pesquisa na comunicação científica. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, v. 17, n. esp. 2 - III SBCC, p.118-135, 2012. Disponível em: Disponível em: https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2012v17nesp2p118. Acesso em: 26 jan. 2021.
SAYÃO, L. F. Uma outra face dos metadados: informações para a gestão da preservação digital. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, v. 15, n. 30, p. 1-31, 2010. Disponível em: Disponível em: https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2010v15n30p1. Acesso em: 26 jan. 2021.
Notas
Autor notes
Coleta de dados: C.M.M. Viola
Análise de dados: C.M.M. Viola
Discussão dos resultados: C.M.M. Viola, L. F. Sales
Revisão e aprovação: C.M.M. Viola, L. F. Sales
viola.carla@gmail.comluanafsales@gmail.com