Resumo:
Objetivo: Considerando a fulcralidade da colaboração científica para os avanços no campo das Doenças Tropicais Negligenciadas (DTN) e a necessidade de caracterização das redes sociais científicas, especificamente, relacionando-as com o fenômeno da produtividade, neste artigo, analisaram-se as redes de colaboração científica dos pesquisadores institucionalmente vinculados ao campo das DTN no Brasil, enfatizando as métricas de colaboração e a influência de alguns pesquisadores-chave na produção de seus pares.
Método: O presente artigo vale-se dos aportes cientométricos e de Análise de Redes Sociais. 2719 atores vinculados a programas de pós-graduação stricto sensu, Institutos Nacionais de Ciência e Tecnologia e servidores da Fundação Oswaldo Cruz compõem o universo do estudo. Para a realização do levantamento dos dados dos pesquisadores optou-se pela Plataforma Lattes do CNPq, valendo-se da ferramenta ScriptLattes. O período considerado foi 2015 a 2018. Com relação às redes, empregaram-se as ferramentas Gephi e UCINET & NetDraw.
Resultados: Verificaram-se a estabilidade da coautoria ao longo dos anos, a predominância de artigos com cinco ou mais autores, a diminuição ao longo do tempo dos artigos com quatro ou menos autores, a correlação entre produtividade e colaboração, o destaque dos bolsistas de produtividade do CNPq no grupo analisado e a existência de 762 comunidades no universo simples.
Conclusões: Esse estudo contribuiu para a compreensão das teias de colaboração no campo das DTN, demonstrando a crucialidade da organização em rede para o avanço do conhecimento em DTN.
Palavras-chave:Doenças Tropicais NegligenciadasDoenças Tropicais Negligenciadas,Colaboração CientíficaColaboração Científica,Produção CientíficaProdução Científica,Análise de Redes SociaisAnálise de Redes Sociais,CientometriaCientometria.
Abstract:
Objective: Considering the fulcrality of scientific collaboration for advances in the field of Neglected Tropical Diseases (NTD) and the need to characterize scientific social networks, specifically, relating them to the phenomenon of productivity, in this article, the scientific collaboration networks were analyzed of researchers institutionally linked to the field of NTDs in Brazil, emphasizing the metrics of collaboration and the influence of some key researchers in the production of their peers.
Methods: This article draws on scientometric contributions and Social Network Analysis. 2719 actors linked to stricto sensu postgraduate programs, National Institutes of Science and Technology and employees of the Fundação Oswaldo Cruz make up the universe of the study. For the survey of the researchers' data, the CNPq Lattes Platform was chosen, using the ScriptLattes tool. The period considered was 2015 to 2018. With respect to networks, the tools Gephi and UCINET & NetDraw were used.
Results: The co-authorship stability over the years was verified, the predominance of articles with five or more authors, the decrease over time with articles with four or less authors, the correlation between productivity and collaboration, the highlight of the productivity fellows of the CNPq in the analyzed group and the existence of 762 communities in the simple universe.
Conclusions: This study contributed to the understanding of collaboration webs in the field of NTDs, demonstrating the cruciality of the network organization for the advancement of knowledge in NTDs.
Keywords: Neglected Tropical Diseases, Scientific Collaboration, Scientific Production, Social Network Analysis, Scientometrics.
Artigos
Redes de colaboração científica na produçãode conhecimento em doenças tropicais negligenciadas no Brasil: estudo a partir da plataforma LATTES do CNPq
Networks of scientific collaboration in the production of knowledge in Neglected Tropical Diseases in Brazil: study from the CNPq Lattes Platform
Recepção: 14 Abril 2020
Aprovação: 11 Maio 2020
Publicado: 10 Julho 2020
As redes de colaboração são a “venue” onde o conhecimento científico é produzido (WANG, 2016). Esse locus interativo forma-se pela congregação de indivíduos aglutinados em torno de interesses comuns, sabedores da importância do esforço coletivo e da divisão de tarefas como fundamentos propulsores das forças produtivas de pesquisa. Com isso, aumenta-se a plausibilidade de consecução dos objetivos de um conjunto de atores e o conhecimento produzido torna-se mais completo, tendo em vista que múltiplas visões foram empreendidas e a dialogia exercitada por um conjunto de mentes distintas, porém, com propósitos comuns.
Na atualidade, um dos pilares científicos mais presentes no campo da Saúde é o da colaboração, facilmente verificável no crescimento dos artigos com autoria múltipla e no quantitativo de participantes em projetos e grupos de pesquisa, que, a propósito, cada vez mais são povoados por equipes multidisciplinares. Desse modo, Sobral et al. (2016) descreveram as motivações e os modos de colaboração científica das redes sociais na área de Saúde Tropical, em estudo sobre a produção de conhecimento de pesquisadores do Programa de Pós-Graduação em Medicina Tropical da Universidade Federal de Pernambuco (PPGMedtrop/UFPE).
Como principais resultados, verificou-se que todos os pesquisadores entrevistados consideravam importante a colaboração científica; e, dentre os 458 artigos publicados pelo programa, apenas dois foram de autoria única. Sobre as categorias estabelecidas, constatou-se que as motivações mais importantes para a colaboração são: a) possibilidade de “ataque” a grandes problemas de pesquisa; b) obtenção e/ou ampliação de financiamentos, recursos, equipamentos especiais, materiais; e c) redução da possibilidade de erro. Quanto às motivações menos importantes, destacaram-se: a) desejo de aumentar a popularidade científica, a visibilidade e o reconhecimento pessoal; b) necessidade de trabalhar fisicamente próximo a outros pesquisadores, por amizade e desejo de estar com quem se gosta; c) união de forças para evitar a competição (SOBRAL et al. 2016).
Considerando a fulcralidade da colaboração científica para os avanços no campo das Doenças Tropicais Negligenciadas (DTN) e a necessidade de caracterização das redes sociais científicas, especificamente, relacionando-as com o fenômeno da produtividade, neste artigo, analisaram-se as redes de colaboração científica dos pesquisadores institucionalmente vinculados ao campo das DTN no Brasil, enfatizando as métricas de colaboração e a influência de alguns pesquisadores-chave na produção de seus pares. Como fonte de informação para a concretização do objetivo, fez-se uso de dados disponíveis na Plataforma Lattes do Conselho Nacional de Desenvolvimento Científico e Tecnológico (PL/CNPq), banco de currículos imprescindível para a ciência brasileira.
O presente artigo vale-se dos aportes cientométricos e de Análise de Redes Sociais (ARS). As etapas sintetizadas desdobram-se em “Constituição do Universo da Pesquisa”, “Coleta e Extração de Dados” e “Processamento e Representação dos Dados”.
Os atores que compõem o universo do estudo foram selecionados conforme critério de atuação institucional formal em atividades de pesquisa no campo das DTN, estabelecendo-se três grupos vinculados a programas de pós-graduação stricto sensu (permanentes, colaboradores e visitantes) (PPG), Institutos Nacionais de Ciência e Tecnologia (INCT) e servidores da Fundação Oswaldo Cruz (Fiocruz).
Assim, buscaram-se informações na Plataforma Sucupira da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes) sobre os PPG da área de Medicina II, que contempla especificamente os estudos sobre Medtrop, programas que apresentavam em seu nome, área de concentração, área básica e linhas de pesquisa os termos “tropica*”, “infec*”, “negligenciada*” e/ou “parasitária*”. Com essa estratégia identificaram-se 21 PPG[1], com um total de 555 pesquisadores.
Quanto às instituições de C&T em DTN, consideraram-se os pesquisadores das unidades técnico-científicas da Fiocruz, dadas a sua autoridade, vanguarda e íntima relação com as questões relacionadas ao campo (GONZÁLEZ-ALCAIDE et al., 2012; GONZÁLEZ-ALCAIDE et al., 2013; SAMPAIO, 2015). A lista dos servidores foi obtida por meio do projeto “e-Lattes: um novo arcabouço em linguagem R para análise do currículo Lattes”[2], pautando-se no Portal da Transparência do Governo Federal. Devido à grande quantidade de sujeitos, apenas os pesquisadores com doutorado foram selecionados, totalizando 1870.
Por último, selecionaram-se grupos atendidos pelo programa INCT, que congrega as unidades de pesquisa de maior excelência no país (BRASIL, 2016). Os atores foram mapeados na categoria “Saúde”, filtrando-se os grupos que declaravam trabalhar com as DTN como foco ou interface de pesquisa. Assim, 12 institutos[3], com um total de 403 pesquisadores, foram incorporados ao universo.
Na soma, eliminando-se os repetidos, 2719 pesquisadores foram selecionados. Neste artigo, esse grupo será denominado “universo simples”. Ao tabularem-se os dados de publicações desse grupo, verificou-se o número médio de coautores, por ano, contabilizando cada coautor de maneira única. Com isso, notou-se que o “universo expandido”, ou seja, autores mais coautores, possuía 72816 pesquisadores. Assim, dividiram-se os coautores (70097) pelo universo simples, obtendo-se a média de 25,7 coautores por pesquisador, num período de quatro anos. Sugerindo que cada pesquisador, em média, possui cinco coautores diferentes por ano.
Para a realização do levantamento dos dados dos pesquisadores optou-se pela PL/CNPq, valendo-se da ferramenta ScriptLattes (MENA-CHALCO; CÉSAR JUNIOR, 2009). O período considerado foi 2015 a 2018. Para a elaboração das redes de colaboração científica utilizaram-se conjuntos de arquivos no formato Research Information Systems (.ris) e Graphic Data File (GDF), contendo dados da produção bibliográfica e matrizes compatíveis com a elaboração de grafos. A data da coleta de dados foi maio de 2019.
Com o propósito de evitar incongruências no que diz respeito à padronização, os nomes dos autores e coautores, 95539 inicialmente, passaram por um processo de mineração de textos na ferramenta The Vantage Point®, a princípio, pautando-se em um thesaurus genérico que combina nomes com alta coincidência de escrita, reduzindo o corpus para 90132. Em seguida, se fez uso de um thesaurus mais específico, construindo especialmente para realizar padronizações de nomes de pessoas, chegando ao universo expandido de 72816. Este instrumento possui três níveis de gradação: padrão, agressivo e muito agressivo. Em testes previamente realizados, percebeu-se que os “agressivos” e “muito agressivos” estavam juntando nomes de autores que não necessariamente eram da mesma pessoa, enquanto o padrão fez a aglutinação com maior cautela, tendo como fundamento o seguinte princípio: agrupar conforme a correspondência das iniciais, tomando por base as partes do nome, por exemplo, John Michael Smith corresponderá a J. M. Smith e J. Michael Smith, mas não a John Smith. Tal critério visa evitar casos de paronímia.
Para a elaboração das redes foram consideradas as variáveis: artigos completos publicados em periódicos; livros, capítulos de livros, resumos e trabalhos completos publicados em anais de congressos. Especificamente para o índice collaboration rank, além destas categorias, as apresentações de trabalho foram contabilizadas.
No que tange à representação gráfica, utilizaram-se as ferramentas Microsoft Excel®, com o propósito de observar questões de distribuição da coautoria. Com relação às redes, empregaram-se as ferramentas Gephi e UCINET & NetDraw, estes dois últimos propostos por Borgatti, Everett e Freeman (2002). Tais ferramentas serviram para a análise do conjunto de relações estabelecidas entre os atores, seguindo os princípios metodológicos estabelecidos pelo domínio da ARS.
Os resultados estão organizados na seguinte ordem: 1) Autores e coautores distribuídos ao longo dos anos; 2) Sociogramas e métricas de redes de colaboração científica; 3) Índice de colaboração dos autores em relação à bolsa de produtividade do CNPq.
Ao distribuírem-se os dados de quantidade de autores, considerando-se o universo expandido, por ano, percebeu-se o quadro disponível na Figura 1.

A Figura 1 representa o equilíbrio na coautoria ao longo dos anos, demonstrando que a atividade de colaboração em produções científicas é estável e consolidada no campo das DTN, sendo uma prática recorrente e fundamental para a alavancagem dos resultados de pesquisa. Sem receio de exceder-se, pode-se dizer que a coautoria é fundamental para a sobrevivência acadêmica dos pesquisadores neste campo, haja vista que as imposições de pesquisa demandam ações plurais, que envolvem bolsistas, pesquisadores, técnicos, sendo estes atores de diferentes formações e competências. Sem esta dinâmica colaborativa, o progresso científico do campo seria profundamente prejudicado. No mais, descreve-se que o quantitativo total de produções identificadas contempla: artigos completos publicados em periódicos (18041), livros (582), capítulos de livros (2263), textos em jornais de notícias/revistas (1609) e trabalhos publicados em anais de congressos (10930), totalizando 33425 produções.
Adiante, despertou-se a intenção de verificar as produções por número de autores ao longo dos anos. Sabendo-se que a coautoria é estável, conforme se pôde observar no gráfico anterior, fez-se a análise por ano objetivando examinar se houve algum comportamento interessante no que diz respeito ao número de autores por artigo, ano a ano. Para isto, os dados foram divididos em categorias: um autor, dois autores, três autores, quatro autores e cinco ou mais autores por publicação (Figura 2).

Nota-se que, em todos os anos, cinco ou mais autores é a categoria que mais se sobressai, possuindo mais publicações do que todas as outras categorias juntas. No total, verifica-se que 64,7% das publicações possuem cinco ou mais autores, enquanto, para as demais categorias, os números são: quatro autores: 10,4%; três autores: 10,1%; dois autores: 8,4%; e um autor: 6,1%. Outra observação importante é que todas as categorias apresentaram, em algum grau, queda, fruto da redução no quantitativo total de publicações. De todo modo, a redução mais latente é a dos artigos em autoria única, que, se mantiverem este ritmo, tendem a se aproximar, em breve, do desaparecimento. Derek de Solla Price (1976), um dos autores mais importantes e fundantes do campo cientométrico, percebeu em seus estudos o crescimento vertiginoso na proporção de artigos com autoria múltipla, chegando a prever que, se fosse mantido este padrão, por volta de 1980, os artigos com autoria única iriam desaparecer (PRICE, 1976, p. 55). Apesar de tal visão não se ter confirmado, se sabe que na ciência contemporânea, em especial, nos campos que se desenvolvem em torno de laboratórios, como é o caso da área de Saúde, a coautoria apresenta um espaço amplo para contínuo crescimento, enquanto a autoria única tende a se enfraquecer.
De modo complementar, Sampaio (2015), em sua tese de doutorado, que discute redes de colaboração científica em doenças negligenciadas, apresenta uma diversidade de quadros, que apontam para a diminuição da autoria única e avanço da autoria múltipla. Além disto, o autor percebe um aumento significativo na quantidade de autores por artigos, o que evidencia a demanda do campo por colaboração para o avanço das pesquisas em DTN. Por exemplo, em leishmaniose, no período de 1981 a 1984, o número médio de autores por publicação era 3,13, enquanto entre 2009 a 2012 passou para 5,89 (SAMPAIO, 2015). Tal comportamento acompanha os resultados encontrados em âmbito internacional. Dutt, Kumar e Carg (2010) estudaram o perfil global da produção em dengue, e perceberam que Taiwan, Cingapura, México, China e Holanda não tiveram nenhum trabalho de autoria única e a porcentagem de artigos de autoria única em todos os países estudados foi inferior a 5%, incluindo o Brasil (DUTT; KUMAR; CARG, 2010).
A criação do sociograma é atribuída a Jacob Moreno (1934), que propõe uma forma de representação das propriedades formais das configurações sociais. Essas se constituem em diagramas nos quais os indivíduos são representados por “pontos” e suas relações sociais por “linhas” (BRAGA; GOMES; RUEDIGER, 2008).
O papel principal do sociograma é fornecer informações sobre o relacionamento entre membros de uma rede. No sociograma, cada ator de uma rede é descrito por um “vértice” ou “nó”. Vértices representam atores, que podem ser indivíduos, instituições, palavras-chave, etc. A frequência dos nós e sua representatividade implicam em seu tamanho na rede. Quanto maior o tamanho de um nó, maior a sua frequência, e vice-versa. As linhas ou vínculos descrevem a relação de conexão entre os atores, sua espessura é proporcional à força da correlação, podendo ser mais larga ou estreita, a depender da intensidade relacional (CHEN et al., 2016). Uma rede também é composta por atributos, que são características dos atores, que determinam se são semelhantes ou diferentes. No campo cientométrico, especificamente, os atributos podem ser o gênero e o sexo dos pesquisadores, a instituição a qual estão vinculados, formação acadêmica, etnia, nacionalidade, entre outros.
Para a elaboração dos sociogramas em âmbito cientométrico, em geral, parte-se de uma matriz de correlação de Pearson ou outra matriz de similaridade (HU; ZHANG, 2015). Para este artigo, optou-se pela matriz de coocorrência, que basicamente calcula intersecções em registros de publicações, verificando quais pesquisadores figuram conjuntamente numa determinada publicação. Sempre que um pesquisador aponta, em seu currículo, ter participado de um determinado artigo, e outro pesquisador, da mesma maneira, assim o faz, o sistema entende que ambos coocorreram, ou seja, colaboraram em uma produção. Outra forma de identificação de coocorrência é quando um pesquisador indica o nome do seu colega em uma produção, ainda que o outro tenha esquecido de realizar tal apontamento. Mesmo nesses casos, a coocorrência se estabelece e um vínculo se forma na rede. Tal composição pauta-se na lógica binária, em que, havendo correlação, indica-se 1, não ocorrendo aponta-se zero. Para a elaboração dos vínculos, depois, reservam-se os dados que contêm a quantidade de vezes em que as coocorrências se manifestaram, visando trazer à tona estes comportamentos no sociograma, na forma de atributos, expressados pelo tamanho dos nós.
Em estudos pautados nas tecnologias de Big Data, no âmbito da disciplina Ciência dos Dados, costumeiramente, trabalha-se com um grande volume de dados, o que demanda técnicas de visualização avançadas, que permitam inferir conhecimento sobre grandes quantidades de dados a partir do reconhecimento de padrões. Todavia, ao se pensar no aspecto visualização, deve-se considerar que alguns sistemas, com lógica dinâmica, próprios à visualização, permitem que o analista ou pesquisador realize recortes e imprima visualizações específicas enquanto opera o sistema. Por outro lado, ao se pensar num paper, dissertação de mestrado ou tese de doutorado, tal lógica não se aplica, pois o suporte que abriga a informação visual, em geral, é estático, tendo o pesquisador o desafio de selecionar o melhor recorte para apresentar aquilo que deseja. Neste processo, o ideal minimalista é bem-vindo, pois facilita a interpretação do usuário/leitor, devendo o pesquisador ser pontual naquilo que deseja apresentar.
Este raciocínio aplica-se aos sociogramas, que são criticados quando apresentados em trabalhos acadêmicos, tendo em vista a grande quantidade de nós, vínculos e atributos, que congregados em um curto espaço dificultam sua interpretação, tornando-os, muitas vezes, ilegíveis. Esta discussão suscita uma série de questões, que vão desde a estética e composição dos gráficos até a obsolescência do formato estático de apresentação dos trabalhos científicos. De todo modo, haja vista o escopo desta pesquisa, fixar-se-ão esforços na dinâmica de composição dos grafos, tema que objetivamente interessa a este estudo. Ao recorrer-se a Jacob Moreno, o precursor do sociograma, encontram-se alguns conselhos para a sua elaboração: I) um sociograma é considerado bom quando é legível; II) para tal, a quantidade de linhas que se cruzam deve ser reduzida ao mínimo, pois, quanto menor o número destas linhas, tanto melhor será o sociograma; III) após a coleta e a tabulação das escolhas, comece o sociograma pelas pessoas mais escolhidas, colocando-as em suas formações naturais – três pessoas em um triângulo, quatro em um quadrado, cinco em um pentágono, etc., bem separadas no papel; IV) a existência de subgrupos deve ser observável no desenho (MORENO, 1992; VAZ, 2009).
Segundo Vaz (2009), para Moreno, o que realmente importa na construção de um sociograma são a legibilidade e a fácil observação de subgrupos. Ainda que tais princípios tenham sido pensados fora das possibilidades do ambiente digital e distante da era do Big Data, nota-se que apresentar-se legível é elemento fundamental para a qualidade de um sociograma em um trabalho acadêmico, mesmo ao lidar com redes complexas e grandes volumes de dados. Uma forma de alcançar tal objetivo é elaborando recortes, pensados a partir da realização de experimentos com a grande rede, que ajudem a expressar comportamentos interessantes, destacando respostas para o problema de pesquisa que se tem. Por este motivo, visando ressaltar os pesquisadores mais representativos, elaborou-se uma rede contendo esses indivíduos do universo expandido. Por mais que a noção de representatividade seja superficial, tentou-se enfatizar aqueles que apresentaram maiores índices de produção.
Com o propósito de trazer critérios plausíveis de representatividade, fez-se a rede com a raiz quadrada do número total de autores.
De posse do resultado, organizou-se a lista de autores em ordem numérica decrescente, por quantidade de produção, visando à realização do corte na posição 269º, determinada pela raiz quadrada. Assim, ao visualizar este ranking, notaram-se 12 autores empatados a partir da posição 262º, compreendidos até a posição 274º. Deste modo, objetivando não eliminar pesquisadores que aparecem empatados, consideraram-se 274 autores para a rede. Este critério de corte, pautado na raiz quadrada, que visa selecionar os autores mais representativos, não é uma metodologia absoluta ou superior em termos de parâmetros em relação às outras, haja vista que cada trabalho tem um objetivo específico de tratamento e seleção dos dados. Todavia, este critério aproxima-se dos fundamentos de Price, elaborados em sua teoria do elitismo. Para ele, pode-se estabelecer um limite e dizer que a metade do trabalho é feita por aqueles com mais de 10 artigos, ou que o número dos grandes produtores parece ser da mesma ordem de magnitude que a raiz quadrada do número total de autores (PRICE, 1963). Em suma, esta lei estabelece que a raiz quadrada de todos os autores produtores de literatura em determinado campo produzirá, quando menos, a metade de todos os artigos publicados pela população de autores estudados (URBIZAGÁSTEGUI ALVARADO, 2009, p.70).
Pressupondo que os autores mais representativos podem expressar elementos importantes do campo das DTN, elaboraram-se as redes. A Figura 3 expressa as relações autor-autor e as constelações que se formaram a partir desta variável. Neste grafo, foram excluídos os isolados com o propósito de enfatizar os vínculos. Como está presente nas redes de colaboração um ranking de quantidade de publicações, que representa de modo superior os indivíduos que produziram mais, inferiorizando os que menos produziram, optou-se por não apresentar o nome dos atores envolvidos, tendo em vista que o objetivo do trabalho não é a simples classificação de pesquisadores por produtividade. Como o ângulo de análise enfoca questões de natureza relacional, os rótulos dos dados têm sua importância, aqui, pormenorizadas, assim, escolheu-se classificar os atores de 1 a 274, conforme o ordenamento decrescente do ranking, e utilizar o número de colocação precedido da expressão “ator” no rótulo dos nós.

Na rede acima, buscou-se conhecer, inicialmente, quantas sub-redes haviam se estabelecido e algumas estatísticas gerais da grande rede. Com isto, verificou-se a configuração de 12 sub-redes, que estão estruturadas quantitativamente em um grupo de 19 atores, um grupo com cinco, um grupo com quatro, e nove pares de autores. De um modo geral, a grande rede possui 176 vínculos e 274 atores, destes, 46 estão conectados a algum outro e há 228 sem conexões, o que não indica que não sejam colaborativos, tendo em vista que seus coautores podem estar na dispersão, fora do corte da raiz quadrada.
Para aperfeiçoar a análise selecionaram-se quatro métricas de centralidade para aplicação: (a) Freeman’s degree, (b) Closenesse (c) Betweenness, similarmente ao trabalho de Hossain, Wu e Chung (2006); e d) Eigenvector. Estas quatro, conforme previamente informado, consideraram os 274 pesquisadores mais representativos do universo expandido.
Hossain, Wu e Chung (2006) explicam que a medida de centralidade de grau (degree) é determinada pelo número de links diretos que conectam um nó. Seu objetivo é destacar os nós com mais ligações a outros atores na rede. Quanto maior o valor de centralidade de grau de um ator, maior é a vinculação do ator a outros membros da rede. O ponto negativo da medida de centralidade de grau é que ela leva em conta apenas as ligações diretas dos atores, ao invés de ligações indiretas com todos os outros (HOSSAIN; WU; CHUNG, 2006).
Quanto ao closeness, este se refere à medida em que uma posição está próxima de todas as outras. A proximidade aponta para nós que podem se comunicar com outros da rede em um período mínimo (HOSSAIN; WU; CHUNG, 2006). Em português, é traduzido como “proximidade”, sendo entendida como a capacidade de um nó se ligar a todos os atores de uma rede. Quanto mais altos os valores de proximidade, melhor é a capacidade dos nós se ligarem aos atores restantes (ALEJANDRO; NORMAN, 2005). Para a aplicação recorreu-se à medida Freeman’s closeness.
O terceiro item, betweenness, trata da possibilidade que um ator tem de intermediar as comunicações entre pares de nós. Estes nós são conhecidos como atores-ponte. Para que um nó tenha grau de intermediação, faz-se necessário que ele tenha pelo menos um grau de entrada e de saída e esteja no caminho geodésico de outros pares que se pretende ligar (ALEJANDRO; NORMAN, 2005). Para sua elaboração, medem-se quantas geodésicas entre todos os pares de vértices do grafo passam através de um determinado vértice. A geodésica é o menor caminho entre dois vértices (FREITAS, 2010). A lógica por trás dessa medida é que um ponto com um grau relativamente baixo pode desempenhar um papel importante de “intermediário” e, portanto, muito central para a rede, conhecido na literatura como gatekeepers (SCOTT, 2000). Neste artigo foi utilizada a Freeman’s Betweenness Centrality.
Bonacich (1987) propôs uma medida denominada centralidade de autovetor (Eigenvector Centrality), baseada em autovalores e autovetores de matrizes simétricas, cujo objetivo é medir a importância de um vértice em função da importância de seus vizinhos. Mesmo se um vértice tiver um baixo grau de centralidade, estes vizinhos podem ser importantes e, consequentemente, o vértice adquire relevância, obtendo uma centralidade de autovetor elevada (FREITAS, 2010). Em síntese, a centralidade de cada vértice é, portanto, determinada pela centralidade dos vértices aos quais está conectada (BORGATTI; EVERETT; JOHNSON, 2013). Abaixo, os autores mais bem ranqueados nas métricas mencionadas.

Em relação à Freeman’s degree centrality (centralidade de grau), os três atores mais produtivos em publicações, 1, 2 e 3 são os que obtiveram melhor resultado. Tal achado não surpreende, haja vista que esses são os que possuem mais registros de papers, portanto, sua probabilidade de anexação a grandes números de coautores é alta. De todo modo, não se pode desconsiderar um indício de correlação entre alta colaboração e alta produtividade, já que não necessariamente o fato de possuir mais publicações determina maior número de coautores. Nesse caso, especificamente, além de mais produtivos, são os que possuem mais vínculos. No Freeman’s closeness (proximidade), mais uma vez, os atores 1, 2, 3 e 8 são os que mais se destacam, apresentando maior capacidade de alcance dos outros atores da rede. Os mesmos atores que figuraram no gráfico de centralidade de grau aparecem no de proximidade, tendo em vista a relação estrita entre as medidas. De maneira sumária, além de afirmar que os atores 1, 2 e 3 são os mais produtivos, pode-se dizer que eles são os que possuem mais vínculos, e estão geodésicamente mais próximos dos outros vértices do grafo.
No Freeman’s Betweenness Centrality (intermediação), destaque para os atores 2, 1, 3 e 8, similarmente aos outros indicadores. Chama a atenção a elevação da posição do ator 4 no critério intermediação. Isto ocorre, pois, neste quesito, o ator 4 possui cinco caminhos possíveis para que seus pares possam se ligar, excluindo os atores 97 & 68 – que já estão diretamente ligados. Os caminhos estabelecidos são compostos pelos pares de atores: 97&40, 97&24, 40&24, 40&68, 24&68 (Figura 4). No quesito Freeman’s Eigenvector Centrality (vizinhança), os atores 2, 1 e 3, pesquisadores centrais, aparecem bem posicionados, pois se autovalorizam com uma grande colaboração entre si. Como, além de serem os mais produtivos, os atores constituem uma tríade colaborativa, considera-se que sejam vizinhos de atores com grande peso na rede, no caso, eles mesmos. De modo inverso, os sujeitos mais distantes dos atores centrais tiveram sua medida de vizinhança reduzida, como é o caso do “ator 4”, que é o quarto mais produtivo, porém, não possui a prestigiada vizinhança dos três atores com maior número de vínculos, o que pode ser observado retornando à Figura 3.
Outro índice de colaboração científica selecionado para este artigo é o collaboration rank (grau de colaboração) dos pesquisadores. Essa métrica é um valor numérico que indica o impacto de um membro no grafo de colaborações. O Collaboration Rank é baseado no índice proposto por Liu et al. (2005), e foi utilizado recentemente por Haddad, Mena-Chalco e Sidone (2017), sendo considerado útil para estimar o grau de colaboração de um pesquisador com outros do conjunto considerado. Em síntese, o que se pretende observar é a capacidade de um pesquisador contribuir para a produção do outro. Se o pesquisador . tem 20 produções e, destas, 18 foram realizadas com o pesquisador ., diz-se que o pesquisador . tem 0,9 (90%) de influência na produção do pesquisador .. Neste mesmo exemplo, se o pesquisador . tem 36 produções e 18 foram realizadas com pesquisador ., então, . tem 0,5 (50%) de influência em .. O somatório das influências acumuladas por cada pesquisador constitui a métrica individual de cada sujeito, aqui chamada de author rank. Tal indicador foi implementado na ferramenta ScriptLattes e tem como utilidade mapear gatekeepers e atores com alta centralidade em redes de colaboração científica. Tais dados foram formulados com base na produção do universo simples, 2719 pesquisadores (Tabela 1). Não se julgou necessário substituir os nomes por rótulos neste item, devido ao fato de o ranqueamento da colaboração não gerar a mesma repercussão polêmica e excludente da produtividade bibliográfica.

Ao se observarem os dados do universo simples, definido inicialmente como grupo representativo do campo das DTN no Brasil, visualizaram-se 535 (19,6%) bolsistas do CNPq. Chama a atenção que, dentre os 50 pesquisadores com maior author rank, 41 são bolsistas do CNPq. As modalidades de bolsas identificadas foram as seguintes:

Ressalta-se que a descoberta e avaliação da proeminência dos bolsistas do CNPq expressada na Figura 5, em especial, os de produtividade, só foi possível por uma serendipidade. Segundo o dicionário onlinePriberan (2019), a serendipidade é a faculdade ou o ato de descobrir coisas agradáveis por acaso. Devido à ausência de impressão dos nomes completos dos pesquisadores na ferramenta ScriptLattes, o author rank exibiu as suas bolsas no CNPq, que é um dado que fica disponível na PL/CNPq, acima do nome do pesquisador. Este equívoco é bastante comum, pois apenas os pesquisadores bolsistas recebem esta informação adicional em seus currículos, fazendo com que a linguagem de marcação troque os seus nomes pelas suas categorias de bolsa. Através deste acaso, pôde-se observar esta variável e perceber a importância da bolsa do CNPq, não só para a produtividade, mas, também, para a colaboração e influência do pesquisador bolsista na produção dos seus pares.
A propósito, dentre os 50 mais produtivos no quesito “produção bibliográfica”, 44 (88%) são bolsistas do CNPq. Martelli-Junior et al. (2010) já haviam destacado a importância das bolsas de produtividade do CNPq para a área de Medicina, como mecanismo indutor que promove uma competição entre os pares, incentivando tanto a formação de novos pesquisadores como a publicação de artigos em periódicos de impacto.
Por fim, apresentar-se-á a grande rede do universo simples, como elemento representativo. Essa rede, apesar de sua grandeza no que tange à quantidade de nós e densidade, apresenta alguns elementos importantes sobre o público estudado. Sua elaboração se deu na ferramenta Gephi® - The Open Graph Viz Platform. Este software é o líder de visualização e exploração de grafos, possuindo código aberto e uso gratuito, executável em Windows®, Mc OS X® e Linux® (GEPHI, 2017).
Esta grande rede possui 2719 nós, equivalentes ao quantitativo de pesquisadores do universo simples e 9515 arestas, que se referem às ligações entre eles. Para a sua visualização, escolheram-se os algoritmos Force Atlas e Fruchterman Reingold.
O primeiro se destaca pela simplicidade e facilidade de leitura de redes que proporciona. Sua representação visual gráfica permite realizar análise exploratória de comunidades de autores, representando tamanho, densidade, nós conectados e isolados (FIALLOS et al., 2017). Acrescenta-se sua facilidade de uso, por estar implementado no Gephi®, e a possibilidade de trabalhar com atributos dos atores da rede. O segundo é mais bem aplicado a dados em que a conectividade entre nós é relativamente livre, indicando uma relação importante entre as entidades. Tende a colocar os hubs (nós altamente conectados) no meio da camada, enquanto, na geometria, todos os pontos são conectados, e o layout tende a unir os nós conectados por similaridade (PAVLOPOULOS et al., 2010).
Para a elaboração dos grafos, o tamanho dos nós foi ajustado em tamanho mínimo 5,5 e máximo 120 pontos, com força de repulsão em 1000 para facilitar a visualização. O modo gráfico escolhido foi “padrão sem rótulos dos nós” para facilitar a observação, todavia, alerta-se que a interpretação deste tipo de grafo, pautado em muitos atores e relações, se faz pelo reconhecimento de padrões que se tornam visíveis a partir das posições, cores, tamanhos e formatos, diferentemente de um sociograma com poucos nós e vínculos, que têm sua análise facilitada pela baixa quantidade de vértices, arestas e atributos representados.
No Force Atlas as variáveis consideradas foram a “produção bibliográfica total” dos autores (proporção dos nós) e “author rank” (cores), onde o tom mais fraco na escala de verde é o author rank menor e o tom mais forte aponta os maiores índices de author rank. No Fruchterman Reingold, as variáveis selecionadas foram a “produção de artigos de periódicos” (proporção dos nós) e o author rank, este último representado na escala de vermelho, conforme sua intensidade (Figura 6). O mesmo comportamento pode ser observado na visualização concernente ao algoritmo Fruchterman Reingold,

No aspecto modularidade, que é entendido como uma medida de clusterização e vizinhança dos nós, que divide a rede em “módulos”, de acordo com a força das conexões entre os diversos vértices (RECUERO; ZAGO; BASTOS, 2014), notou-se que há 762 comunidades, que elaboram produções bibliográficas em conjunto, agrupando-se de forma colaborativa e construindo nichos de natureza temática, teórica, epistemológica, institucional, técnica, etc. Provoca a curiosidade o desdobramento desses grupos em estudos futuros com o propósito de visualização dos assuntos que permeiam essas relações.
Este artigo objetivou analisar as redes de colaboração científica dos pesquisadores institucionalmente vinculados ao campo das DTN, enfatizando as métricas de colaboração e a influência de alguns pesquisadores-chave na produção de seus colegas. Com isso, verificaram-se a estabilidade da coautoria ao longo dos anos, a predominância de artigos com cinco ou mais autores, a diminuição ao longo do tempo dos artigos com quatro ou menos autores, a correlação entre produtividade e colaboração, o destaque dos bolsistas de produtividade do CNPq no grupo analisado e a existência de 762 comunidades no universo simples. Assim, esse estudo contribuiu para a compreensão das teias de colaboração no campo das DTN, demonstrando a crucialidade da organização em rede para o avanço do conhecimento em DTN.
Em estudos futuros, recomenda-se a observação do desempenho em colaboração dos atores antes e depois de lhes serem concedidas as bolsas de produtividade do CNPq, com o propósito de confirmar a relação de causalidade aqui sugerida. E, também, explorar as dinâmicas existentes no interior das comunidades (sub-redes) identificadas, visando agregar as variáveis “tema” e “instituição” para a melhor explicação da colaboração científica existente no campo.
CONTRIBUIÇÃO DE AUTORIA: Concepção e elaboração do manuscrito: N. V. Sobral. Coleta de dados: N. V. Sobral. Análise de dados: N. V. Sobral, Z. D. de. Miranda, R. N. M. dos. Santos, R. C. Mello. Discussão dos resultados: N. V. Sobral, Z. D. de. Miranda, R. N. M. dos. Santos, R. C. Mello. Revisão e aprovação: Z. D. de. Miranda, R. N. M. dos. Santos, R. C. Mello. Supervisão: Z. D. de. Miranda, R. N. M. dos. Santos, R. C. Mello.
CONJUNTO DE DADOS DE PESQUISA: Todo o conjunto de dados que dá suporte aos resultados deste estudo foi publicado no próprio artigo.
LICENÇA DE USO: Os autores cedem à Encontros Bibli os direitos exclusivos de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution (CC BY) 4.0 International. Estra licença permite que terceiros remixem, adaptem e criem a partir do trabalho publicado, atribuindo o devido crédito de autoria e publicação inicial neste periódico. Os autores têm autorização para assumir contratos adicionais separadamente, para distribuição não exclusiva da versão do trabalho publicada neste periódico (ex.: publicar em repositório institucional, em site pessoal, publicar uma tradução, ou como capítulo de livro), com reconhecimento de autoria e publicação inicial neste periódico.
PUBLISHER: Universidade Federal de Santa Catarina. Programa de Pós-graduação em Ciência da Informação. Publicação no Portal de Periódicos UFSC. As ideias expressadas neste artigo são de responsabilidade de seus autores, não representando, necessariamente, a opinião dos editores ou da universidade.
EDITORES: Enrique Muriel-Torrado, Edgar Bisset Alvarez, Camila Barros
O apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, Brasil (CAPES) e do Conselho Nacional de Desenvolvimento Científico e Tecnológico, Brasil (CNPq) – Bolsa de Produtividade em Pesquisa, Nível PQ1D.






