Artigos
Interpretação e validação de agrupamentos em análise de cocitação de autores: estudo exploratório e metodológico
Interpretation and validation of groupings in author cocitation analysis: exploratory and methodological study
Interpretação e validação de agrupamentos em análise de cocitação de autores: estudo exploratório e metodológico
Em Questão, vol. 25, núm. 2, pp. 89-116, 2019
Universidade Federal do Rio Grande do Sul
Recepção: 13 Abril 2018
Aprovação: 11 Agosto 2018
Financiamento
Fonte: Financiamento
Beneficiário: Rodrigo Aquino de Carvalho
Resumo: No contexto da fase de interpretação e validação de uma Análise de cocitação de Autores, são formulados os seguintes objetivos: (i) comparar dados dos artigos citantes do corpus com dados que caracterizam os citantes e os autores citados de um agrupamento de uma ACA; (ii) propor indicadores adicionais relacionados aos autores que formam um agrupamento; e (iii) visualizar a rede de documentos cocitados dos autores que formam o agrupamento. O trabalho é exploratório e metodológico e os dados foram retirados de 151 artigos da área da Organização do conhecimento, do período de 2011 a 2015, recuperados na Web Of Science. Uma matriz simétrica com 50 posições (autores com nove ou mais artigos citantes) gerou cinco agrupamentos. O principal agrupamento (17 autores) é o objeto dessa análise. Os autores são cocitados em 69 artigos. Das 131 relações dos autores nas referências, 84 ocorrem no parágrafo. Há dados que comparam citações, citantes e documentos citados para cada um dos 17 autores. São citados 230 artigos distintos no agrupamento. Conclui-se que a proximidade da cocitação no parágrafo valida o agrupamento e que os demais dados ampliam a visão da formação e da caracterização das relações de cocitação. Os resultados demonstram que os agrupamentos em uma ACA podem ser analisados como unidades autônomas e que a descrição dos dados que sustentam a formação do agrupamento (artigos e autores citantes) e que caracterizam os autores participantes e a rede de documentos cocitados, colabora na validação e interpretação das relações, pois apresenta dados objetivos. Espera-se que essa abordagem exploratória possa ser aplicada em outras ACA, independente da área.
Palavras-chave: Cocitação, Análise de cocitação de autores, Análise de cocitação de documentos, Estudo metodológico.
Abstract: In the context of the interpretation and validation of an authors cocitation analysis, the following objectives are formulated: (i) to compare data from the citing articles of the corpus with data characterizing the citing and the cited authors of an ACA cluster; (ii) to propose additional indicators related to the authors that form the grouping; and (iii) to visualize the network of cocitation documents of the authors that form the cluster. The work is exploratory and methodological and the data were extracted from 151 articles on Knowledge Organization, from 2011 to 2015, retrieved in the Web Of Science database. A symmetric matrix with 50 positions (authors with nine or more citing articles) generated five clusters. The main cluster (17 authors) is the object of this analysis. The authors are cocited in 69 articles. From the 131 authors’ relations in references, 84 occur also in the paragraph. There are data comparing citations, citing and cited documents for each of the 17 authors. The cluster has 230 articles cited. It is concluded that the proximity of the cocitation in the paragraph validates the cluster and that the other results broaden the view of the formation and the characterization of cocitation relations between authors. The results demonstrate that the clusters in an ACA can be analyzed as autonomous units and that the description of the data that support the formation of the cluster (citing articles and authors), which characterize the participating authors and the cocited document network, collaborates in the validation and interpretation relations, because it presents objective data. It is hoped that this exploratory approach can be applied in other ACA, regardless of the area.
Keywords: Cocitation, Author co-citation analysis – ACA, Document co-citation analysis (DCA), Methodological study.
1 Introdução
A Cientometria estuda e utiliza diversos indicadores para entender a ciência e o habitus de seus agentes, principalmente nos aspectos concernentes à comunicação dos resultados de pesquisa. O campo científico é complexo e depende de outras áreas do conhecimento para sua avaliação e evolução.
Os indicadores bibliométricos são instrumentos que ajudam nessa função de estudar e avaliar a ciência e são, basicamente, divididos em indicadores de produtividade, de citação e de colaboração científica (GLÄNZEL, 2003). A cocitação, um indicador analítico derivado da citação, é o tema desse trabalho, mais especificamente a análise de cocitação de autores (Authors cocitation analysis – ACA).
Estudos de cocitação são utilizados principalmente como técnica de análise de domínio, visualização e mapeamento de uma área específica do conhecimento (EOM, 2009; LIMA, 2015). Como um método de análise de citações (HJØRLAND, 2013), a cocitação herda todo o arcabouço teórico-metodológico que estuda o fenômeno de citar/referenciar, pois a citação (incluindo a referência) é a prova empírica das relações que formam os campos do saber (ALVARENGA, 1998), mapeando os domínios científicos, pois apresenta elementos objetivos (registros e seus rastros) e subjetivos (as intenções de quem cita, a partir dos objetivos do seu texto e do contexto que o cerca) dessas relações (SILVEIRA; CAREGNATO, 2017), sendo um ato que permeia implicações das mais variadas, sejam “[...] psicológicas, sociológicas, políticas e históricas, assim como influências de outras naturezas, tais como o narcisismo (autocitações), influências entre autores e instituições, adesão a paradigmas vigentes.” (ALVARENGA, 1998, p. 6).
As principais unidades de contagem para estudos de cocitação são os documentos (EOM, 2009; TRUJILLO; LONG, 2018), os periódicos (MACHADO, 2015) e, principalmente, os autores (GRÁCIO; OLIVEIRA, 2013), que respondem por grande parte dos estudos publicados (CHEN; IBEKWE-SANJUAN; HOU, 2010).
Assim, no contexto da fase de interpretação e validação dos agrupamentos formados em uma ACA, são apresentados os objetivos dessa pesquisa:
a) comparar dados dos artigos citantes do corpus com dados que caracterizam os artigos citantes e os autores citados do principal agrupamento da ACA realizada na pesquisa;
b) propor indicadores adicionais relacionados aos autores, como por ex: identificação e número de documentos citados dos autores no corpus e no agrupamento, proporção de cocitação entre os autores na proximidade por referência e parágrafo etc.;
c) e comparar a rede de documentos cocitados dos autores que formam o principal agrupamento da análise com as relações de cocitação dos próprios autores (o trabalho não se caracteriza como uma análise de cocitação de documentos, pois o processo será feito como parte da validação de um agrupamento específico de uma ACA).
Assim, esse trabalho pretende contribuir com os estudos de cocitação de autores no sentido de observar e mensurar dados que balizam e caracterizam a formação dos agrupamentos, pois a ACA tradicional não parece ser suficientemente informativa (BU etal., 2017). Além disso, lidar com apenas um agrupamento mostra que esses resultados de estudos de cocitação emergem como unidades que podem ser analisadas separadamente e que ampliar a descrição dos dados torna a interpretação e a validação mais objetiva e rica, ainda que a análise subjetiva dos pesquisadores envolvidos nesse tipo de estudo seja necessária e única.
O estudo é aplicado na subárea da Ciência da Informação “Organização do conhecimento”. Essa área foi escolhida pela familiaridade dos pesquisadores com o tema e seus principais autores, e é uma extensão de um projeto em andamento sobre questões metodológicas em ACA e sua relação com a análise de cocitação de documentos.
2 Aspectos conceituais e trabalhos relacionados
A ACA é uma técnica de relacionamento de referências e, por vezes, é confundida com o acoplamento bibliográfico. O acoplamento relaciona os documentos citantes (há estudos que acoplam a partir dos autores[1]) a partir de um documento citado (GLÄNZEL, 2003), e, portanto, tem um olhar para frente, enquanto a cocitação relaciona dois documentos citados (a unidade pode ser autor ou periódico) a partir de um documento citante (SMALL, 1973), tendo, assim, um olhar para o passado.
A matriz da Figura 1, que é assimétrica e de ocorrência (LEYDESDORFF; VAUGHAN, 2006), representa o relacionamento de publicações e suas referências, e mostra que tanto a cocitação como o acoplamento partem de uma mesma fonte. A linha “C1” mostra que os documentos “R1”, “R3” e “R6” estão cocitados, enquanto que a coluna “R1”, monstra que os documentos “C1”, “C3” e “C5” estão acoplados.
| Documentos citados (Referências) | |||||||
| R1 | R2 | R3 | R4 | R5 | R6 | ||
| Documentos Citantes | C1 | 01 | 00 | 01 | 00 | 00 | 01 |
| C2 | 00 | 01 | 01 | 01 | 01 | 01 | |
| C3 | 01 | 01 | 00 | 00 | 00 | 00 | |
| C4 | 00 | 00 | 00 | 00 | 00 | 00 | |
| C5 | 01 | 01 | 01 | 01 | 01 | 01 | |
A matriz de relacionamento demonstrada na Figura 1 pode derivar duas matrizes simétricas (Figura 2) que indicam com mais clareza as relações, pois a contagem considera apenas ou a cocitação ou o acoplamento, respectivamente.
| Cocitação (documentos citados) | Acoplamento (documentos citantes) | ||||||||||||
| R1 | R2 | R3 | R4 | R5 | R6 | C1 | C2 | C3 | C4 | C5 | |||
| R1 | - | 03 | 02 | 01 | 01 | 02 | C1 | - | 02 | 01 | 00 | 03 | |
| R2 | - | 02 | 02 | 02 | 02 | C2 | - | 01 | 00 | 05 | |||
| R3 | - | 02 | 02 | 03 | C3 | - | 00 | 02 | |||||
| R4 | - | 02 | 02 | C4 | - | 00 | |||||||
| R5 | - | 02 | C5 | - | |||||||||
| R6 | - | ||||||||||||
Assim, a técnica de ACA, tradicionalmente, se realiza a partir de seis passos, conforme McCain (1990, p.434):
a) seleção dos autores: os mais citados ou os com mais documentos citantes em uma área do conhecimento ou periódico, através de consulta a pesquisadores, listas etc. (McCAIN, 1990);
b) recuperação das frequências de cocitação: onde deve ser definido se serão considerados todos os autores das referências ou apenas o primeiro (PERSSON, 2001; ROUSSEAU; ZUCCALA, 2004; CARVALHO; CAREGNATO, 2016), sendo que a coautoria pode ser considerada cocitação, conforme os objetivos e operacionalização do estudo (SCHNEIDER; LARSEN; INGWERSEN, 2009), e a proximidade da relação (LIU; CHEN, 2012), sendo que a proximidade por artigo, onde as relações são estabelecidas a partir das referências, é a opção mais utilizada;
c) compilação da matriz de cocitação com valores absolutos: nessa etapa é necessário definir os valores da diagonal (GRÁCIO; OLIVEIRA, 2013), já que a matriz é quadrada e esse dado influencia na próxima etapa;
d) conversão da matriz principal em uma matriz de correlação: utilizar índices de similaridade para normalizar os dados, sendo que os mais utilizados são o r de Pearson, o Cosseno de Salton e o Índice de Jaccard (GRÁCIO; OLIVEIRA, 2015). Leydesdorff e Vaughan (2006) sugerem que esta conversão deve ser feita em uma matriz assimétrica;
e) análise multivariada da matriz de correlação/normalizada: as principais técnicas utilizadas são “análise de componentes principais”, “análise de cluster” e “escalonamento multidimensional” (McCAIN, 1990; EOM, 2009);
f) e interpretação e validação: comparação com outros dados, consulta aos especialistas da área e/ou validação estatística (McCAIN, 1990).
Além de técnicas estatísticas multivariadas, há estudos que optam pela análise de redes sociais (ARS; do inglês: Social Network Analysis) como ferramenta para evidenciar os agrupamentos e analisar a força das relações de cocitação de autores e documentos. Os trabalhos de Jeong, Song e Ding (2014), Lima (2015), Piovezan e Fujita (2015) e Muñoz-Muñoz e Mirón-Valdivieso (2017) são alguns exemplos de pesquisas que seguem essa opção.
Cada etapa apresentada envolve discussões e decisões metodológicas significativas sobre a ACA, mas também mostra a complexidade em operacionalizar os estudos. A seleção dos autores, por exemplo, implica em decidir sobre considerar todas as autorias dos documentos (inclusive as omitidas por normas de citação e de referência bibliográfica, regras das revistas e descrição dos registros em bases de dados) ou apenas as primeiras, como já salientado. A recuperação das frequências considera a proximidade da ocorrência da cocitação (artigo ou referência, seção do documento, parágrafo ou sentenças) (LIU; CHEN, 2012), e isso implica em observar como as referências são mencionadas ou recitadas no corpo texto (DING et al., 2013; BU et al., 2017; CARVALHO et al., 2018), uma vez que a lista de referências bibliográficas iguala o uso dos documentos. Porém, há dados que demonstram que alguns são mais utilizados do que outros, além da tendência de os autores mais citados terem mais de um documento utilizado em um mesmo artigo citante, como demonstram Carvalho et al (2018).
No contexto dos objetivos dessa pesquisa, três trabalhos se destacam quanto às propostas e resultados que apresentam.
O primeiro trabalho é dos autores Chen, Ibekwe-Sanjuan e Hou (2010), que pontuam a grande dificuldade de interpretar os resultados oriundos de ACA e de análise de cocitação de documentos (DCA, do inglês Document Cocitation Analysis), que se concentram nas entidades citadas (autores/documentos) como fonte primeira de evidência, e sugerem que se concentrar nos citantes pode melhorar a compreensão. O artigo objetivou apresentar uma perspectiva múltipla aos estudos de cocitação, no sentido de analisar padrões estruturais, temporais e semânticos, além de elementos dos citados e citantes para ampliar a interpretação e a confiabilidade dos agrupamentos formados pelo estudo. Os dados foram retirados de documentos publicados em 12 periódicos da área da Ciência da Informação, de 1996 a 2008, totalizando 10853 registros, que citaram 129060 referências únicas através de 206180 citações. Essas referências apresentaram 58711 autores únicos. Os agrupamentos da ACA foram definidos a partir de 663 autores e os agrupamentos da DCA a partir de 655 documentos. Um sistema automático rotulou os agrupamentos com dados dos documentos citantes (citers) e os autores concluíram que é recomendado realizar as duas técnicas juntas (ACA e DCA) sempre que possível. Um recorte menor da análise (2001-2005) validou tanto os agrupamentos em relação a um estudo[2] anterior, com uma sobreposição de 82% dos membros; como os rótulos gerados de forma automática com rótulos desenvolvidos manualmente pelo mesmo estudo anterior, que utilizava o mesmo corpus e recorte temporal.
Bu, Liu e Huang (2016) propõem um método de ACA modificado, chamado de MACA (Modified Author Co-citation Analysis). A pesquisa explora o uso de quatro metadados descritivos para qualificar o relacionamento que os dados de cocitação apresentam: i) autores citados/referenciados (contagem de cocitação); ii) o tempo (data) em que a citação/referência foi publicada; iii) suporte ou fonte onde a citação/referência foi publicada; e iv) palavras-chaves de uma citação/referência. O conjunto de dados para a pesquisa foi recuperado no periódico Journal of the American Society for Information Science and Technology (JASIST) entre os anos de 2003 e 2012. Vários metadados descritivos foram retirados de 2038 artigos e 68606 referências e, no final, os 100 autores mais citados foram utilizados para finalizar a pesquisa. Análise fatorial e escalonamento multidimensional (Multidimensional Scaling – MDS) foram as técnicas de estatística multivariada utilizadas, e as matrizes foram construídas com diagonal igual a zero e considerando apenas os primeiros autores das referências. Os autores concluíram que MACA oferece mais detalhes utilizando MDS como técnica estatística, adiciona mais informações à ACA tradicional e que, dependendo da informação utilizada para ampliar a análise, o impacto é distinto.
Por último, Bu et al (2017[3]) apresentam um método de ACA combinado com metadados do texto completo, chamado de MFTACA (Metadata-in-full-text-based ACA). Os autores partem do pressuposto de que as menções a documentos no corpo do texto modificam a suposta “igualdade” apresentada na lista de referências e isso tem consequência nas análises de cocitação. O Quadro 3 desse trabalho ilustra essa preocupação dos autores apenas relacionando citações e documentos citantes e mostra que, assim como os documentos (CARVALHO et al, 2018), os principais autores são mencionados várias vezes por documentos citantes, até pelo número de textos utilizados de alguns autores específicos, como Birger Hjørland, que possui, nos dados dessa pesquisa, 59 diferentes documentos citados, que totalizam 228 citações em 70 artigos citantes.
Os dados da pesquisa de Bu et al (2017) são extraídos de um conjunto de 1420 artigos do periódico Journal of the American Society for Information Science and Technology (JASIST). Os 500 autores mais citados são utilizados para formar a matriz de cocitação, além do número de menções de cada referência, número de palavras do contexto de uso das referências e ano de publicação das referências. A matriz de correlação é construída pelo r de Pearson e a análise fatorial, a análise de redes sociais e o MDS são as técnicas utilizadas para gerar os agrupamentos. Os autores concluem que, apesar de não utilizar informação no nível do conteúdo, como fazem Jeong, Song e Ding (2014), o método proposto apresenta melhor desempenho na formação dos agrupamentos do que a ACA tradicional, além de fornecer mais detalhes. Por fim, consideram que a técnica tanto pode ser ampliada com o uso de outros metadados presentes nos textos, como pode ser utilizada também em estudos de acoplamento bibliográfico. Além disso, consideram que usar apenas o primeiro autor das referências é uma limitação considerável da pesquisa.
Os estudos, de maneira geral, têm buscado melhorar a qualidade de análise dos agrupamentos, para ajudar na interpretação do que realmente ocorre ou existe de relação entre os autores/documentos. Esse trabalho busca isso também, mas emprega ações em um agrupamento já formado por uma ACA tradicional, identificando e descrevendo padrões estruturais dos dados que sustentam (documentos citantes) e caracterizam (informações dos autores e documentos citados) a cocitação de autores em um determinado contexto.
3 Procedimentos metodológicos
O trabalho é metodológico, exploratório e uma extensão dos resultados publicados por Carvalho e Caregnato (2017). Os dados empíricos foram extraídos de um conjunto de 151 artigos de pesquisa, recuperados na base de dados Web of Science em maio de 2017. A busca foi realizada pelo termo “Knowledge organization” no campo “TÓPICO” e na categoria “INFORMATION SCIENCE LIBRARY SCIENCE”. A Tabela 1 apresenta a distribuição dos artigos recuperados por ano de publicação e periódico.
| PERIÓDICOS | 2011 | 2012 | 2013 | 2014 | 2015 | Total | % |
| Knowledge Organization | 07 | 12 | 18 | 20 | 26 | 83 | 54,97 |
| Journal of the Association for Information Science and Technology – JASIST | 02 | 02 | 04 | 01 | 02 | 11 | 07,28 |
| Journal of Documentation | 02 | 02 | 03 | 01 | 02 | 10 | 06,62 |
| Journal of Information Science | - | - | 04 | 02 | 01 | 07 | 04,64 |
| Perspectivas em Ciência da Informação | 04 | 03 | - | - | - | 07 | 04,64 |
| Library Trends | - | 02 | 02 | - | 02 | 06 | 03,97 |
| Scientometrics | - | - | 02 | 01 | - | 03 | 01,99 |
| TransInformação | 01 | - | - | 01 | 01 | 03 | 01,99 |
| El profesional de la información | - | 02 | - | - | - | 02 | 01,32 |
| Informação & Sociedade | - | 02 | - | - | - | 02 | 01,32 |
| Information Research | - | 01 | - | 01 | - | 02 | 01,32 |
| Information Processing and Management | - | - | 02 | - | - | 02 | 01,32 |
| Qualitative and QuantitativeMethods in Libraries | - | - | - | - | 02 | 02 | 01,32 |
| The Electronic Library | - | 01 | - | 01 | - | 02 | 01,32 |
| Outros[4] | 01 | 02 | 02 | 01 | 03 | 09 | 05,96 |
| Total por ano | 17 | 29 | 37 | 29 | 39 | 151 | 100,00 |
Os dados extraídos desse corpus de análise foram estruturados em três diferentes conjuntos, sendo que o primeiro caracteriza as referências a partir de sete indicadores: 1) nº de referências; 2) nº de referências com entrada por autoria pessoal; 3) nº de referências que possuem apenas um autor; 4) n° de referências com dois ou mais autores; 5) n° de referências com outros tipos de entrada (jurisdição, título, entidade coletiva etc.); 6) nº de autorias; e 7) referências desconsideradas. A Tabela 2 apresenta os valores relativos a esses indicadores com as principais medidas estatísticas de centralidade e de dispersão.
| INDICADORES | Total | Medidas de centralidade | Medidas de dispersão | ||||
| Média | Moda | Mediana | Mínimo | Máximo | Desvio padrão | ||
| Referências | 5771 | 38,22 | 28 | 34 | 05 | 120 | 22,50 |
| Referências autoria pessoal | 5449 | 36,06 | 21 | 32 | 04 | 111 | 21,81 |
| Referências com um autor | 3469 | 23,08 | 07 | 20 | 02 | 88 | 17,09 |
| Referências com dois ou mais autores | 1980 | 13,11 | 02 | 09 | - | 59 | 11,72 |
| Referências autoria não pessoa | 318 | 2,11 | - | 01 | - | 55 | 5,29 |
| Autorias | 9311 | 61,66 | 33 | 49 | 06 | 213 | 43,00 |
| Referências desconsideradas | 04 | 0,03 | - | - | - | 03 | 0,26 |
O segundo conjunto de dados é formado por um ranking de citação com 5333 autores, feito manualmente a partir das 5449 referências com entrada por autoria pessoal. A limpeza dos dados foi realizada manualmente, identificando erros de digitação e entradas por sobrenomes compostos. Além da identificação do número de citações de cada autor, foi identificado o número de artigos citantes no corpus, bem como a posição do autor na referência de documentos publicados em coautoria (primeira ou secundária) ou autoria única. A Tabela 3 apresenta as dez primeiras posições do ranking, organizado a partir do número de citações.
| Autores | Citações | Citantes | Autoria única* | Autoria principal* | Autoria secundária* | |
| 1 | Hjørland, B | 228 | 70 | 180 | 38 | 10 |
| 2 | Smiraglia, RP | 68 | 29 | 51 | 08 | 09 |
| 3 | Olson, HÁ | 62 | 31 | 52 | 07 | 03 |
| 4 | Szostak, R | 59 | 13 | 54 | 01 | 04 |
| 5 | Mai, J-E | 47 | 25 | 46 | - | 01 |
| 6 | Dahlberg, I | 44 | 28 | 44 | - | - |
| 7 | Gnoli, C | 35 | 18 | 22 | 12 | 01 |
| 8 | Tennis, JT | 34 | 23 | 27 | 02 | 05 |
| 9 | Berners-Lee, T | 32 | 18 | 20 | 10 | 02 |
| 10 | Guimarães, JAC | 32 | 13 | 08 | 16 | 08 |
| * esses dados não se referem necessariamente ao nº de documentos que esses autores possuem no corpus, ou seja, podem ser derivados de documentos repetidos dependendo dos artigos citantes. | ||||||
* esses dados não se referem necessariamente ao nº de documentos que esses autores possuem no corpus, ou seja, podem ser derivados de documentos repetidos dependendo dos artigos citantes.
Fonte: Dados da pesquisa.O terceiro conjunto é uma matriz simétrica de cocitação de autores com
50 posições (autores com nove ou mais artigos citantes). Diferente de Bu, Liu e Huang (2016) e Bu et al (2017), considerou-se o número de artigos citantes mais interessante que o número de citações para a formação da matriz de cocitação, pois esse indicador apresenta um autor mais “espalhado” no corpus e alguns dados mostram que há autores bastante citados em poucos documentos.
A matriz foi analisada e gerou cinco agrupamentos a partir dos seguintes parâmetros:
a) contagem dos pares considerando todos os autores das referências (ROUSSEAU; ZUCCALA, 2004) e coautoria como cocitação (SCHNEIDER, LARSEN E INGWERSEN, 2009);
b) normalização dos dados utilizando o Cosseno de Salton (GRÁCIO; OLIVEIRA, 2015);
c) valor da diagonal da matriz (autor vs ele mesmo) igual a zero; d) análise fatorial utilizando a técnica de componentes principais, sem definir número fixo de fatores, com rotação varimax e suprimindo coeficientes menores que “0,5” (BECKER, 2015; FIELD, 2009).
O Quadro 1 apresenta a distribuição dos quatro principais fatores, que explicam 89,23% da variância, assim como a carga fatorial das relações.
| 1º Fator (46,40%*) | 2º Fator (22,75%*) | 3º Fator (13,12%*) | 4º Fator (6,96%*) | ||||
| Autores | CF | Autores | CF | Autores | CF | Autores | CF |
| López-Huertas Albrechtsen, H Thellefsen, TL Thellefsen, MM Frohmann, B Guimarães, JAC Buckland, MK Hansson, J Andersen, J Friedman, A Mai, J-E Dahlberg, I Bates, MJ Smiraglia, RP Hodge, G Hjørland, B Svenonius, E | ,953 ,919 ,907 ,891 ,870 ,867 ,858 ,846 ,843 ,778 ,754 ,715 ,712 ,678 ,675 ,664 ,624 | Ranganathan La Barre, K Gnoli, C Spiteri, LF Vickery, BC Mazzocchi, F Broughton, V Soergel, D Szostak, R Jacob, EK Kuhn, TS Lancaster, FW Green, R | ,976 ,955 ,954 ,947 ,941 ,899 ,823 ,822 ,800 ,771 ,760 ,709 ,590 | Berners-Lee, T Greenberg, J Lassila, O Taylor, A Hendler, J McGuinness Noy, NF Gruber, TR Smith, B Zeng, ML | ,960 ,935 ,925 ,924 ,923 ,914 ,910 ,906 ,714 ,637 | Bowker, GC Star, SL Berman, S Beghtol, C Olson, HA Tennis, JT Foucault, M Furner, J | ,874 ,862 ,762 ,696 ,691 ,657 ,628 ,581 |
| CF = Carga fatorial | 5º fator formado pelos autores ‘Bawden, D’(0,876) e ‘Chan, LM’ (0,702). | |||||||
Os objetivos desse trabalho são desenvolvidos a partir dos resultados do primeiro agrupamento e se dividem em três grupos distintos de dados:
a) dados genéricos e de caracterização do agrupamento, para comparação com dados do corpus, por exemplo, número de artigos dos autores citados no corpus e no agrupamento, informações dos artigos citantes etc.;
b) dados relativos aos autores para detalhamento das relações entre eles, além, por exemplo , do número de artigos citados no corpus e no agrupamento etc.;
c) caracterização e rede dos artigos mais citados que formam o agrupamento.
Esse procedimento é genérico e pode ser utilizado em ACA aplicada a qualquer área do conhecimento, desde que a extração dos dados permita uma relação clara dos autores citados com os documentos que os citam. A matriz simétrica de cocitação de autores para esse estudo foi elaborada a partir de uma matriz assimétrica gerada através de um ranking de citação que rotulava documentos citantes.
Além disso, outros dois aspectos merecem destaque para a utilização dessa abordagem em ACA: a técnica de estatística multivariada utilizada para gerar os agrupamentos e o acesso aos textos completos dos artigos citantes. A utilização de outra técnica de estatística ou a utilização da análise de redes sociais pode implicar em resultados distintos à aplicação de uma análise fatorial e somente o acesso ao texto completo vai permitir determinar a proximidade da cocitação no parágrafo.
Por fim, os softwares Microsoft Excel, SPSS e Gephi foram utilizados na estruturação e análise dos dados.
4 Resultados e discussão
Para entender a dimensão do agrupamento em relação ao corpus de análise (N=151 artigos), são apresentados alguns dados gerais e a relação dos principais documentos citantes. Esses dados atendem ao primeiro objetivo da pesquisa e evidenciam que um estudo de cocitação deve considerar a relação com o contexto geral de análise.
Os autores que formam o agrupamento analisado são citados em 106 artigos (70,20%), mas somente em 69 (45,70%) há cocitação, ou seja, há pelo menos dois autores citados, e a Tabela 4 demonstra a distribuição desses artigos relacionando o número de autores citados com os periódicos publicados.
| Revistas | Distribuição por artigos (n=69) | |||||||||||
| 02 Autores | 03 Autores | 04 Autores | 05 Autores | 06 Autores | 07 Autores | 08 Autores | 09 Autores | 12 Autores | Total | % | % Acumulado | |
| Knowledge Organization | 08 | 15 | 06 | 04 | 03 | 01 | 02 | 02 | 01 | 42 | 60,87 | 60,87 |
| Journal of Documentation | 03 | 01 | 01 | 02 | 01 | 08 | 11,59 | 72,46 | ||||
| JASIST* | 02 | 04 | 01 | 07 | 10,14 | 82,61 | ||||||
| Library Trends | 01 | 01 | 02 | 2,90 | 85,51 | |||||||
| PCI* | 01 | 01 | 02 | 2,90 | 88,41 | |||||||
| EBLIS* | 01 | 01 | 1,45 | 89,86 | ||||||||
| El profesional de la información | 01 | 01 | 1,45 | 91,30 | ||||||||
| Information Research | 01 | 01 | 1,45 | 92,75 | ||||||||
| IPM* | 01 | 01 | 1,45 | 94,20 | ||||||||
| JoLIS* | 01 | 01 | 1,45 | 95,65 | ||||||||
| Online Information Review | 01 | 01 | 1,45 | 97,10 | ||||||||
| REDC* | 01 | 01 | 1,45 | 98,55 | ||||||||
| TransInformação | 01 | 01 | 1,45 | 100,00 | ||||||||
| Total | 14 | 26 | 07 | 06 | 05 | 02 | 05 | 02 | 02 | 69 | 100,00 | |
| % | 20,29 | 37,68 | 10,14 | 8,70 | 7,25 | 2,90 | 7,25 | 2,90 | 2,90 | |||
| % Acumulado | 100,00 | 79,71 | 42,03 | 31,88 | 23,19 | 15,94 | 13,04 | 5,80 | 2,90 | |||
| * JASIST: Journal of the Association for Information Science and Technology; PCI: Perspectivas em Ciência da Informação; EBLIS: Evidence Based Library and Information Practice; IPM: Information Processing and Management; JoLIS: Journal of Librarianship and Information Science; REDC: Revista Española de Documentación Científica. | ||||||||||||
Os dados indicam que quase 80% dos artigos citam pelo menos três autores e que 16 artigos (23,19%) citam seis ou mais. O periódico Knowledge Organization é a fonte de 60,87% dos artigos, e trata-se de uma revista científica especializada. As revistas Journal of Documentation e Journal of the Association for Information Science and Technology são mais genéricas em relação à Ciência da Informação, mas podem atender o escopo do periódico Knowledge Organization e são as fontes de publicação de outros oito e sete artigos, respectivamente. Utilizar os dados desses documentos e de suas fontes pode ajudar no desafio de rotular os agrupamentos, como afirmam Chen, Ibekwe-Sanjuan e Hou (2010). O Quadro 2 apresenta alguns metadados dos 16 artigos que mais citam autores do agrupamento analisado.
Observa-se que seis autores (Friedman, A; Guimarães, JAC; Hjørland, B; Smiraglia, RP; Thellefsen, TL; e Thellefsen, MM) dos principais documentos citantes também fazem parte do agrupamento como citados. Os dados de autocitação não foram retirados da análise, pois esse não é um procedimento usual nos trabalhos aplicados de cocitação de autores e nem é recomendado por trabalhos metodológicos, mas evidencia-se como elemento para estudos futuros.
| Autores - Título - Data - Nº autores citados – Periódico |
| 1. Thellefsen, M.; Thellefsen, T.; Sørensen, B. A Pragmatic Semeiotic Perspective on the Concept of Information Need and Its Relevance for Knowledge Organization – 2013 (12) – Knowledge Organization. 2. Friedman, A.; Thellefsen, M. Concept theory and semiotics in knowledge organization – 2011 (12) – Journal of Documentation. 3. Guimarães, JAC.; Tognoli, N. Provenance as a Domain Analysis Approach in Archival Knowledge Organization – 2015 (09) – Knowledge Organization. 4. Hjørland, B. User-based and Cognitive Approaches to Knowledge Organization: A Theoretical Analysis of the Research Literature – 2013 (09) – Knowledge Organization. 5. Smiraglia, R.; Heuvel, Cvd. Classifications and concepts: towards an elementary theory of knowledge interaction – 2013 (08) – Journal of Documentation. 6. Thellefsen, T.; Thellefsen, M.; Sørensen, B. Emotion, Information, and Cognition, and Some Possible Consequences for Library and Information Science – 2013 (08) – Journal of the Association for Information Science and Technology. 7. Guimarães, JAC.; Pinho, FA. Male Homosexuality in Brazilian Indexing Languages: Some Ethical Questions – 2012 (08) – Knowledge Organization. 8. Friedman, A; Smiraglia, R. Nodes and arcs: concept map, semiotics, and knowledge organization – 2013 (08) – Journal of Documentation. 9. Almeida, CC.; Fujita, MSL.; Reis, DM. Peircean Semiotics and Subject Indexing: Contributions of Speculative Grammar and Pure Logic – 2013 (08) – Knowledge Organization. 10. Castanha, RCG.; Grácio, MCC. Bibliometrics Contribution to the Metatheoretical and Domain Analysis Studies – 2014 (07) - Knowledge Organization. 11. Hjørland, B. Is classification necessary after Google? – 2012 (07) – Journal of Documentation. 12. Martínez-Ávila, M.; San Segundo, R.; Zurian, FA. Challenges and opportunities for knowledge organization at the intersection with information technologies – 2014 (06) – Revista Española de Documentación Científica. 13. Tennis, JT. Foundational, First-Order, and Second-Order Classification Theory – 2015 (06) – Knowledge Organization. 14. Martínez-Ávila, M. Knowledge Organization in the Intersection with Information Technologies – 2015 (06) – Knowledge Organization. 15. Almeida, CC. The Methodological Influence of Peirce’s Pragmatism on Knowledge Organization – 2012 (06) – Knowledge Organization. 16. Friedman, A. The relationship between research method and visual display: a study of conference proceedings in the field of knowledge organization – 2014 (06) - Information Research. |
Os trabalhos focam em aspectos conceituais da Organização do conhecimento e a relação com outras áreas, além de algumas aplicações. Vale destacar os estudos sobre classificação e teoria do conceito. Um estudo de acoplamento bibliográfico poderia evidenciar com mais clareza a relação dos documentos.
Além desses dados, vale salientar que os 17 autores possuem 650 citações no corpus, sendo que 586 (90,15%) são nos 69 artigos do agrupamento. Assim, o agrupamento se mostra muito coeso na estrutura dos dados que o sustentam, como as fontes onde os citantes são publicados, que, apesar de a análise não ser no nível do conteúdo, demonstram, como sugerem Bu et al. (2017), uma ligação temática.
Um conjunto de dados relacionados aos autores é apresentado para atender ao segundo objetivo. O Quadro 3 descreve diversas informações que caracterizam a participação dos autores no agrupamento e no corpus de análise da pesquisa, são eles: valores absolutos de cocitação na proximidade por artigo (referências), que considera coautoria como cocitação, técnica de contagem utilizada por Schneider, Larsen e Ingwersen (2009); valores absolutos de cocitação na proximidade por parágrafo, onde são contados os artigos onde há ocorrência e não o número de parágrafos, e desconsideradas as coautorias; número de citações que os autores receberam nos artigos que formam o agrupamento e no total; número de artigos citantes no agrupamento e no total; e número de documentos distintos dos autores citados no agrupamento e no total, destacando as datas de publicação dos mais antigos e dos mais atuais. Esses dados, ainda que descritivos, evidenciam a importância e a participação de cada autor no agrupamento. Essa abordagem pode colaborar com estudos onde os pesquisadores tem pouca familiaridade com o domínio, além de ajudar a tornar as comunicações dos resultados mais autônomas para a comunidade interessada.
As coautorias mais significativas da análise são entre os autores “Hjørland, B” e “Albrechtsen, H” e entre os autores “Thellefsen, MM” e “Thellefsen, TL”. Realizar estudos considerando todos os autores das referências enriquece a análise, pois evidencia autores que colaboram muito (CARVALHO; CAREGNATO, 2016), mas acarreta um pouco de ruído informacional dependendo do objetivo proposto, mesmo que essas relações sejam separadas, pois a unidade documental é a mesma.
A ocorrência da cocitação no parágrafo mostra com mais clareza a relação entre os autores e se revela efetivamente temática, assim como na proximidade por sentença (LIU; CHEN, 2012). Os dados mostram que das 131 relações entre os autores, dentre 136 possíveis (pois há autores que não são cocitados), 64,12% também ocorrem no parágrafo e isso valida o agrupamento. Verificar a ocorrência dos pares de cocitação em outros tipos de proximidade se mostra uma alternativa interessante à ACA tradicional, principalmente na fase de vali- dação e interpretação dos agrupamentos ou de um agrupamento de destaque, uma vez que operacionalizar estudos no texto completo se mostra complexo, principalmente para desambiguação dos nomes dos autores (DING et al, 2013) e pela forma como a citação ocorre no corpo do texto.
| Autores* | Matrizes de cocitação (referência vs parágrafo) | Indicadores adicionais dos autores | ||||||||||||||||||||||||||||
| Hjørland, B | Smiraglia, RP | Dahlberg, I | Mai, J-E | Hodge, G | Albrechtsen, H | Svenonius, E | López-Huertas, MJ | Guimarães, JAC | Frohmann, B | Buckland, MK | Thellefsen, MM | Bates, MJ | Andersen, J | Hansson, J | Thellefsen, TL | Friedman, A | Citações no corpus | Citações no agrupamento | Diferença | Citantes no corpus | Citantes no agrupamento | Diferença | Documentos citados no corpus (datas de publicação do mais antigo e do mais atual) | Documentos citados no agrupamento (datas de publicação do mais antigo e do mais atual) | Diferença | |||||
| Hjørland, B | 19 | 23 | 20 | 14 | 19 | 14 | 13 | 10 | 10 | 09 | 10 | 07 | 09 | 07 | 08 | 08 | Dados de cocitação na referência | 228 | 202 | 26 | 70 | 59 | 11 | 59 | 1988-2015 | 56 | 1992-2015 | 03 | ||
| Smiraglia, RP | Dados de cocitação no parágrafo** | 14 | 09 | 08 | 06 | 06 | 07 | 06 | 03 | 03 | 03 | 03 | 02 | 02 | 02 | 02 | 05 | 68 | 62 | 06 | 29 | 24 | 05 | 48 | 1987-2015 | 44 | = | 04 | ||
| Dahlberg, I | 10 | 05 | 08 | 07 | 09 | 06 | 05 | 06 | 07 | 05 | 06 | 04 | 03 | 03 | 05 | 02 | 44 | 41 | 03 | 28 | 26 | 02 | 18 | 1974-2009 | 17 | = | 01 | |||
| Mai, J-E | 11 | 05 | 02 | 06 | 08 | 06 | 04 | 02 | 05 | 04 | 07 | 02 | 06 | 04 | 05 | 06 | 47 | 44 | 03 | 25 | 22 | 03 | 20 | 1997-2015 | 19 | = | 01 | |||
| Hodge, G | 05 | 01 | 02 | 01 | 04 | 04 | 03 | - | 03 | 04 | 04 | 04 | 04 | 04 | 03 | 03 | 25 | 16 | 09 | 23 | 16 | 07 | 04 | 1999-2013 | 02 | 2000-2013 | 02 | |||
| Albrechtsen, H | 12 | 03 | 01 | 04 | - | 02 | 04 | 05 | 06 | 05 | 05 | 04 | 02 | 03 | 05 | 02 | 23 | 23 | - | 19 | 19 | - | 05 | 1993-1998 | 05 | = | - | |||
| Svenonius, E | 06 | 03 | 01 | 02 | - | - | 02 | - | 03 | 03 | 02 | - | 05 | 04 | 01 | 04 | 25 | 25 | - | 18 | 18 | - | 08 | 1981-2004 | 08 | = | - | |||
| López-Huertas, MJ | 05 | - | 02 | 01 | 02 | 01 | - | 01 | 02 | 04 | 04 | 01 | 02 | 04 | 04 | 03 | 21 | 19 | 02 | 16 | 14 | 02 | 10 | 1996-2012 | 09 | = | 01 | |||
| Guimarães, JAC | 05 | - | 02 | - | - | 01 | - | 01 | 03 | 02 | 04 | 01 | - | 01 | 04 | - | 32 | 25 | 07 | 13 | 11 | 02 | 26 | 2000-2015 | 22 | = | 04 | |||
| Frohmann, B | 03 | 02 | - | 01 | - | - | - | - | 01 | 01 | 03 | 02 | 04 | 03 | 03 | 03 | 21 | 19 | 02 | 12 | 11 | 01 | 10 | 1983-2009 | 08 | 1983-2008 | 02 | |||
| Buckland, MK | 04 | 02 | 02 | 02 | - | 01 | - | 01 | - | - | 07 | 02 | 02 | 05 | 05 | 04 | 14 | 11 | 03 | 12 | 11 | 01 | 09 | 1969-2012 | 05 | = | 04 | |||
| Thellefsen, MM | 05 | 01 | 04 | 02 | 02 | 02 | - | 02 | 01 | 01 | 01 | 02 | 02 | 04 | 09 | 05 | 24 | 24 | - | 11 | 11 | - | 11 | 2003-2013 | 11 | = | - | |||
| Bates, MJ | 03 | 01 | 01 | - | - | - | - | - | - | - | - | - | 02 | 03 | 02 | 01 | 11 | 09 | 02 | 11 | 09 | 02 | 08 | 1989-2007 | 07 | = | 01 | |||
| Andersen, J | 02 | - | - | 04 | 01 | 01 | - | - | - | 01 | - | 01 | - | 04 | 02 | 01 | 12 | 12 | - | 10 | 10 | - | 07 | 2002-2008 | 07 | = | - | |||
| Hansson, J | 01 | - | - | - | 02 | - | 01 | - | - | - | 02 | 01 | 01 | 01 | 04 | 02 | 12 | 12 | - | 10 | 10 | - | 06 | 1997-2006 | 06 | = | - | |||
| Thellefsen, TL | 04 | 01 | 03 | 01 | 01 | 02 | - | 01 | 01 | 01 | 01 | 04 | - | 01 | 01 | 04 | 27 | 27 | - | 09 | 09 | - | 14 | 2002-2013 | 14 | = | - | |||
| Friedman, A | 01 | 02 | 02 | 01 | 02 | - | - | 01 | - | - | - | - | - | - | 01 | 01 | 15 | 15 | - | 10 | 10 | - | 05 | 2006-2013 | 05 | = | - | |||
| OBSERVAÇÕES: * ordem definida a partir do número de artigos citantes | ** nº de artigos e não de parágrafos onde há ocorrência da cocitação nesse tipo de proximidade, além de coautorias desconsideradas | | ||||||||||||||||||||||||||||||
O autor “Hjørland, B” é o único do agrupamento cocitado, na proximidade por parágrafo, com todos os outros autores, e isso pode ser explicado pelos dados que complementam o Quadro 3, como o número de citações (202), o número de artigos citantes (59) e, principalmente, o número de documentos citados (56), em uma produção bibliográfica, que se estende de 1992 a 2015, falando especificamente dos dados do agrupamento. Já os autores “Svenonius, E”, “Guimarães, JAC” e “Bates, MJ” são os que menos se relacionam no nível do parágrafo, e isso pode ser explicado pela distribuição das citações nos 69 artigos citantes que formam o agrupamento. Ou seja, ampliar o nível de descrição ajuda a perceber esses detalhes que caracterizam o agrupamento.
Um destaque interessante é o autor “Hodge, G”, que possui apenas dois artigos citados no corpus, mas um deles está entre os mais citados. O artigo foi publicado em 2000 e seu título é “Systems of knowledge organization for digital libraries” (ver Figura 3). Essa informação evidencia que a unidade bibliográfica é muito significativa para a área, mesmo para um autor pouco produtivo diante do contexto analisado.
Os dados mostram, também, que sete autores são citados apenas em artigos que formam o agrupamento e que exceto pelos autores “Hjørland, B”, “Smiraglia, RP” e “Hodge, G” a diferença se mostra pequena entre o número de citações, documentos citantes e documentos citados dos outros sete autores. Vale salientar que os artigos citantes do agrupamento também podem influenciar as relações dos outros agrupamentos gerados pela análise fatorial, principalmente os que citam apenas dois e três autores.
O autor “Hjørland, B”, por exemplo, apresentou uma carga fatorial alta em relação ao segundo agrupamento, apresentado no Quadro 1. O número de documentos que o citam e de documentos de sua autoria citados na análise evidenciam sua influência no contexto geral desse corpus. Aplicar essa abordagem no segundo agrupamento poderia mostrar outros detalhes e oferecer uma base comparativa que enriqueceria a análise.
A diferença entre as citações e o número de documentos citantes mostra que os autores são citados mais de uma vez no mesmo artigo, como já salientado (BU et al., 2017; CARVALHO et al., 2018). Essa informação é omitida por ACA tradicionais, pois a contagem dos pares é feita pela ocorrência, mesmo que um determinado autor possua 10 documentos citados em um mesmo artigo. No presente estudo, apenas os autores “Hodge, G” (16), “Buckland, MK” (11) e “Bates, MJ” (09) possuem citações iguais ao número de documentos citantes no agrupamento e apenas a última tem uma relação idêntica nos dados relativos ao corpus. Os Autores “Hjørland, B”, “Smiraglia, RP”, “Dahlberg, I” e “Mai, J-E” são os que apresentam maior diferença nessa relação e estão também entre os cinco autores que mais possuem documentos distintos citados no agrupamento, respectivamente 56, 44, 17 e 19.
Outro dado que merece destaque se refere às datas de publicação dos documentos citados de cada autor, apresentadas na última parte do Quadro 3. O trabalho de Bu, Liu e Huang (2016) utilizou essa informação para qualificar os dados apresentados em uma ACA. No presente estudo, apenas as datas dos documentos mais antigos e mais atuais são apresentadas. Assim, há documentos que foram publicados a partir de 1969 e isso é, certamente, um elemento de destaque. Apenas o autor “Albrechtsen, H” não possui documento citado que tenha sido publicado no século 21. Há quatro autores (Hjørland, B, Smiraglia, RP, Mai, J-E e Guimarães, JAC) que possuem documentos publicados em 2015, quatro (Hodge, G, Thellefsen, MM, Thellefsen, TL e Friedman, A) que possuem documentos publicados em 2013 e dois (López-Huertas, MJ e Buckland, MK) em 2012. Essas datas foram destacadas por fazerem parte do recorte temporal do corpus de análise, e mostram a atualidade da pesquisa na área de Organização do Conhecimento, no contexto dos artigos utilizados por essa pesquisa.
Por fim, para atender o terceiro objetivo da pesquisa, foram identificados os documentos citados dos 17 autores que formam o agrupamento analisado. Eles possuem 252 documentos distintos citados no corpus, sendo que 230 (91,27%) são citados no agrupamento, totalizando 532 citações.
A Tabela 5 apresenta a distribuição por frequência de citação e a Figura 3 apresenta uma rede dos 32 artigos mais citados, que possuem pelo menos quatro citações.
| Frequência de citações | Distribuição por documento | Distribuição por citação | ||||
| Número de artigos | % | % acumulado | Citações | % | % acumulado | |
| 20 citações | 01 | 00,43 | 00,43 | 20 | 03,76 | 03,76 |
| 17 citações | 02 | 00,87 | 01,30 | 34 | 06,39 | 10,15 |
| 15 citações | 02 | 00,87 | 02,17 | 30 | 05,64 | 15,79 |
| 11 citações | 01 | 00,43 | 02,61 | 11 | 02,07 | 17,86 |
| 10 citações | 01 | 00,43 | 03,04 | 10 | 01,88 | 19,74 |
| 09 citações | 03 | 01,30 | 04,35 | 27 | 05,08 | 24,81 |
| 07 citações | 02 | 00,87 | 05,22 | 14 | 02,63 | 27,44 |
| 06 citações | 07 | 03,04 | 08,26 | 42 | 07,89 | 35,34 |
| 05 citações | 05 | 02,17 | 10,43 | 25 | 04,70 | 40,04 |
| 04 citações | 08 | 03,48 | 13,91 | 32 | 06,02 | 46,05 |
| 03 citações | 20 | 08,70 | 22,61 | 60 | 11,28 | 57,33 |
| 02 citações | 49 | 21,30 | 43,91 | 98 | 18,42 | 75,75 |
| 01 citações | 129 | 56,09 | 100,00 | 129 | 24,25 | 100,00 |
| Total | 230 | 100,00 | 532 | 100,00 | ||
Os dados da tabela mostram que há uma grande dispersão de documentos citados apenas uma vez nos 69 artigos que formam o agrupamento e que 32 artigos respondem por 46,05% das 532 citações.
Essa informação evidencia a complexidade de lidar com dados de cocitação de autores, pois mesmo os mais citados, por produzirem muito, possuem documentos pouco citados e que ampliam consideravelmente o ruído informacional presente nos dados.

A Figura 3 apresenta um núcleo de oito documentos que se relacionam com mais força, com destaque para os documentos “Doc2” e “Doc3”, como se pode ver na lista que complementa a figura. O autor “Hjørland, B” é responsável por seis desses documentos, sendo um deles em coautoria com “Albrechtsen, H”, os outros são de “Dahlberg, I” e “Hodge, G”, sendo que o último possui apenas dois documentos citados no agrupamento, como já salientado.
Desses oito documentos, três são sobre o que é a Organização do conhecimento e seus fundamentos: What is knowledge organization? (Hjørland, B. - 2008); Knowledge organization: a new science? (Dahlberg, I. - 2006); e Fundamentals of knowledge organization (Hjørland, B. - 2003). Outros documentos também abordam a área com esse enfoque sobre fundamentos e questões epistemológicas, além de relacionar a Organização do conhecimento com a Ciência da Informação e outras disciplinas, como a Semiótica.
Outros temas decorrentes dos documentos mais citados são a classificação, a indexação e a teoria do conceito. Essa avaliação inicial é feita pelos títulos e, mesmo parecendo claro, não é simples rotular um agrupamento (CHEN; IBEKWE-SANJUAN; HOU, 2010) que se mostra muito complexo, como evidenciam os dados. Um caminho possível é verificar e entender como se dá o uso desses documentos nos artigos citantes, enquanto outro é verificar a citação ou cocitação na seção do documento citante por evidenciar um rótulo ou um foco de uso.
Outra observação é que, dentre os documentos mais citados, há quatro que também são documentos citantes do corpus, apresentados a seguir por ordem de citação: (i) User-based and cognitive approaches to knowledge organization (Hjørland, B. – 2013); (ii) Concept Theory and Semiotics in Knowledge Organization (Friedman, A.; Thellefsen, M. - 2011); (iii) The importance of theories of knowledge (Hjørland, B. - 2011); e (iv) Facet analysis: The logical approach to knowledge organization (Hjørland, B. - 2013).
Vale salientar que os autores “Guimarães, JAC” e “Bates, MJ” não possuem documentos no recorte de análise da Figura 1 e que os autores “Albrechtsen, H” e “Hansson, J” possuem apenas um documento citado na análise e publicado em coautoria, onde ambos não estão na primeira posição das referências. Esses dados evidenciam a importância de definir sobre o uso de todos os autores das referências e os ganhos ou perdas informacionais que acarretam.
Por fim, a unidade de contagem merece uma discussão com base nos dados. Contar cocitação por autores simplifica e agrega mais informações (230 documentos representados por 17 autores), pois há um destaque na produção, mas também pode ser um problema para rotular os agrupamentos posteriormente. O autor “Smiraglia, RP”, por exemplo, possui 34 documentos citados no agrupamento, com apenas uma citação dos 44 citados na análise, e apenas um está entre os mais citados listados na Figura 3 (The progress of theory in knowledge organization, 2002). Em um estudo de cocitação de documentos, esses dados poderiam ser desconsiderados, pois a dispersão é maior utilizando essa unidade de contagem. O ideal, como sugerem Chen, Ibekwe-Sanjuan e Hou (2010), é combinar as técnicas de cocitação de autores e cocitação de documentos. Além de “Smiraglia, RP”, os autores “Dahlberg, I” (11), “Guimarães, JAC” (21) e “Hjørland, B” (16) são outros destaques, com vários documentos citados uma única vez no agrupamento analisado.
Os resultados mostram que analisar agrupamentos pode ser uma abordagem válida em ACA, mesmo em um nível descritivo, e que parece fundamental dimensionar o agrupamento em relação aos dados gerais do corpus de análise. É necessário comparar dois ou mais agrupamentos utilizando a mesma abordagem para enriquecer esse entendimento.
5 Considerações finais
Validar e interpretar agrupamentos em estudos de cocitação não é uma tarefa simples. Qualquer escolha na execução de um estudo dessa natureza pode implicar em elementos que deixam de ser analisados ou em muita informação para medir e condensar, e isso já se evidencia na escolha da unidade de contagem, principalmente as mais comuns: autores e documentos.
Esse trabalho buscou, a partir de três objetivos, apresentar uma perspectiva nesse sentido, especificamente para agrupamentos de ACA.
Os dados dos artigos citantes mostram a extensão do agrupamento e destacam os artigos que mais cocitam os autores, além de indicar as fontes desses documentos, que, no caso, são os periódicos e os autores. No presente trabalho, é possível perceber que essas informações validam o agrupamento e mostram um pouco de homogeneidade e coerência do corpus do estudo, ainda que possam haver questionamentos sobre a sua formação e tamanho, aspectos relevantes e limitantes em qualquer pesquisa sobre citação e cocitação.
Os indicadores adicionais relacionados aos autores contextualizam a participação de cada um deles no agrupamento e no corpus de maneira geral, principalmente pela relação entre citação, citante e documentos citados. A identificação das relações de cocitação na proximidade por parágrafo pode validar as cocitações recuperadas na lista de referências, pois, ainda que a análise não seja feita no nível do conteúdo, é bastante improvável que dois autores cocitados no mesmo parágrafo não tenham alguma relação temática.
Nos dados dessa pesquisa, os indicadores adicionais serviram à descrição dos padrões estruturais de caracterização do agrupamento, esclarecendo a importância e a participação de cada autor, e a cocitação, na proximidade por parágrafo, foi alta, validando os dados das referências. Sugere-se que essa abordagem seja utilizada na descrição mais detalhada dos resultados de ACA em qualquer área e para todos os agrupamentos, pois amplia a autonomia informacional dos estudos.
Apresentar os documentos dos autores amplia o nível informacional e evidencia a natureza temática do agrupamento. Nos dados dessa pesquisa, a rede de cocitação dos documentos mostrou uma relação omitida pela ACA, qual seja, a ligação de documentos do mesmo autor, além de um documento muito citado de outro autor que parecia sem muita relevância no agrupamento. Combinar as técnicas de cocitação, ainda que como uma forma de interpretar um agrupamento, mostrou-se válido.
Aplicar essa abordagem para comparar todos os agrupamentos de uma ACA é uma sugestão para futuros trabalhos, assim como incluir uma rede de acoplamento bibliográfico na fase de levantamento dos dados estruturais de formação do agrupamento (documentos citantes).
Espera-se que os resultados desse trabalho possam colaborar com o avanço da pesquisa sobre cocitação de autores e de documentos no Brasil, além da aplicação da técnica, independentemente da área, pois a citação é um fenômeno que caracteriza a ciência de forma geral, sendo um dos mecanismos que mais aproximam as distintas áreas na forma de ser utilizado.
Agradecimentos
O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - Código de Financiamento 001
Referências
ALVARENGA, L. Bibliometria e arqueologia do saber de Michel Foucault – traços de identidade teórico-metodológica. Ciência da Informação, Brasília, v. 27, n. 3, 1998.
BECKER, J. L. Estatística básica: transformando dados em informação. Porto Alegre: Bookman, 2015
Referências
BU, Y. et al. MFTACA: an author co-citation analysis method combined with metadata in full text. In: INTERNATIONAL CONFERENCE ON SCIENTOMETRICS AND INFORMETRICS, 16., 2017, Wuhan, China. Proceedings [...] Wuhan: International Society of Scientometrics and Informetrics – ISSI, 2017.
Referências
BU, Y.; LIU, T-Y; HUANG, W-B. MACA: a modified author co-citation analysis method combined with general descriptive metadata of citations. Scientometrics, Dordrecht, v. 108, n. 1, p. 143-166, 2016.
CARVALHO, R. A. et al. A relação entre referências e menções: estudo exploratório em artigos na base de dados BRAPCI. Prisma.Com, Porto, n. 36, p. 99-115, 2018.
Referências
CARVALHO, R. A.; CAREGNATO, S. E. Análise de cocitação de autores – ACA: estudo exploratório comparando proximidade nas referências, seção do artigo e parágrafo. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 18., 2017, Marília. Anais [...] Marília: ANCIB, 2017.
CARVALHO, R. A.; CAREGNATO, S. E. Primeiro vs todos os demais autores citados: estudo empírico em artigos na base BRAPCI. In: ENCONTRO BRASILEIRO DE BIBLIOMETRIA E CIENTOMETRIA, 5., 2016, São Paulo. Anais [...] São Paulo: USP, 2016.
CHEN, C.; IBEKWE-SANJUAN, F.; HOU, J. The structure and dynamics of co-citation clusters: a multiple-perspective co-citation analysis. Journal of the American Society for Information Science and Technology, New Jersey, v. 61, n. 7, p. 1386-1409, 2010.
DING, Y. et al. The distribution of references across texts: some implications for citation analysis. Journal of Informetrics, Amsterdam, n. 7, p. 583-592, 2013.
EOM, S. B. Author cocitation analysis: quantitative methods for mapping the intellectual structure of an academic discipline. Hershey: Information Science Reference, 2009.
FIELD, A. Descobrindo a estatística usando o SPSS. 2. ed. Porto Alegre: Artmed, 2009.
GLÄNZEL, W. Bibliometrics as a research field: A course on theory and application of bibliometric indicators. [S. l]: Course Handouts, 2003
GRÁCIO, M. C. C.; OLIVEIRA, E. F. T. de. Estudos de análise de cocitação de autores: uma abordagem teórico-metodológica para a compreensão de um domínio. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 14., 2013, Florianópolis. Anais [...] Florianópolis: ANCIB, 2013.
GRÁCIO, M. C. C.; OLIVEIRA, E. F. T. de. Indicadores de proximidades em análise de cocitação de autores: um estudo comparativo entre coeficiente de Correlação de Pearson e Cosseno de Salton. Informação & Sociedade: Estudos, João Pessoa, v. 25, n. 2, p. 105-116, maio/ago. 2015.
HJØRLAND, B. Citation analysis: A social and dynamic approach to knowledge organization. Information Processing and Management, Kidlington, n. 49, p. 1313–1325, 2013.
JEONG, Y.; SONG, M.; DING, Y. Content-based author co-citation analysis. Journal of Informetrics, Amsterdam, n. 8, p. 197-211, 2014.
LEYDESDORFF, L.; VAUGHAN, L. Co-occurrence matrices and their applications in Information Science: extending ACA to the web environment. Journal of the American Society for Information Science and Technology, New Jersey, v. 57, n. 12, p. 1616–1628, 2006.
LIMA, L. S. Produção científica em Organização do conhecimento: uma análise de domínio via cocitações de autores. Marília. 2015. Dissertação (Mestrado em Ciência da Informação) – Programa de Pós-Graduação em Ciência da Informação, Faculdade de Filosofia e Ciências, Universidade Estadual Paulista. 2015.
LIU, S.; CHEN, C. The proximity of co-citation. Scientometrics, Dordrecht, n. 91, n. 2, p.495-511, 2012.
MACHADO, R. N. Estrutura intelectual da literatura científica do Brasil e outros países dos BRICS: uma análise de cocitação de periódicos na área de célula-tronco. 2015. Tese (Doutorado em Ciência da Informação) - Escola de Comunicação, Universidade Federal do Rio de Janeiro. Programa de Pós-graduação em Ciência da Informação, Instituto Brasileiro de Informação em Ciência e Tecnologia, Rio de Janeiro, 2015.
McCAIN, K. Mapping author intellectual space: a technical overview. Journal o the American Society for Information Science, New Jersey, v. 41, n. 6, p. 433-443, 1990.
MUÑOZ-MUÑOZ, A. M.; MIRÓN-VALDIVIESO, M. D. Analysis of collaboration and co-citation networks between researchers studying violence involving women. Information Research, Sheffield, v. 22, n. 2, 2017.
Referências
PERSSON, O. All author citations versus first author citations. Scientometrics, Dordrecht, v. 50, n. 2, p. 339-344. 2001.
PIOVEZAN, L. B.; FUJITA, M. S. L. Análise de cocitação de autores: uma aplicação em estudos de indexação. Em Questão, Porto Alegre, v. 21, n. 1, p. 110-129, 2015.
ROUSSEAU, R.; ZUCCALA, A. A classification of author co-citations: definitions and search strategies. Journal of the American Society for Information Science and Technology, New Jersey, v. 55, n. 6, p. 513-529, 2004.
SCHNEIDER, J. W.; LARSEN, B.; INGWERSEN, P. A comparative study of first and all author co-citation counting, and two different matrix generation approaches applied for author co-citation analyses. Scientometrics, Dordrecht, v. 80, n. 1, p. 105–132, 2009.
SILVEIRA, M. A. A.; CAREGNATO, S. E. Demarcações epistemológicas dos estudos de citação: o fenômeno da citação. Informação & Sociedade, João Pessoa, v. 27, n. 3, p. 145-154, 2017.
SMALL, H. Co-citation in the scientific literature: a new measure of the relationship between two documents. Journal of the American Society for Information Science, New Jersey, v. 24, n. 4, p. 265-269, 1973.
TRUJILLO, C. M.; LONG, T. M. Document co-citation analysis to enhance transdisciplinary research. Science Advances, Washington, D.C., v. 4, n. 1, 2018.
Notas
Autor notes
racfurg@gmail.com
catarinaprestes@yahoo.com.br
sonia.caregnato@ufrgs.br