Secciones
Referencias
Resumen
Servicios
Descargas
HTML
ePub
PDF
Buscar
Fuente


CLASSIFICAÇÃO FACETADA: PROPOSTA DE CATEGORIAS FUNDAMENTAIS PARA ORGANIZAR TESES E DISSERTAÇÕES EM UMA BIBLIOTECA DIGITAL
Faceted classification: proposal of fundamental categories to organize thesis and dissertations in a digital library
Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, vol. 26, e79427, 2021
Programa de Pós-graduação em Ciência da Informação - Universidade Federal de Santa Catarina

Artigo Original


Recepção: 09 Fevereiro 2021

Aprovação: 05 Abril 2021

Publicado: 07 Maio 2021

DOI: https://doi.org/10.5007/1518-2924.2021.e79427

RESUMO

Objetivo: Este trabalho apresenta uma proposta de categorias fundamentais, com base nos trabalhos de Ranganathan e do Classification Research Group, a serem utilizadas para a construção de uma interface de navegação facetada para uma biblioteca digital de teses e dissertações.

Método: Foi realizada uma pesquisa de natureza aplicada, de abordagem qualitativa e do tipo exploratória, que emprega como métodos a revisão de literatura, a pesquisa documental e uma análise de domínio combinando as abordagens estudo bibliométrico e estudo terminológico.

Resultado: Com base na análise de domínio realizada, bem como no referencial teórico consultado, foram criadas as seguintes categorias fundamentais: Thing, Kind, Process, Operation, Product, By-product, Space e Time.

Conclusões: As categorias fundamentais propostas neste trabalho podem contribuir significativamente para a construção de um mecanismo de busca facetada para a recuperação de teses e dissertações em uma biblioteca digital. Espera-se, com isso, eliminar as dificuldades atualmente encontradas pelos usuários ao utilizarem um campo de busca textual.

PALAVRAS-CHAVE: Classificação Facetada, Organização do Conhecimento, Recuperação da Informação, Meteorologia, Fórmula PMEST.

ABSTRACT

Objective: This work presents a proposal of fundamental categories, based on the work of Ranganathan and the Classification Research Group, to be used to construct a faceted navigation interface for a digital library of thesis and dissertations.

Methods: A research of applied nature, qualitative approach and exploratory type was carried out, which uses as methods the literature review, the documentary research and a domain analysis combining the bibliometric study and terminological study approaches.

Results: Based on the domain analysis, as well as on the consulted theoretical framework, the following fundamental categories were created: Thing, Kind, Process, Operation, Product, By-product, Space and Time.

Conclusions: The fundamental categories proposed in this work can contribute significantly to building a faceted search engine for retrieving theses and dissertations in a digital library. Thus, it is expected to eliminate the difficulties currently encountered by users when using a textual search field.

KEYWORDS: Faceted Classification, Knowledge Organization, Information Retrieval, Meteorology, PMEST formula.

1 INTRODUÇÃO

Nas duas últimas décadas, as bibliotecas digitais de teses e dissertações passaram a compor o portfólio de serviços oferecidos pelas unidades de informação das instituições de ensino superior brasileiras que ofertam programas de pós-graduação stricto sensu. Isso ocorreu mais precisamente a partir do ano de 2006, quando a Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), por meio da publicação da Portaria nº. 13 (Brasil, 2006), passou a exigir a divulgação digital das teses e dissertações defendidas nestes programas.

No entanto, é comum que essas bibliotecas digitais de teses e dissertações apresentem problemas de encontrabilidade e recuperação dos documentos nelas depositados, principalmente quando são oferecidas formas limitadas de busca aos usuários. Em muitas dessas plataformas é disponibilizado somente um campo textual, a partir do qual é possível efetuar buscas simples e, em alguns casos, buscas avançadas, quando permitida a combinação de operadores lógicos (geralmente os operadores booleanos AND, OR e NOT advindos da teoria dos conjuntos) aos termos de busca, com o objetivo de refinar ou expandir os resultados a serem obtidos.

Neste contexto, o Instituto Nacional de Pesquisas Espaciais (INPE), que atualmente possui sete programas de pós-graduação stricto sensu1, oferece aos usuários internos e externos a Biblioteca Digital da Memória Científica do INPE (BDMCI). Esta plataforma preserva e dá visibilidade a um acervo com cerca de 63.000 documentos com texto completo2, referentes às publicações científicas (externas e internas) produzidas por pesquisadores, tecnologistas e alunos de pós-graduação do INPE. Deste acervo, cerca de 3.100 documentos são referentes às teses e dissertações defendidas, desde 1968, nos cursos de pós-graduação oferecidos pelo Instituto.

As teses e dissertações do INPE, por abrangerem temas e áreas do conhecimento muito especializadas (algumas únicas no país), são os principais documentos buscados e acessados na BDMCI por alunos e pesquisadores de outras instituições acadêmicas e de pesquisa, tanto nacionais quanto internacionais.

No entanto, a principal forma de localização e recuperação desses documentos na BDMCI é por meio de um campo de busca textual, que exige do usuário noções de lógica (operadores booleanos) e o conhecimento prévio das siglas dos cursos, áreas e linhas de pesquisa do INPE, para que possa elaborar as expressões de busca corretamente. Alguns links para buscas prontas, últimas submissões e tutoriais de construção de expressões de busca foram disponibilizados na plataforma, porém são pouco acessados e geram muitas dúvidas aos usuários. Há ainda a possibilidade de pesquisa por navegação, porém essa modalidade permite encontrar documentos somente pelo curso, não sendo possível seu refinamento por tema, ano, orientador, entre outros metadados.

As pesquisas em organização e representação do conhecimento registram importantes avanços em relação aos instrumentos e recursos utilizados para a localização de informações documentárias. Dentre eles, destaca-se a abordagem facetada. De acordo com Broughton (2006), a abordagem facetada permite ao usuário navegar pela estrutura conceitual das informações armazenadas em um repositório e, além disso, combinar conceitos de diferentes facetas (janelas ou menus). Tal abordagem é, portanto, não apenas um auxílio à visualização e navegação, mas também uma ferramenta para a formulação de consultas, que permite a pesquisa por palavras-chave modificáveis a partir de um vocabulário controlado.

A crescente utilização, desde os anos 2000, da navegação facetada em ambientes Web possibilita que as buscas sejam refinadas de forma progressiva, de modo que o usuário saiba, exatamente, quais informações estão disponíveis no repositório ou banco de dados, evitando assim que a busca retorne sem a exibição de resultados (MACULAN, 2011). Outra vantagem é que, por meio dessa interface de navegação, o usuário pode efetuar buscas avançadas sem a necessidade de indicar as combinações lógicas, uma vez que tais combinações estão semanticamente implícitas na estrutura facetada. Desta forma, o usuário pode, então, escolher níveis de especificidade e restringir a busca gradativamente, ao utilizar os termos dispostos na taxonomia facetada, como se fosse um menu da própria interface.

Ainda de acordo com Maculan (2011), a navegação facetada pode oferecer ao usuário de uma biblioteca digital informações já estruturadas (organizadas), com resultados já refinados, sob a perspectiva das necessidades de informação desse usuário. Isso a partir de uma estrutura relativamente intuitiva, o que minimizaria os problemas encontrados na busca simples (ambiguidade de termos) e na busca avançada (dificuldade de utilização).

Diante dessa perspectiva, o objetivo deste artigo é apresentar uma proposta de enumeração de categorias fundamentais, com base nos trabalhos do matemático e bibliotecário indiano S. R. Ranganathan e do Classification Research Group (CRG). As categorias fundamentais aqui propostas servirão de base para a construção de uma interface de navegação facetada, que possa vir a ser aplicada em um novo mecanismo de busca de documentos na BDMCI.

Acredita-se que a navegação facetada pode auxiliar na organização das teses e dissertações do INPE na BDMCI, por meio da representação dos conceitos em um sistema facetado de termos, navegável pelo usuário, de forma a facilitar o acesso às informações.

Além disso, ao ter origem em vocabulários controlados, as categorias fundamentais possibilitarão a padronização da terminologia utilizada no mecanismo de busca, de modo a excluir as ambiguidades e, assim, melhorar a eficiência da recuperação de documentos.

Para a consecução do objetivo deste trabalho foi realizada uma pesquisa de natureza aplicada, de abordagem qualitativa e do tipo exploratória, a qual emprega como métodos a construção de corpus por meio da pesquisa bibliográfica e aplicação da análise de domínio com recursos à bibliometria e à pesquisa terminológica.

Quanto aos métodos empregados nesta pesquisa exploratória, primeiramente foi realizada uma pesquisa bibliográfica na coleção principal da base Web of Science, utilizando o termo facet analysis, com o objetivo de fundamentar a análise e classificação facetada de Ranganathan e os aprimoramentos efetuados nesta teoria pelo CRG. A partir dos resultados desta pesquisa, foram selecionados como referencial teórico os trabalhos de Kwasnick (1999); Mills (2004); Broughton (2006, 2008); Hjørland (2002, 2004, 2013); e Ferreira; Maculan; Naves (2017). Além disso foi realizada uma pesquisa documental, a fim de coletar termos que descrevam as linhas de pesquisa e os temas de interesse de cada linha, além de obter os metadados referentes às teses e dissertações depositadas na BDMCI. Para a proposta apresentada neste trabalho, foram escolhidas somente as teses e dissertações do curso de pós-graduação em Meteorologia, por este ser um dos cursos mais antigos ofertados pelo INPE (início em 1968), e por não ter sofrido alterações profundas em sua estrutura e linhas de pesquisa ao longo do tempo, o que permite a criação de categorias que abrangem teses e dissertações de todos os anos de funcionamento do curso.

Em seguida foi realizada uma análise de domínio a partir do material obtido na pesquisa documental, sendo aplicadas duas abordagens: a) um estudo bibliométrico, a partir da seleção das palavras-chave das teses e dissertações que melhor correspondiam aos temas de interesse de cada linha de pesquisa; e b) um estudo terminológico, por meio o qual as palavras-chave selecionadas foram normalizadas de acordo com o Vocabulário Meteorológico Internacional (Meteoterm3).

Por fim, como procedimento empírico ou experimental, a partir da análise de domínio, e com base no referencial teórico obtido da pesquisa bibliográfica realizada, foram criadas as categorias fundamentais propostas neste trabalho.

2 ANÁLISE E CLASSIFICAÇÃO FACETADA

A análise e a classificação facetada surgiram a partir dos trabalhos do matemático e bibliotecário indiano S. R. Ranganathan, que postulou que haveria sempre muitas maneiras (perspectivas ou facetas) de representar um artefato qualquer (KWASNIK, 1999). A teoria da análise facetada foi publicada inicialmente em 1937 no livro Prolegomena to Library Classification, de autoria de Ranganathan.

Para Kwasnik (1999), na análise facetada, o conceito mais importante é a faceta, que é entendida como a parte resultante da aplicação de um princípio de divisão, ou seja, a identificação de uma diferença ou característica. Nesse sentido, de acordo com Hjørland (2013), Ranganathan descreveu em sua teoria dois tipos de facetas: a) assuntos básicos, que são aqueles que não apresentam ideias isoladas como um componente; b) qualificações de assuntos básicos, que ele denominou isolados, como, por exemplo, espaço e tempo.

Além das facetas, Ranganathan também apresenta outros conceitos importantes para a organização do conhecimento, sendo o principal deles a categoria fundamental, usado para designar ideias fundamentais que permitem a divisão do universo do conhecimento em classes abrangentes, funcionando como um primeiro parâmetro classificatório dentro deste universo (CAMPOS; GOMES, 2003).

Conforme descreve Hjørland (2013), Ranganathan descobriu que os seguintes tipos de facetas isoladas eram necessários e suficientes para caracterizar todos os documentos existentes ou a serem produzidos no futuro:

  • personalidade (personality) é a característica distintiva de um assunto;

  • matéria (matter) é o material físico do qual um assunto pode ser composto;

  • energia (energy) é qualquer ação que ocorre com relação ao assunto;

  • espaço (space) é o componente geográfico da localização de um assunto;

  • tempo (time) é o período associado a um assunto.

Esses cinco tipos de facetas isoladas são conhecidos pelo acrônimo PMEST, cujo arranjo é usado para estabelecer a ordem das facetas, ou seja, uma escala de importância das cinco dimensões de cada assunto, de acordo com a diminuição da concretude (HJØRLAND, 2013).

Ainda de acordo com Hjørland (2013), ao aplicar esta fórmula, para cada assunto isolado deve haver um processo de construção de uma classificação que possibilite a divisão de cada assunto em seus conceitos básicos, ou seja, a identificação de classes nessa classificação refere-se à parte analítica do processo. Por outro lado, construir um descritor de assunto combinando classes isoladas é a parte sintética do processo. Assim, conclui-se que a análise facetada emprega uma metodologia analítico-sintética para a classificação de assuntos.

No entanto, segundo Lancaster (1993), pelo fato da fórmula PMEST indexar assuntos altamente complexos, há a possibilidade de que uma categoria venha a ocorrer mais de uma vez, bem como a de que uma categoria venha a ser subdividida para, por exemplo, indicar tipos diferentes de atividades. Mas é importante ressaltar que a fórmula PMEST não abrange de forma clara alguns atributos importantes para a indexação de alguns assuntos específicos como, por exemplo, as propriedades dos materiais.

Ainda assim, na visão de Broughton (2006), a principal inovação na análise facetada foi atestar que não apenas existiam conceitos recorrentes a praticamente todos os assuntos, mas que também existiam tipos comuns de conceitos dentro dos próprios assuntos. Além disso, uma característica principal da análise facetada é a clareza na expressão dos relacionamentos entre conceitos, tanto os relacionamentos intra-facetas (semânticos), quanto os relacionamentos entre facetas (sintáticos).

Neste aspecto, o potencial de combinar termos de facetas diferentes faz com que a classificação facetada seja significativamente diferente de uma classificação enumerativa (BROUGHTON, 2006). Enquanto a classificação enumerativa busca idealmente listar todos os assuntos possíveis, prevendo, inclusive, suas combinações, na classificação facetada, por outro lado, as classes são construídas, quando necessárias, por meios de combinações de conceitos em processos de análise e síntese.

Ainda com relação à análise facetada, Broughton (2006) afirma que a ordem de citação das facetas controla vários aspectos da classificação, uma vez que: fornece regras para a ordem da combinação de termos; determina quais aspectos em um assunto são reunidos e quais são distribuídos; e afeta a estrutura lógica do sistema e a eficácia da recuperação. Assim, em vez de tomar uma decisão sobre a ordem de citação em todos os locais de composição, a classificação facetada tem uma regra geral, conhecida como ordem de citação padrão (Personality, Material, Energy, Space e Time), que pode ser invertida, começando pelas facetas mais abstratas como tempo e espaço.

Dessa forma, a análise facetada pode fornecer ferramentas eficazes para o gerenciamento de vocabulários e para a representação e recuperação de documentos. Além disso, fornece uma metodologia racional para a construção de uma classificação, em contraste com os agrupamentos de classes inteiramente pragmáticos, anteriores à sua invenção (BROUGHTON, 2006).

Broughton (2006) ainda esclarece que, inicialmente, a análise e classificação facetada não tiveram grande impacto no mundo em geral, mas que no início dos anos 90 isso começou a mudar e a influência da análise de facetas passou a ser vista nos sistemas gerais de classificação. Além disso, alguns sistemas começaram a considerar os benefícios da abordagem facetada para recursos digitais não gerenciados, bem como para a indexação e a descrição de objetos digitais. Hjørland (2013) ressalta que, desde o início do século XXI, técnicas facetadas estão sendo cada vez mais usadas no design de páginas da Web. Nesse contexto, a classificação facetada pode oferecer os seguintes benefícios (BROUGHTON, 2006):

  • a capacidade de expressar, por meio da síntese, a complexidade do conteúdo do assunto, típico dos documentos digitais;

  • uma sintaxe do sistema que garante que isso seja gerenciado de maneira regular e consistente;

  • uma estrutura rigorosamente lógica que seja compatível com a manipulação da máquina em qualquer nível;

  • uma estrutura que seja compatível com uma interface gráfica para navegação do usuário final e a formulação de consultas;

  • a facilidade, por meio da variação ou rotação da ordem de citação, para permitir abordagens a partir de vários ângulos (isto é, pesquisa entre domínios);

  • uma estrutura e metodologia que permite a conversão para outros formatos de índice (listas de assuntos e tesauros); e

  • recursos que permitem a pesquisa modificável de palavras-chave, por meio vocabulários de mapeamento, e o controle de vocabulário por meio de tesauros, além de fornecer ferramentas para navegação e exibição na lista de assuntos.

Desta forma, a classificação facetada se tornou um importante método de organização e exibição da informação na Web. Ainda segundo Broughton (2006), com o advento da tecnologia Windows nos anos 90, o usuário passou a empregar uma técnica híbrida de pesquisa chamada navegar e selecionar, com as opções disponíveis sendo exibidas nos menus suspensos. Isso empregava várias janelas suspensas com base em uma estrutura facetada que permitia ao usuário navegar na estrutura conceitual do armazenamento de informações e, o mais importante, combinar conceitos de diferentes facetas, tornando-a uma ferramenta para a formulação de consultas.

3 APRIMORAMENTOS DA TEORIA DE RANGANATHAN

De acordo com Broughton (2006), em meados do ano de 1955, o recém-formado Classification Research Group (CRG) do Reino Unido publicou no Library Association Record uma declaração na qual “proclamava seu desejo de ver a classificação facetada como base de toda a recuperação de informações”. O CRG era formado pelos principais expoentes da teoria da classificação: bibliotecários, acadêmicos, professores e pesquisadores, tais como: Derek Austin, Eric Coates, Jason Farradane, Douglas Foskett, Derek Langridge, Jack Mills e Brian Vickery.

Naquela época, conforme relata Broughton (2006), os tesauros estavam apenas nascendo como ferramenta para representação e recuperação da informação, sendo que a maior parte do trabalho de indexação ainda era feita usando listas de palavras-chave, geralmente compostas por termos extraídos da própria documentação e sem qualquer sistema de referência cruzada ou controle de vocabulário.

Diante deste cenário, os membros do CRG começaram a aplicar a análise facetada de uma maneira experimental, como base de novas abordagens de classificação, principalmente para bibliotecas especializadas. Isso levou o CRG a iniciar um projeto para construção de um novo esquema de classificação baseado em princípios facetados, porém, o trabalho nunca resultou em um esquema de classificação propriamente dito, mas grande parte deste projeto contribuiu para o sistema de indexação PRECIS, desenvolvido para a British National Bibliography (BROUGHTON, 2006).

Além disso, conforme destacam Ferreira, Maculan e Naves (2017), o CRG se propôs a aprimorar o trabalho de Ranganathan. Ao estudar o modelo de Ranganathan, o CRG concluiu que não havia categorias a priori para classificar os assuntos. Eles argumentaram que as categorias são derivadas do assunto a ser classificado em cada contexto específico.

No entendimento de Mills (2004), embora as categorias e sua ordem de citação tenham sua praticidade demonstrada de forma clara na Colon Classification, o CRG procurou desenvolver um conjunto mais detalhado de categorias, totalmente consistente com o PMEST no resultado, porém mais explícito na interpretação dos conceitos de personalidade (personality) e energia (energy).

Desta forma, o CRG expandiu as categorias fundamentais da fórmula PMEST de cinco para treze, conforme enumera Broughton (2006): coisa (thing), tipo (kind), peça (part), propriedade (property), material (material), processo (process), operação (operation), agente (agent), paciente (patient), produto (product), subproduto (by-product), espaço (space) e tempo (time). Estas categorias podem acomodar o vocabulário da maioria das disciplinas existentes, embora as áreas de artes e humanidades frequentemente exijam algumas outras (forma, estilo, gênero). Além disso, nada impede que novas categorias fundamentais possam ser descobertas ou inventadas.

Lima (2004) destaca que estas 13 categorias fundamentais formam a base da análise facetada, conforme definido pela declaração do CRG e, quando comparadas à fórmula PMEST de Ranganathan, acabam sendo mais atraentes para os classificadores devido à sua maior flexibilidade, podendo ainda serem moldadas para assuntos específicos, o que permite a formação de categorias distintas e bem definidas.

Assim, para Broughton (2006), tanto no modelo de Ranganathan quanto no modelo do CRG, o universo do discurso é a disciplina. Nenhum desses modelos tenta uma aplicação unitária das categorias fundamentais a todo o conhecimento, mesmo que tenha havido naquele grupo uma discussão considerável sobre a viabilidade disso, o que na prática, acabou sendo visto como impraticável.

A classificação facetada diz respeito a uma série de classificações de assuntos, cada um com sua própria estrutura de facetas e ordem de citação (BROUGHTON, 2006). A faceta primária não é, portanto, uma disciplina, muito embora exista uma divisão inicial em disciplinas, o que é externo à aplicação apropriada da análise facetada. Além disso, o que constitui uma faceta e a natureza precisa da análise facetada está sujeito a diferentes interpretações: alguns usam a análise de facetas de uma maneira muito mais limitada, outros entendem que as facetas abrangem um pouco mais do que os aspectos semânticos dos documentos (BROUGHTON, 2006).

Por sua vez, Hjørland (2013) ressalta que a segunda edição da Classificação Bibliográfica Bliss (BC2), criada por Henry Evelyn Bliss (um dos membros do CRG), também é um produto importante desse grupo de pesquisadores e é, provavelmente, o sistema baseado na abordagem facetada mais avançado teoricamente. Consequentemente, conforme afirma Broughton (2006), a BC2 se tornou o principal veículo para a expressão do trabalho de CRG em uma classificação.

Conforme Mills (2004), a BC2 reestruturou completamente todas as classes individuais, de forma que cada classe passou a ser totalmente analítico-sintética em sua estrutura e notação. Isso corrobora para que a BC2 tenha se tornado a classificação geral mais detalhada e totalmente facetada existente.

Mills (2004) ainda destaca que a BC2 foi o principal desenvolvimento na área da classificação para recuperação da informação em bibliotecas nos últimos cinquenta anos, embora tenha sido formulada primeiramente no trabalho de Ranganathan. Apesar de Ranganathan nunca ter se referido explicitamente ao fato, a característica fundamental de sua Colon Classification é que ela divide qualquer assunto de acordo com as regras da divisão lógica (MILLS, 2004).

Mas essa divisão lógica não é tudo, uma vez que o trabalho sobre a BC2, cobrindo todos os campos do conhecimento, mostrou claramente que o design de uma classificação especial requer o reconhecimento das seis etapas fundamentais relacionadas a seguir (MILLS, 2004, tradução livre):

  • dividir o assunto em facetas amplas (categorias);

  • dividir cada faceta em subfacetas específicas (geralmente chamadas de renques, conforme Ranganathan);

  • decidir a ordem de citação entre facetas e entre renques;

  • decidir a ordem de citação entre facetas e entre renques e a ordem das classes dentro de cada renque;

  • adicionar uma notação;

  • acrescentar um índice A/Z.

Estas seis etapas devem, necessariamente, ser executadas nesta ordem, pois cada etapa depende da conclusão da etapa anterior. Apenas as duas primeiras etapas fazem uso da divisão lógica; as demais etapas usam procedimentos extra lógicos (MILLS, 2004).

À medida que uma classificação facetada se move para uma análise cada vez mais detalhada de um assunto, mais e mais matrizes são criadas e algumas delas passaram a apresentar problemas especiais, tais como as que possuem termos que aparecem em uma faceta como qualificação e em outra faceta como especificação. Diante disso, a BC2 passou a fazer distinção entre qualificação e especificação, o que foi considerado por Metcalfe (1957 apudMILLS, 2004) como uma característica importante das relações encontradas na indexação. Isso reflete a distinção entre as relações semânticas e sintáticas (MILLS, 2004).

Como resultado de seu extenso estudo das relações entre as disciplinas, e diante dos aprimoramentos apresentados na BC2 em relação ao modelo de Ranganathan, Henry Bliss seria, conforme a concepção de Broughton (2008), em muitos aspectos, o progenitor da abordagem analítico-sintética que resultou na teoria da análise facetada. Além disso, a autora considera que seus escritos teóricos representam um divisor de águas entre os sistemas de classificação pragmáticos do século XIX e as classificações cientificamente estruturadas do século XX, ainda que a American Library Association sempre tenha se recusado a publicar qualquer um de seus trabalhos teóricos.

Por fim, Broughton (2008) ressalta que no momento da elaboração do trabalho de Bliss a análise facetada ainda não estava estabelecida, mas o que realmente surpreende a autora é até que ponto as estruturas de Bliss se adaptaram à aplicação da teoria posterior. Além disso, por causa da aplicação do princípio geral antes do especial, a BC2 apresenta o princípio de inversão no cronograma, uma característica agora considerada essencial em um esquema facetado, mas que Ranganathan não havia reconhecido em seus trabalhos.

4 PROCEDIMENTOS METODOLÓGICOS

A seguir estão descritos de forma detalhada os procedimentos que resultaram na criação das categorias fundamentais a serem propostas para a construção de uma interface de navegação facetada para organizar as teses e dissertações do INPE em sua biblioteca digital, conforme metodologia apresentada anteriormente.

Inicialmente, foram coletados, na página oficial do Programa de Pós-Graduação em Meteorologia (PPG-MET)4 do INPE, alguns termos que descrevem as linhas de pesquisa do curso e os temas de interesse trabalhados em cada uma dessas linhas de pesquisa. Estes termos estão relacionados no Quadro 1.

Quadro 1
Relação de termos coletados na página do PPG-MET do INPE, referentes às linhas de pesquisa e aos temas de interesse de cada linha.

Fonte: Elaborado pelos autores.

Em seguida, foi efetuada uma busca na BDMCI pelas referências das teses e dissertações publicadas no âmbito do PPG-MET do INPE (a expressão de busca utilizada foi ref thesis and course met), na qual foram encontradas 501 referências, o que representa todas as teses e dissertações deste curso, publicadas no período de 1970 a 2019.

A página de resultados em formato completo (Refer), contendo os metadados de cada uma das referências encontradas, foi exportada para um arquivo texto. Este arquivo foi importado no software gerenciador de referências Zotero e, a partir dele, os metadados recuperados foram novamente exportados, agora em um arquivo no formato RIS (Research Information Systems), para ser importado no software VOSViewer, a fim de possibilitar a realização da análise de domínio.

A análise de domínio é uma proposta metodológica que, na concepção de Hjørland (2004), conecta teoria e prática, propiciando uma visão coerente de todos os principais conceitos de uma área, criando condições de unir para isso diferentes subdisciplinas, tais como bibliometria, organização do conhecimento, recuperação da informação, entre outras. Para Tennis (2003), um domínio pode ser entendido como uma área de especialização, um acervo bibliográfico, ou mesmo um sistema de pessoas e práticas trabalhando com uma linguagem comum. Neste sentido, das onze abordagens discutidas em Hjørland (2002) que podem ser aplicadas dentro da análise de domínio, segundo a interpretação de Tennis (2003), duas são empregadas no contexto deste trabalho, como será visto a seguir.

A primeira abordagem é a bibliometria, considerada pelo autor como uma abordagem forte, uma vez que é capaz de mostrar muitas conexões detalhadas e reais entre documentos individuais. Por isso, pode ser usada como ferramenta e método na análise de domínios de diversas maneiras, como por exemplo, ao produzir mapas bibliométricos ou visualizações de áreas científicas com base em análise de cocitação (HJØRLAND, 2002). Neste trabalho será utilizada uma análise de coocorrência para seleção de palavras-chaves das teses e dissertações que irão compor as facetas da estrutura de classificação proposta.

Já a segunda abordagem é a de construção de classificações especiais e tesauros. Ainda de acordo com o autor, grande parte das pesquisas sobre classificação da informação é voltada para a criação de esquemas universais de classificação. Diante disso, os tesauros surgem como vocabulários de domínio específico, cuja metodologia de construção pode ser entendida como uma forma de análise de domínio, e que, na sua melhor expressão, relaciona-se com o método analítico de facetas na classificação. Todavia, tanto os sistemas de classificação quanto os tesauros são baseados em conceitos centrais de um domínio, organizados de acordo com relações semânticas, razão pela qual as metodologias para a sua construção devem estar fundamentalmente relacionadas (HJØRLAND, 2002). Neste trabalho, esta abordagem será empregada por meio da realização de um estudo terminológico das palavras-chaves selecionadas na abordagem bibliométrica.

Para Tennis (2003), as onze abordagens discutidas em Hjørland (2002) não permitem compartilhar as definições e os limites do domínio analisado. Segundo a autor, outros dois dispositivos analíticos deveriam ser empregados para solucionar esta questão. O primeiro dispositivo é chamado de Áreas de Modulação, que define parâmetros sobre os nomes e extensão do domínio. Já o segundo dispositivo é chamado de Graus de Especialização, que qualifica e define a intencionalidade do domínio. Assim, no contexto deste trabalho, a área de modulação é a meteorologia como ciência que estuda o tempo e o clima. Já os graus de especialização são as linhas de pesquisas estudadas nas atividades do curso de pós-graduação em meteorologia do INPE.

Além disso, de acordo com Beghtol (1995), para a realização de uma análise de domínio devem ser incluídos ao menos dois processos nesta atividade: determinar as categorias fundamentais de uma área; e, analisar detalhadamente os tópicos, assuntos e questões que os autores dessa área consideram relevantes para a pesquisa. Isso vai ao encontro do objetivo deste trabalho, que é propor categorias fundamentais para organização de teses e dissertações na área de meteorologia no âmbito de um Programa de Pós-Graduação, o que justifica a escolha deste método.

Desta forma, a partir do material coletado na pesquisa documental foi realizada uma análise bibliométrica que possibilitou, por meio dos metadados importados no software VOSViewer, identificar e gerar uma lista individualizada das palavras-chave indicadas pelos autores nas teses e dissertações em meteorologia do INPE. Nessa lista foram selecionadas somente as palavras-chave que correspondiam a algum dos temas de interesse das linhas de pesquisa do PPG-MET (palavras-chave temáticas), bem como aquelas que faziam referência a um local ou região ao qual o estudo se aplica (palavras-chave geográficas).

No passo seguinte, estas palavras-chave temáticas foram normalizadas de acordo com o Vocabulário Meteoterm (criado e mantido pela Organização Meteorológica Mundial - WMO, em inglês) para, no passo seguinte, serem associadas aos temas de interesse das linhas de pesquisa, conforme exibido no Quadro 2.

Quadro 2
Associação entre as linhas de pesquisa e temas de interesse do PPG-MET do INPE, e as palavras-chave das teses e dissertações, normalizadas pelos termos do Vocabulário Meteoterm.

Fonte: Elaborado pelos autores.

Por fim, a partir dos termos normalizados exibidos no Quadro 2, das palavras-chave de localização, e dos demais conteúdos coletados no sítio do programa de pós-graduação em meteorologia do INPE, foi possível efetuar a criação das facetas, ou categorias fundamentais, objetivo deste trabalho.

5 RESULTADOS OBTIDOS

Assim, como resultado deste trabalho, são propostas as seguintes categorias fundamentais, e respectivos termos (ou conceitos), ordenados de acordo com a fórmula PMEST de Ranganathan, expandida pelo CRG (BROUGHTON, 2006):

  • (Thing - documento) Trabalho de conclusão;

  • (Kind - tipo) Dissertação, Tese;

  • (Process - curso) Meteorologia;

  • (Operation - linha de pesquisa) Estudos e modelagem do clima; Sensoriamento remoto da atmosfera; Interação oceano-atmosfera; Interação biosfera-atmosfera; Estudos e modelagem do tempo; Meteorologia ambiental;

  • (Product - tema) Anomalias climáticas, Climatologia, Mudanças climáticas, Paleoclima, Previsão sazonal do clima; Agrometeorologia, Hidrometeorologia, Espectro de radiação, Radar meteorológico, Radiação solar, Satélites meteorológicos, Sistema Terra-Atmosfera, Sistemas atmosféricos; Acoplamento Oceano-Atmosfera, Ciclos de carbono, El Niño, Ondas oceânicas; Ciclo hidrológico, Cobertura da vegetação, Hidrologia de superfície, Micrometeorologia; Circulação atmosférica, Conservação, Modelos atmosféricos, Previsão do tempo, Camada limite, Precipitação, Processos termodinâmicos, Simulação numérica, Meso-escala, Sistemas de tempo, Meteorologia sinótica, Assimilação de dados, Previsão numérica; Ciclos biogeoquímicos, Dispersão de poluentes, Emissões antrópicas, Fontes renováveis, Previsão de impactos ambientais, Poluição ambiental;

  • (By-product - Especialização do tema) Conservação: de energia, de massa, de momentum; Climatologia: geral, dinâmica, sinótica;

  • (Space - Localização) Oceano Atlântico, Hemisfério Sul, Atlântico Sul, América do Sul, Brasil, Amazônia, Pantanal, Nordeste do Brasil, Sudeste do Brasil, Sul do Brasil;

  • (Time - Ano de publicação) 1970, [...], 2020.

Como pode ser notado, nem todas as 13 categorias fundamentais da fórmula PMEST expandida pelo CRG foram utilizadas nesta proposta. Isso se deve ao fato de que as categorias utilizadas já são suficientes para atender às necessidades de informação dos usuários (dimensões) na montagem das facetas navegacionais para recuperação das teses e dissertações na BDMCI. A Figura 1 ilustra, na forma de uma estrutura facetada, as categorias e respectivos termos elencados acima.


Figura 1
Estrutura facetada proposta para as teses e dissertações em meteorologia do INPE.
Fonte: Elaborado pelos autores.

Para demonstrar a viabilidade e eficácia da estrutura facetada proposta neste trabalho, é apresentada a seguir uma comparação entre esta estrutura e a forma atual de busca disponível na BDMCI, que se dá por meio de um campo textual no qual podem ser consultados os seguintes metadados: thes (tipo de trabalho - tese ou dissertação); course (curso); year (ano); au (autor); e - (palavra-chave). Todos estes campos de metadados podem ser combinados na expressão de busca utilizando os operadores lógicos and, or e not. Desta forma, para efetuar uma busca pelas dissertações do curso de meteorologia, publicadas no ano de 2015, na linha de pesquisa estudos e modelagem do clima, no tema climatologia, do tipo sinótica, na região sul do Brasil, é necessária a formulação da seguinte expressão: thes dissertacao and course MET and - climatologia and - sinótica and - sul do brasil and year 2015.

Já para efetuar a mesma busca utilizando a estrutura facetada proposta neste trabalho, bastaria selecionar os respectivos termos de cada uma das facetas (categorias) da estrutura apresentada na Figura 1, conforme exibido na Figura 2.


Figura 2
Facetas a serem selecionadas na estrutura apresentada na Figura 1 para efetuar a mesma busca formulada por meio do campo textual.
Fonte: Elaborado pelos autores.

Ao comparar as consultas formuladas por meio do campo textual e por meio da estrutura facetada (Figura 2), é possível perceber que para formular a expressão de busca textual se faz necessário que o usuário detenha conhecimento prévio da sintaxe de construção dessa expressão, bem como dos nomes dos campos de metadados thes (tipo de trabalho de conclusão), course (nome do curso de pós-graduação) e year (ano de publicação), além do operador lógico and e das palavras chaves (antecedidas do sinal -) que identificam o tema, subtema e a respectiva localização espacial que deseja pesquisar.

Já no caso de se fazer a mesma busca por meio da estrutura facetada proposta neste trabalho, seria necessário apenas selecionar (cliques) o tipo de trabalho, curso, linha de pesquisa, tema e subtema, localização espacial e o ano de publicação a serem pesquisados, sem a necessidade do conhecimento prévio necessário para formular a busca textual. Isso possibilita que uma ferramenta de busca que venha a ser desenvolvida utilizando esta estrutura facetada possa ser utilizada por usuários não especialistas no domínio da meteorologia, além de trazer maior precisão e menor possibilidade de erros na construção de uma expressão de busca.

6 CONSIDERAÇÕES FINAIS

As categorias fundamentais propostas neste trabalho, e seus respectivos termos ou conceitos, poderão contribuir de forma significativa para a construção de um mecanismo de busca facetada para as teses e dissertações na BDMCI. Uma vez que os termos e conceitos destas categorias fundamentais foram extraídas das palavras-chaves de trabalhos existentes na BDMCI, as buscas a partir deste mecanismo sempre terão resultados para exibir, permitindo um refinamento destas buscas de forma progressiva, a partir dos demais termos dispostos em suas facetas. Com isso, espera-se que um mecanismo de busca facetada possibilite ao usuário da BDMCI o atendimento de suas necessidades de informação, a partir de uma interface fácil de usar e interpretar, minimizando os problemas atualmente encontrados, principalmente quanto à elaboração de buscas avançadas.

A partir da análise de domínio (teses e dissertações em meteorologia do INPE) efetuada neste trabalho foi possível a identificação das categorias fundamentais que servirão de base para a construção de um mecanismo de busca facetada.

Por sua vez, por meio da análise facetada realizada no processo de criação das categorias fundamentais aqui propostas, foi possível notar uma maior clareza na expressão dos relacionamentos sintáticos (entre facetas) e semânticos (intra-facetas) entre os termos e conceitos de cada categoria (faceta) proposta. Consequentemente, este potencial para combinar termos de facetas diferentes pode melhorar de forma significativa a eficácia do mecanismo de busca e recuperação de documentos da BDMCI.

Como trabalho futuro, as categorias fundamentais aqui propostas ainda precisam passar por um procedimento de validação, de forma que sua aplicação real poderá exigir novos ajustes na direção de um conjunto de categorias fundamentais definitivo.

Após esse procedimento de validação, as categorias fundamentais definitivas poderão ser expandidas para possibilitar a recuperação, na BDMCI, das teses e dissertações dos demais programas de pós-graduação do INPE. Para isso, basta acrescentar os respectivos termos, obtidos em procedimentos análogos aos apresentados neste trabalho. Esta flexibilidade, somada à possibilidade de as facetas serem moldadas para assuntos específicos, permitirá a formação de categorias distintas e bem definidas, também contribuindo para maior eficácia do mecanismo de busca.

Por fim, é esperado que a metodologia e os procedimentos descritos neste trabalho sirvam de referência para que outras instituições, que apresentem problemas e necessidades semelhantes em suas plataformas de biblioteca digital, possam criar uma estrutura de categorias fundamentais visando a construção de mecanismos de busca por navegação facetada, de forma a minimizar os problemas encontrados por seus usuários na elaboração de buscas, bem como melhorar a eficácia da recuperação de documentos nestas plataformas.

AGRADECIMENTOS

Agradecemos ao Dr. Gerald Jean Francis Banon, Pesquisador Titular do Instituto Nacional de Pesquisas Espaciais (INPE), pelo apoio dado durante a coleta de dados.

REFERÊNCIAS

BEGHTOL, C. Domain analysis, literary warrant, and consensus: The case of fiction studies. Journal of the American Society for Information Science, New York, v. 46, n. 1, p. 30-44, 1995.

BRASIL. Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES). Portaria n. 13, de 15 de fevereiro de 2006. Institui a divulgação digital das teses e dissertações produzidas pelos programas de doutorado e mestrado reconhecidos. CAD: Catálogo de Normas e Atos Administrativos. Disponível em: http://cad.capes.gov.br/ato-administrativo-detalhar?idAtoAdmElastic=822#anchor . Acesso em 16 dez. 2019.

BROUGHTON, V. The need for a faceted classification as the basis of all methods of information retrieval. Aslib Proceedings: New Information Perspectives, Bingley, v. 58, n. 1/2, p. 49-72, 2006.

BROUGHTON, V. Henry Evelyn Bliss - the other immortal, or a prophet without honour? Journal of Librarianship and Information Science, London, v. 40, n. 1, p. 45-58, 2008. DOI: 10.1177/0961000607086620.

CAMPOS, M. L. A.; GOMES, H. E. Organização de domínio de conhecimento e os princípios ranganathianos. Perspectivas em Ciência da Informação, Belo Horizonte, v. 8, n. 2, 2003.

FERREIRA, A. C.; MACULAN, B. C. M. S.; NAVES, M. M. L. Ranganathan and the faceted classification theory. Transinformação, Campinas, v. 29, n. 3, p. 279-295, 2017.

HJØRLAND, B. Domain analysis in information science: eleven approaches traditional as well as innovative. Journal of Documentation, London, v. 58, n. 4, p. 422-462, 2002.

HJØRLAND, B. Domain Analysis: A Socio-Cognitive Orientation for Information Science Research. Bulletin of the American Society for Information Science and Technology, Silver Spring, v. 30, n. 3, p. 17-21, 2004.

HJØRLAND, B. Facet analysis: the logical approach to knowledge organization. Information Processing and Management, Elmsford, v. 49, n. 2, p. 545-557, 2013.

KWASNIK, B. H. The role of classification in knowledge representation and discovery. Library Trends, Champaign, v. 48, n. 1, p. 22-47, 1999.

LANCASTER, F. W. Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos, 1993.

LIMA, G. A. B. O. O modelo simplificado para análise facetada de Spiteri a partir de Ranganathan e do Classification Research Group (CRG). Información, Cultura y Sociedad, Buenos Aires, n. 11, p. 57-72, 2004.

MACULAN, B. C. M. S. Taxonomia facetada navegacional: construção a partir de uma matriz categorial para trabalhos acadêmicos. 2011. 191 f. Dissertação (Mestrado em Ciência da Informação) - Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2011.

MILLS, J. Faceted Classification and Logical Division in Information Retrieval. Library Trends, Champaign, v. 52, n. 3, p. 541-570, 2004.

TENNIS, J. T. Two axes of domains for domains analysis. Knowledge Organization, Wurzburg, v. 30, n. 3/4, p. 191-195, 2003.

Notas

1 Cursos de mestrado e/ou doutorado em Astrofísica, Geofísica Espacial, Meteorologia, Computação Aplicada, Sensoriamento Remoto, Engenharia e Tecnologia Espaciais e Ciência do Sistema Terrestre.
2 Posição em dezembro/2020.
3 Meteoterm é a base de dados de terminologia da World Meteorological Organization (WMO), disponível em http://wmo.multitranstms.com/MultiTransWeb/TermBase/Account.mvc/DirectAccess?languageCode=en-CA&username=Guest
FINANCIAMENTO Não se aplica.
CONJUNTO DE DADOS DE PESQUISA Todo o conjunto de dados que dá suporte aos resultados deste estudo foi publicado no próprio artigo.
CONSENTIMENTO DE USO DE IMAGEM Não se aplica
LICENÇA DE USO Os autores cedem à Encontros Bibli os direitos exclusivos de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution (CC BY) 4.0 International. Estra licença permite que terceiros remixem, adaptem e criem a partir do trabalho publicado, atribuindo o devido crédito de autoria e publicação inicial neste periódico. Os autores têm autorização para assumir contratos adicionais separadamente, para distribuição não exclusiva da versão do trabalho publicada neste periódico (ex.: publicar em repositório institucional, em site pessoal, publicar uma tradução, ou como capítulo de livro), com reconhecimento de autoria e publicação inicial neste periódico.
PUBLISHER Universidade Federal de Santa Catarina. Programa de Pós-graduação em Ciência da Informação. Publicação no Portal de Periódicos UFSC. As ideias expressadas neste artigo são de responsabilidade de seus autores, não representando, necessariamente, a opinião dos editores ou da universidade.
Não se aplica.

Autor notes

Concepção e elaboração do manuscrito: C. M. Pereira, W. Moreira, J.E. Santarem Segundo
Coleta de dados: C. M. Pereira
Análise de dados: C. M. Pereira, W. Moreira
Discussão dos resultados: C. M. Pereira, W. Moreira
Revisão e aprovação: W. Moreira, J. E. Santarem Segundo
Enrique Muriel-Torrado, Edgar Bisset Alvarez, Camila Barros, Genilson Geraldo.

Declaração de interesses

Não se aplica.


Buscar:
Ir a la Página
IR
Visualizador XML-JATS4R. Desarrollado por