Resumo: A indexação de assuntos é responsável por realizar a representação do conteúdo dos recursos informacionais, de forma que possa ser recuperada pelos usuários, em um sistema de info0rmação. O presente trabalho apresenta a importância da indexação no processo de ranqueamento no mecanismo de busca e tem como objetivo verificar como os elementos da teoria e da prática da indexação podem contribuir na recuperação da informação. A pesquisa busca identificar se as técnicas de Search Engine Optimization possuem proximidade com os elementos da indexação de assuntos. Considerando-se a falta de investigações dedicadas ao diálogo entre as duas temáticas, utilizou-se como metodologia a revisão de literatura, a fim de contextualizar o cenário de pesquisa atual sobre ambas as temáticas. Os resultados indicam poucos trabalhos que abordam as temáticas de Search Engine Optimization e indexação, em conjunto. Conclui-se que existe uma integração entre as práticas da indexação e as técnicas de Search Engine Optimization, descrevendo-se quais elementos da indexação podem colaborar para o ranqueamento no mecanismo de busca.
Palavras-chave: Indexação de assuntos, Search Engine Optimization, Web, mecanismos de busca, SEO.
Abstract: Subject indexing is responsible for representing the content of information resources in a way that can be retrieved by users in an information system. This paper presents the importance of indexing in the process of search engine ranking and aims to verify how the elements of the theory and practice of indexing can contribute to information retrieval. The research seeks to identify if Search Engine Optimization techniques have proximity with the elements of subject indexing. Considering the lack of investigations dedicated to the dialog between the two themes, a literature review was used as methodology, in order to contextualize the current research scenario on both themes. The results indicate few works that address the themes of Search Engine Optimization and indexing, together. It is concluded that there is an integration between indexing practices and Search Engine Optimization techniques, describing which elements of indexing can collaborate to search engine ranking.
Keywords: Subject indexing, Search Engine Optimization, Web, search engines, SEO.
Artigo
As técnicas de Search Engine Optimization e os elementos da indexação no processo de ranqueamento em mecanismos de busca
The contribution of indexing to the search engine ranking process
Received: 11 June 2022
Accepted: 25 January 2023
Em uma sociedade cada vez mais conectada, os conteúdos digitais produzidos em ambientes informacionais digitais, redes sociais, blogs e outras plataformas revelaram um crescimento exponencial nos últimos anos no sentido de produção de informações. Diante desse volume de conteúdos digitais produzidos, surge a necessidade de organizar, representar, localizar e filtrar esses conteúdos, de acordo com sua relevância nos ambientes digitais. O uso de teorias e técnicas no campo da Organização e Representação do Conhecimento apoia a modelagem de um domínio e sua representação, bem como auxilia na construção de um Sistema de Recuperação de Informação (SRI), de maneira que a recuperação do conhecimento registrado seja mais eficiente e eficaz (LIMA, 2020).
São variados os recursos disponíveis na Web, os quais proporcionam autonomia de uso e seleção de tarefas a serem realizadas. Ambientes para diversas tarefas, como e-commerce, e-learning, e-science e e-government, vêm se desenvolvendo, e as informações nos ambientes digitais crescem de forma exponencial, causando uma preocupação de como encontrá-las (CONEGLIAN et al., 2017). Desse modo, as teorias e técnicas, no campo da Organização e Representação do Conhecimento, procuram soluções por meio de subsídios teóricos em áreas correlatas que abrangem a esfera interdisciplinar desse campo de estudo, sem perder seu objetivo principal: “[...] tratar a informação para o usuário ter uma recuperação eficiente.” (LIMA, 2020, p. 59).
Com a inovação contínua das Tecnologias de Informação e Comunicação (TICs), a informação digital passou a fazer parte do nosso cotidiano. Nessa conjuntura, são necessárias estruturas de representação e mecanismos de acesso que forneçam tratamento desse ambiente e tipo de recurso informacional (LIMA, 2020). Com o surgimento da Web 2.0 e a sua popularização, o próprio usuário passou a disponibilizar, modificar e marcar conteúdos através de tags, que são palavras-chave ou termos que constituem uma informação e permitem a classificação e a recuperação da informação (OLIVEIRA et al., 2011).
Nesse contexto, surgem as técnicas de Search Engine Optimization (SEO), as quais Jerkovic (2009) descreve como um conjunto de atividades necessárias para gerar um alto volume de referências bem-sucedidas, originárias de mecanismos de busca e diretórios Web, com o objetivo de difundir um ambiente informacional digital, através da análise interna e externa de suas páginas, conteúdos e da quantidade de hiperlinks externos que apontem para essas páginas. Portanto, a adoção de meta tags (campos referentes a metadados), palavras-chave, estudos métricos de acessos e outras técnicas as quais visem a melhorar o posicionamento de páginas Web, em mecanismos de busca, constituem toda a estrutura de recursos que formam o SEO.
Considerando as técnicas de SEO que orientaram e conduziram esta pesquisa, propôs-se a seguinte questão: no processo das aplicações das técnicas de SEO, quais os elementos da indexação de assuntos, no processo de ranqueamento em mecanismos de busca? A partir da contextualização das técnicas de SEO e indexação de assuntos, o objetivo desta investigação consiste em identificar se as técnicas de Search Engine Optimization têm proximidade com os elementos da indexação de assuntos, já que essas técnicas advindas do marketing digital não possuem enfoque na Organização do Conhecimento (OC), direcionada para a recuperação da informação e campo de estudo nuclear, no âmbito da Biblioteconomia e da Ciência da Informação.
Dessa maneira, este trabalho realizou uma revisão bibliográfica sobre as técnicas de Search Engine Optimization, na base de dados da Ciência da Informação no cenário nacional. Foram utilizadas as seguintes palavras-chave: search engine optimization AND indexing, search engine optimization e, por fim, a string “indexing”.
Os estudos da indexação de assuntos são essenciais para fins de recuperação da informação, uma vez que estão alicerçados na área de Biblioteconomia e Ciência da Informação. O processo de indexação de assuntos “[...] consiste na tradução de um documento em termos documentários, isto é, em descritores, cabeçalhos de assunto, termos-chave, que têm por função expressar o conteúdo do documento.” (CINTRA, 1983, p. 5).
Enfatiza Rubi (2009, p. 81):
A indexação diz respeito à identificação do conteúdo do documento por meio do processo de análise de assunto e à representação desse conteúdo por meio de conceitos. Esses conceitos, por sua vez, serão representados ou traduzidos em termos advindos de uma linguagem documentária, com vistas à intermediação entre o documento e o usuário no momento da recuperação da informação, seja em índices, catálogos ou bases de dados.
O processo de indexação de assuntos é composto por diferentes etapas, as quais variam, segundo os autores: duas (UNISIST, 1981; CHAUMIER, 1986; LANCASTER, 1993), três (ABNT, 1992) e quatro (VAN SLYPE, 1991; ROBREDO, 2005). Conforme Rubi (2009), embora os autores não concordem quanto ao número de etapas, o processo de indexação de assuntos é realizado tendo por base as seguintes operações:
análise - leitura e segmentação do texto para identificação e seleção de conceitos;
síntese - construção do texto documentário com os conceitos selecionados. Está relacionada especificamente à elaboração de resumos;
representação - por intermédio de linguagens documentárias.
O conceito de indexação de assuntos manifestou-se com a elaboração de índices e, atualmente, está mais relacionado à análise de assuntos. Com o progresso da prática, em consequência da demanda de recuperar informações cada vez mais rápidas e eficazes, todos os profissionais que trabalham com a informação passaram a obter um aparato lógico e metodológico diversificado, voltado para o contexto de cada documento (SILVA; FUJITA, 2004).
Por conseguinte, a indexação registra os conceitos de recursos informacionais de forma organizada e mais acessível, por meio da construção de ferramentas de pesquisas bibliográficas. Em seguida, as informações do recurso informacional são representadas por um conjunto de conceitos ou uma combinação de conceitos, e a linguagem de indexação desempenha o papel de conversão desses conceitos selecionados em termos ou símbolos, de sorte a representar as informações em um determinado sistema (HOLANDA; BRAZ, 2012).
Em vista disso, a indexação seria um método subjetivo, sendo possível, portanto, que duas ou mais pessoas selecionem termos distintos, no momento da indexação de certo documento; também é possível que existam opiniões divergentes, em momentos diferentes (LANCASTER, 1993). Para Lima (2004, p. 65), a indexação possui proximidade com a cognição, ao afirmar que “[...] a indexação é o processo intelectual que envolve atividades cognitivas na compreensão do texto e na composição da representação do documento”. Por isso, observa-se que o processo de indexação de assuntos tem como principal atividade capturar o cerne dos assuntos apresentados nos recursos informacionais, a fim de permitir uma recuperação da informação eficaz e eficiente.
Lancaster (1993) aponta que a indexação de assuntos possui dimensões descritas como exaustividade, seletividade e especificidade. A exaustividade ocorre quando se atribui mais de um termo à indexação; já a seletividade se dá quando menos termos são aplicados e incluídos, enquanto a especificidade diz respeito ao conceito, ou seja, quando um documento precisa ser indexado com um termo mais específico, que melhor represente o documento, integralmente. Assim, Fujita (2003, p. 62) afirma que a indexação “[...] condiciona os resultados de uma estratégia de busca”, o que possibilita alcançar um melhor aproveitamento no processo de recuperação da informação, visto que o elemento estabelecido é a representação do conteúdo dos documentos (ARAÚJO JÚNIOR, 2005). Desse modo, “[...] a recuperação do documento mais pertinente à questão de busca é aquela cuja indexação proporcionou a identificação de conceitos mais pertinentes ao seu conteúdo, produzindo uma correspondência precisa com o assunto pesquisado.” (FUJITA, 2003, p. 62).
Borges, Maculan e Lima (2008) ressaltam que existem ao menos duas maneiras de realizar a análise de um documento: a indexação manual e a indexação automática. O processo de indexação manual pode ser dividido em duas fases essenciais: a análise conceitual e a tradução. A fase de análise conceitual evidencia de qual assunto se trata o documento. Nessa fase, a leitura e a compreensão do documento são fundamentais, sobretudo a falta de tempo e a quantidade de documentos são elementos preocupantes ao indexador (BORGES; MACULAN; LIMA, 2008). “Ao indexador raramente é dado o luxo de poder ler um documento do começo ao fim” (LANCASTER, 1993, p. 20-21). Já a etapa de tradução tem por finalidade converter o conteúdo do documento em um conjunto de termos de indexação (BORGES; MACULAN; LIMA, 2008).
Na segunda etapa, a indexação automática utiliza programas que efetuam a análise do texto e apresentam termos de indexação, nos quais os termos indicados são armazenados como descritores do documento e não necessitam de validação dos termos selecionados (GIL-LEIVA, 1999). Segundo Lancaster (1993), são dois os tipos de indexação automática: por extração, que extrai e seleciona automaticamente termos do texto dos recursos informacionais, ou por atribuição, quando ocorre a atribuição automática de um vocabulário controlado.
No mundo digital, para quem estuda a organização, a recuperação e a disseminação da informação sob a ótica da Ciência da Informação, o entendimento e o uso dos mecanismos de busca ainda são vagos, pois os padrões de indexação se limitam às empresas de busca (TREVISAN; MONTEIRO; VIDOTTI, 2019).
De acordo com pesquisas propostas no campo da Biblioteconomia e Ciência da Informação, a indexação de assuntos é essencial para fins de recuperação da informação. Fujita (2003) explicita que a indexação consiste na análise de assunto, a qual é considerada uma das fases mais significativas do processo de indexação.
O conceito de indexação nos ambientes informacionais digitais está relacionado a um espaço que, segundo Gil-Leiva (2007), é denominado Universo da Indexação Web ou Ambiente de Indexação Web, pois, com a vasta quantidade de informação disponível na Internet e o aumento dos conteúdos na Web, foi necessário construir pontes para conectar as pessoas, de forma rápida e eficaz, nesse novo ambiente. Essas passarelas são os chamados mecanismos de busca ou pesquisa, e esse novo ambiente é formado por quatro ambientes distintos, extremamente relacionados. A Figura 1 demonstra o quádruplo que se constitui no Universo da Indexação, conforme Gil-Leiva (2007).
Tendo em vista esse Universo da Indexação apresentado por Gil-Leiva (2007), o conceito de indexação dos ambientes informacionais digitais está vinculado ao desenvolvimento de um conjunto de índices ou indicações ordenadas para auxiliar a localização de informações específicas (OLIVEIRA et al., 2011). Esses procedimentos consistem em recursos tecnológicos para serviços na Web, com o objetivo de caracterizar, classificar e relacionar conteúdos no ambiente virtual, de sorte a propor uma melhor recuperação de informações nos mecanismos de busca (OLIVEIRA et al., 2011). Quanto a esses processos, Campos e Bax (2000) apontam alguns elementos que são analisados pelos mecanismos de busca no momento da indexação de uma página e que devem ser levados em conta no momento de se disponibilizar um conteúdo na Web. Para os autores, o ambiente Web deve estar estruturado com o uso de palavras-chave, meta tags e de conhecimento de HTML (HyperText Markup Language). As metas tags são etiquetas utilizadas em páginas HTML, as quais têm como uma das finalidades descrever o conteúdo dos ambientes informacionais digitais para os mecanismos de busca (SARTI, 2011). Para Oliveira e Araújo (2012), as meta tags são semelhantes às palavras-chave adotadas nos artigos científicos, permitindo que os mecanismos de busca classifiquem o ambiente informacional digital em melhores posições.
A linguagem HTML é um conjunto definido de tags, tendo como parâmetro “[...] a necessidade de construção de documentos para serem exibidos em dispositivos de computador (na Web), daí sua vocação para tratar do formato que os dados contidos no documento vão assumir ao serem exibidos.” (SOUZA; ALVARENGA, 2004). Ao empregar a linguagem de marcação HTML, os mecanismos de busca começam a compreender melhor as páginas dos sites, passando assim a indexar o conteúdo de modo mais eficaz (HOLANDA; BRAZ, 2012).
As meta tags, na conjuntura do HTML, são consideradas indicadores descritivos ocultos ou palavras-chave introduzidas no código-fonte de uma página da Web (BHANGAL; JANKOWSKI, 2013). Segundo Cendón (2001, p. 45), “[...] alguns autores podem utilizar estas meta tags para chamar atenção sobre suas páginas, utilizando termos que não correspondem ao seu conteúdo”. Assim, a maioria dos mecanismos de busca indexa cada palavra do texto visível das páginas, enquanto outros mecanismos de busca realizam a extração das URL, as palavras-chave que aparecem com frequência ou palavras e frases importantes incluídas no título ou nos cabeçalhos e nas primeiras linhas. Outros termos que também podem ser observados no momento da extração são os textos incluídos nas meta tags para a classificação, descrição e palavras-chave e texto ALT da meta tag image, atributo relacionado a imagens (CENDÓN, 2001). Para Campos e Bax (2000), as principais meta tags são description e keywords.
A meta tag description (descrição do conteúdo) serve para representar uma breve descrição de informações sobre o conteúdo da página, a qual aparece logo após o título da página (KUMAR; PAUL, 2020). Conforme Aquino e Aquino (2013, p. 229) “[...] o termo palavras-chave refere-se às palavras mais importantes do texto científico utilizadas pelos autores, para indexação.”. Os autores afirmam também que, assim como título e resumo, as palavras-chave são elementos essenciais da representação do conhecimento.
A palavra-chave pode até ser decomposta em um descritor de forma intensa e padronizada e com controle de linguagem (OLIVEIRA et al., 2020). Dessa maneira, “[...] a primeira não obedece a nenhuma estrutura, é aleatória e retirada de textos de linguagem livre. Para uma palavra-chave tornar-se um descritor, ela tem que passar por um rígido controle de sinônimos.” (BRANDAU; MONTEIRO; BRAILE, 2005, p. 8). Em suma, palavras-chave são “[...] termos vocabulares retirados dos documentos e que correspondem a uma escolha dos autores” (MIGUÉIS et al., 2013, p. 115), podendo ainda ser substituídas por descritores com controle semântico-linguístico. Por meio delas, aumenta-se a probabilidade de que o artigo seja encontrado por motores de busca (SERRA; FERREIRA, 2014), uma vez que, ao usá-las, otimiza-se o conteúdo do documento, além do conjunto expresso no título e no resumo, traduzindo o pensamento do autor (MIGUÉIS et al., 2013).
A meta tag keywords (palavras-chave) é empregada para apontar as palavras-chave associadas à página. São as expressões principais que determinam o assunto de uma determinada página da Web (PALANISAMY; LIU, 2018).
Para a escolha de palavras-chave que componham os ambientes informacionais digitais, um outro elemento da indexação de assuntos pode auxiliar esse processo: a leitura documentária, a qual, conforme Silva e Fujita (2004, p. 147):
[...] faz-se presente no momento em que o indexador realiza a análise do assunto tratado em um documento a fim de representá-lo em termos de indexação. É nesse momento que se inicia a identificação de conceitos - principal etapa da análise de assunto - por meio da qual o indexador compreende os conceitos tratados em um documento, bem como verifica sua importância para seu sistema de informação. É aqui que os aspectos lógicos, linguísticos e cognitivos, envolvidos na indexação, representam fatores de interferência, cabendo ao indexador a habilidade necessária para poder realizar a análise conceitual efetiva do documento (SILVA; FUJITA, 2004, p. 147).
De acordo com Lara (1993), a leitura documentária caracteriza-se pela presença de operações seletivas destinadas a identificar e extrair informações. Nesse processo, a leitura documentária é efetivada sob aspectos que lhe são singulares, além daqueles concernentes a um leitor comum, não profissional, tais como: instruções textuais, condições de produção, circunstâncias de enunciação, momento e lugar de enunciação etc.
O marketing digital favorece diversos tipos de negócios, e sua principal vantagem é que o público-alvo pode ser atingido de forma econômica e mensurável (KAUSHIK, 2016; LEEFLANG et al., 2014; VACHHANI, 2016). Ademais, o marketing digital compreende diversas técnicas, como Search Engine Optimization (SEO), Social Media Marketing, Web Analytics, entre outras ( PIÑEIRO-OTERO; MARTÍNEZ-ROLÁN, 2016; RATHORE; PANT; SHARMA, 2017). Para Büttcher, Clarke e Cormack (2010), ao utilizar os mecanismos de busca, os usuários esperam receber resultados imediatos e precisos para suas pesquisas. Nessa linha, Palanisamy e Liu (2018) apontam que os resultados de busca que aparecem nas primeiras colocações Search Engine Results Page (SERP) são os que possuem maior chance de serem visitados pelos usuários.
O conceito de SEO é multíplice, pois há quem o conceitue como um conjunto de técnicas (GANDOUR; REGOLINI, 2011), outros como uma prática (MCVITTIE, 2011), como um processo (JONES, 2010), como uma ciência (LEDFORD, 2007), havendo ainda outros autores que o definam como uma arte (LIEB, 2009), a qual possui como objetivo aprimorar o volume e a qualidade dos usuários nos sites, por meio dos resultados de busca orgânica (LIEBERAM-SCHMIDT, 2010). Assim, afirma-se que o SEO é um conjunto de técnicas que tem como objetivo gerar tráfego para os ambientes informacionais digitais, almejando, como consequência, melhorar a sua classificação na SERP, visto que, para atingir esse propósito, é necessário o manuseio de diversos elementos no código-fonte HTML.
O processo de SEO é composto por quatro fases que podem sofrer alterações ao longo do tempo; logo, é válido ressaltar que se trata de uma técnica que está em constante mudança. O processo usual é: Pesquisa e seleção de palavras-chave/frases, SEO On-Page, Otimização Off-Page (MALAGA, 2008) e Monitorização e Apresentação de Relatórios (MCVITTIE, 2011). O presente trabalho limitou-se a focalizar a otimização de Pesquisa e seleção de palavras-chave/frases e SEO On-Page, pois são elementos da teoria e da prática da indexação de assuntos que podem contribuir para se obter um bom posicionamento nos mecanismos de busca. O SEO On-Page é constituído dos elementos controlados pelo desenvolvedor, tais como os metadados embutidos nos ambientes digitais, as repetições de palavras-chave, variações, negritos, nomes de imagens, URL, entre outros.
Durante a seleção de palavras-chave/frases, desenvolveu-se uma lista de palavras-chave/frases específicas, com o objetivo de criar informações e conteúdos relevantes para os mecanismos de busca. Esses termos fazem que um ambiente informacional digital apareça nas SERPs, quando os usuários digitam nos mecanismos de busca. Malaga (2008) aponta que, ao criar essa lista de termos, se estabelece uma competitividade entre cada termo e a frequência com que é utilizado, no ato da busca. As palavras-chave não devem ser aplicadas somente aos elementos textuais On-Page, mas também na escolha do nome do domínio, links externos, composição de links, entre outros elementos do site (JERKOVIC, 2009).
Ao tratar dos fatores On-Page,Malaga (2008) enfatiza que, nessa etapa, cada página do site é otimizada através da manipulação de diversos elementos. Esses elementos On-Page são considerados técnicas de otimização internas, ou seja, que são passíveis de alterações no próprio site (JERKOVIC, 2009) e que não podem ser influenciadas por elementos externos (SPINDLER, 2010). David (2011) enumera esses elementos On-Page:
conteúdo do corpo de texto principal da página;
título e Meta Tags;
Headings Tags (H1, H2, H3);
qualidade e complexidade do código HTML e CSS (Cascading Style Sheets);
imagens, nomes dos arquivos e Alt Tags;
atributos de texto, como o uso em negrito e sublinhado;
links internos, com o seu respectivo número e texto-âncora1;
uso dos atributos dofollow2ou nofollow3em qualquer dos links;
menus, navegação interna e estrutura de links;
tamanho de arquivos e velocidade com que o site carrega;
número total de páginas no site;
índice de atualização de conteúdo do site.
De acordo com Enge et al. (2010), as estratégias de SEO podem ser aplicadas com várias finalidades:
SEO para tráfego puro - a otimização para mecanismo de busca e a criação de conteúdo direcionado a uma palavra-chave contribuem para que o ambiente informacional digital exiba os principais termos da busca, o que geralmente leva a um tráfego direto e a hiperlinks de referência, à medida que mais e mais usuários passam utilizar o que se produziu;
SEO para lojas virtuais - é uma das formas de SEO mais comumente usadas para atrair tráfego relevante ao comércio eletrônico. Quando um usuário escolhe um mecanismo de busca para encontrar produtos e serviços, ele já sabe o que deseja. Por conseguinte, aplicar as técnicas de SEO corretamente pode atrair esse consumidor potencial;
SEO para visibilidade - uma forma pouco empregada, mas muito influente de SEO é seu uso para gerar visibilidade a uma marca. Essa estratégia é aproveitada por blogueiros, influenciadores digitais, produtores de mídias, fornecedores de notícias e vários outros tipos de criadores de conteúdos digitais, os quais almejam impulsionar a visibilidade, destacando-se nas primeiras posições na SERPs;
SEO para controle de reputação - o uso de SEO para controle de reputação vem se ampliando, visto que é muito importante, para grandes empresas, manterem sua reputação frente ao consumidor. Trata-se de um recurso utilizado contra avaliações desfavoráveis sobre um produto ou serviço, ou seja, seu objetivo é sobrepor as opiniões positivas dos consumidores às opiniões negativas, posicionando-as entre os principais resultados de uma pesquisa e invisibilizando, nas últimas páginas, o conteúdo de teor negativo;
SEO para influência ideológica - a adoção de SEO para influência ideológica procura influenciar a opinião pública sobre uma determinada temática, bem como incentivar propostas e conteúdos ideologicamente, na SERPs. Muitos políticos recorrem a essa técnica para difundir seus feitos, entretanto, qualquer pessoa, pública ou não, pode fazer uso dessa estratégia para influenciar pessoas e grupos.
A pesquisa é caracterizada, do ponto de vista de seus objetivos, como exploratória, pois “[...] tem como finalidade proporcionar mais informações sobre o assunto [...] possibilitando sua definição e seu delineamento.” (PRODANOV; FREITAS, 2013, p. 54). No que tange aos procedimentos técnicos, classifica-se como uma pesquisa bibliográfica, ou seja, quando é construída por meio de material que já foi publicado.
Para o desenvolvimento da pesquisa, a revisão de literatura foi realizada na Base de Dados Referencial de Artigos de Periódicos em Ciência da Informação (BRAPCI). A fim de que os recursos informacionais fossem recuperados, definiram-se as seguintes strings4 de busca, as quais construíram a expressão de busca: search engine optimization AND indexing, search engine optimization e, por fim, indexing. Como resultado dessas buscas, foram considerados somente os recursos informacionais cujos termos de busca fossem localizados nos campos título, resumo ou palavras-chave, nos idiomas português, inglês e espanhol.
As buscas foram feitas em março/2022, sendo obtidos 401 artigos para análise, conforme apresentado na Tabela 1:

Procedeu-se à seleção dos artigos, recorrendo-se ao critério de que deveria possuir ao menos um dos termos das strings de busca, em um ou mais dos seguintes campos: título, resumo e palavras-chave. Como resultado, foram eliminados três trabalhos por serem duplicados e 192, por não se enquadrarem no critério, perfazendo-se um total de 206 artigos que passaram para a próxima fase. Realizou-se uma segunda etapa de seleção dos textos, com os seguintes critérios: (1)critérios de inclusão: elementos, quer modelos, quer ferramentas e/ou técnicas utilizadas para a indexação de assuntos e técnicas de ranqueamento nos mecanismos de busca; (2)critérios de exclusão: documentos nos quais não foram usados modelos, ferramentas e/ou técnicas utilizadas para a indexação de assuntos e técnicas de ranqueamento nos mecanismos de busca.
Em seguida, foi realizada a leitura dos resumos dos artigos. Como resultado, 24 documentos foram selecionados para a última fase e 182 foram descartados. Por fim, procedeu-se à leitura das seguintes seções dos artigos: introdução, objetivos e conclusão. Desse modo, foram selecionados os trabalhos que apresentaram técnicas de SEO e elementos de indexação de assuntos que podem contribuir com o posicionamento de sites na Web. Portanto, nessa fase, foram eliminados documentos que descumpriram esse critério de inclusão. Como resultado, do total de 24 documentos analisados, 10 documentos foram selecionados para compor a análise, pois os assuntos abordados possuem relações e semelhanças com a temática desenvolvida no estudo.
Os 10 artigos que somaram o conjunto do corpus documental possibilitaram uma análise em maior nível de profundidade, tendo em vista a compatibilidade das temáticas dos artigos com a proposta do estudo (Quadro 1):

É possível perceber que os trabalhos que explicitaram as palavras-chave têm como foco principal os termos “Indexação” e Search Engine Optimization. Os trabalhos abordam os conceitos de Indexação e as técnicas de SEO, evidenciando a Organização da Informação.
Outros trabalhos (CAMOSSI et al., 2021; GIL-LEIVA, 2007; NEVES; SANTANA; GOMES, 2020; OLIVEIRA et al., 2011; PEREIRA; KRZYZANOWSKI; IMPERATRIZ, 2018; PICALHO, 2021) apontam que o uso de palavras-chave é um fator determinante no processo de ranqueamento, pois, ao realizar uma busca por determinada palavra-chave ou termo, o usuário obterá um conjunto de resultados considerados relevantes.
O conceito das etapas da indexação de assuntos apresentado por Unisist (1981), trata basicamente das operações: (1) Determinação do Assunto e (2) Representação de conceitos por termos de uma linguagem de indexação. Verificou-se que alguns elementos de SEO que contribuem no ranqueamento das páginas Web possuem a presença de elementos muito próximos da teoria e da prática de indexação. O Quadro 2 evidencia a relação entre as etapas da indexação e as etapas de SEO.

Para compreender as técnicas e as práticas da indexação de assuntos, no ambiente Web, explicitam-se os desdobramentos desses elementos. Observa-se que os elementos da indexação de assuntos se relacionam com os procedimentos de SEO, visto que a sua contribuição ao processo de seleção de palavras-chave e seus estágios estão atrelados aos seus estudos estratégicos, pois criam os meios para essas representações, através dos principais critérios de indexação e de representação.
Carneiro (1985) frisa que as etapas da indexação são afetadas por variáveis que influenciam o processo de recuperação da informação: nível de exaustividade e nível de especificidade da linguagem documentária requerida pelo sistema, linguagem de indexação e capacidade de precisão e revocação do sistema. A Figura 2 focaliza as etapas da indexação aplicadas à escolha das palavras-chave que irão compor um ambiente informacional digital.

Após a seleção e a escolha das palavras-chave, aplicam-se esses termos aos elementos (metadados) que os mecanismos de busca consideram importantes para indexação de assuntos dos ambientes informacionais digitais, no conteúdo do corpo de texto principal da página. Esses elementos são: Tag title, Meta tags description, Keywords, imagens, nomes dos arquivos e Alt tags, Headings tags (H1, H2, H3...), elementos apontados nos trabalhos de Camossi et al. (2021), Neves, Santana e Gomes (2020), Oliveira et al. (2011), Pereira, Krzyzanowski e Imperatriz (2018) e Picalho (2021).
No contexto das técnicas e práticas de indexação de assuntos na Organização do Conhecimento, a utilização das técnicas de SEO pode agregar funcionalidades, com o objetivo de proporcionar um ambiente informacional digital com uma estrutura organizada e representada, a qual possibilite uma melhor recuperação da informação. Dessa forma, o estudo das técnicas e práticas de indexação de assuntos se tornou relevante para aperfeiçoar os processos de recuperação da informação, nesses mecanismos. Nesse sentido, afirma-se que, como profissionais da informação, bibliotecários possuem a competência necessária para se especializar na área e contribuir, de maneira significativa, a partir do uso de habilidades inerentes à atuação profissional (PICALHO, 2021), pois são capazes de facilitar o processo de recuperação de informação, porque possuem conhecimentos e dominam práticas de indexação de assuntos e de escolha de palavras-chave, a fim de melhor representar o ambiente informacional digital.
Tomando-se como base a revisão de literatura obtida nos trabalhos recuperados das buscas na Base de Dados Referencial de Artigos de Periódicos em Ciência da Informação, percebe-se que as técnicas e práticas de indexação de assuntos, na Organização do Conhecimento, possuem função decisiva no processo de indexação de assuntos, no qual existem variantes que influenciam diretamente os procedimentos. No entanto, a maioria dos trabalhos não possui relação com as temáticas abordadas, sendo poucas as pesquisas relevantes para o desenvolvimento do estudo, deixando questionamentos sobre como as bases de dados realizam o processo de indexação dos artigos e demais textos acadêmicos, em decorrência da não utilização das técnicas de SEO.
O objetivo deste trabalho foi verificar como elementos da teoria e da prática de indexação podem contribuir para a obtenção de um bom posicionamento no ranking dos mecanismos de busca. Observou-se, nas etapas da indexação de assuntos, que a seleção de palavras-chave é um processo típico das técnicas de SEO e envolve a escolha e a aplicação de palavras-chave apropriadas para descrever e representar o conteúdo do ambiente informacional digital.
Assim, afirma-se que a seleção de palavras-chave sobre um determinado assunto deve pertencer a uma estrutura linguística, onde são estabelecidas as associações, determinando-se, desse modo, as relações semânticas das palavras-chave dentro do ambiente digital informacional, para aumentar a efetividade do processo de busca, aproximando os usuários e tornando o processo de busca cada vez mais efetivo, de sorte a trazer resultados precisos e relevantes aos usuários.
Portanto, os elementos da teoria e da prática de indexação de assuntos auxiliam no processo de seleção de palavras-chave e, nesse sentido, os profissionais da Ciência da Informação podem incorporá-los em suas atividades profissionais, com o objetivo de possibilitar o uso de palavras-chave mais específicas, de acordo com o assunto principal do ambiente informacional digital, refletindo, dessa forma, o perfil dos usuários e unindo os interesses, através das palavras-chave.
O uso das técnicas de SEO advindas do marketing digital pode contribuir para a recuperação e representação dos ambientes informacionais digitais, já que, ao se utilizar essas técnicas, proporciona-se uma determinada estrutura e organização, cooperando para a obtenção de uma melhor posição nos resultados de busca.
gustavo.camossi@unesp.brmariangela.fujita@unesp.brroberta_tartarotti@yahoo.com.brcecilio.rodas@ifsp.edu.br



