Artigo Original

ANÁLISE DE SENTIMENTO COMO APOIO À SELEÇÃO DE LIVROS: UM ESTUDO APLICADO À PLATAFORMA SKOOB

SENTIMENT ANALYSIS TO SUPPORT BOOK SELECTION: A STUDY APPLIED TO THE SKOOB PLATFORM

Ronnie Shida Marinho
Universidade Estadual Paulista, Brazil
Clayton Martins Pereira
Universidade Estadual Paulista, Brazil
José Eduardo Santarem Segundo
Universidade de São Paulo, Brazil

ANÁLISE DE SENTIMENTO COMO APOIO À SELEÇÃO DE LIVROS: UM ESTUDO APLICADO À PLATAFORMA SKOOB

Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, vol. 27, pp. 1-20, 2022

Universidade Federal de Santa Catarina

Recepção: 30 Agosto 2021

Aprovação: 16 Março 2022

Publicado: 25 Março 2022

RESUMO

Objetivo: Este trabalho tem por objetivo aplicar a técnica análise de sentimento nas resenhas publicadas na plataforma Skoob, com o intuito de propor um novo parâmetro de avaliação que ajude os usuários na tomada de decisão sobre a leitura, ou não, de um livro.

Método: Pesquisa exploratória, de abordagem quantitativa e qualitativa, que utilizou, para realizar a análise de sentimento, a técnica de detecção de polaridade, de modo a automatizar a identificação do grau de polaridade das opiniões contidas nas resenhas, o qual pode ser positivo, negativo ou neutro. Foram selecionadas, no total, 45.114 resenhas relacionadas aos 20 livros mais lidos entre os usuários da plataforma Skoob.

Resultado: Os resultados obtidos mostram o potencial da aplicação da análise de sentimento nas resenhas de livros como mais uma ferramenta para auxiliar o usuário da plataforma Skoob em sua tomada de decisão por qual livro iniciar a leitura ou por quais livros colocar em sua lista de próximas leituras.

Conclusões: As resenhas de livros são insumos importantes em uma rede social de leitores, uma vez que podem influenciar as preferências de leitura de seus usuários, além de apresentar as características positivas e negativas de um determinado livro. A aplicação da Análise de sentimento nas opiniões contidas em tais resenhas pode fornecer indicadores de modo automatizado e rápido, possibilitando aferir o comportamento dos usuários em relação aos livros que leram, além de ser utilizada como uma métrica alternativa para avaliação de livros.

PALAVRAS-CHAVE: Análise de sentimento+ detecção de polaridade+ métricas alternativas+ redes sociais de leitores.

ABSTRACT

Objective: This paper aims to apply the sentiment analysis technique to reviews published on the Skoob platform in order to propose a new evaluation parameter to help users in their decision-making about whether or not to read a book. Methods: Exploratory research with a quantitative and qualitative approach, which used, to perform the sentiment analysis, the polarity detection technique, in order to automate the detection of the polarity degree of the opinions contained in the reviews, which can be positive, negative or neutral. A total of 45,114 reviews related to the 20 most read books among Skoob platform users were selected.

Results: The obtained results show the potential of applying sentiment analysis to the book reviews as another tool to help the Skoob platform user in his decision making about which book to start reading or which books to put on his list of next reads.

Conclusions: Book reviews are important inputs in a social network for readers, since they can influence the reading preferences of its users, as well as present the positive and negative characteristics of a given book. Applying Sentiment Analysis to the opinions contained in such reviews can provide indicators in an automated and fast way, making it possible to gauge users' behavior towards the books they have read, as well as being used as an alternative metric for book evaluation.

KEYWORDS: Sentiment analysis, polarity detection, alternative metrics, readers, social networks.

INTRODUÇÃO

Com o surgimento da Web 2.0, também chamada de Web social, os usuários passaram da condição de simples visualizadores para produtores e compartilhadores de conteúdo online. A partir das tecnologias e ferramentas trazidas por esta nova geração da Web, foram criadas diversas plataformas de redes sociais para leitores. Nelas, cada vez mais leitores são estimulados a compartilharem, por meio da publicação de resenhas, quais as suas impressões, comentários e avaliações a respeito dos livros que já leram ou dos quais iniciaram a leitura e, por algum motivo, a interromperam definitivamente.

Uma dessas plataformas é a Goodreads1, considerada por Wang, Liu e Han (2019, tradução nossa), “[...] o maior site Web de compartilhamento de resenhas de livros do mundo”. A plataforma possui uma extensa base de usuários e uma enorme quantidade de resenhas publicada, o que demonstra seu potencial para ser uma fonte de métricas alternativas para avaliação de livros, além de ajudar os usuários a se decidirem pela leitura e a expressarem sua opinião a respeito de um livro de sua preferência (WANG; LIU; HAN, 2019). No entanto, por ser uma plataforma de abrangência mundial, o site e as resenhas são todos no idioma inglês.

No Brasil, a Skoob2 é uma plataforma semelhante à Goodreads, porém toda no idioma português, o que restringe sua base de usuários aos países que falam essa língua. A plataforma foi criada no ano de 2009 por Lindenberg Moreira. O nome da plataforma surgiu a partir da palavra books (livro, em português) escrita de modo inverso. Atualmente é considerada a maior rede social para leitores do Brasil e é completamente direcionada àqueles que tem gosto por livros e pela leitura. A plataforma possibilita que os leitores compartilhem suas experiências de leitura, troquem impressões sobre livros, dicas literárias, publiquem resenhas, além de possibilitar a atribuição de notas para as obras lidas.

Devido à grande quantidade de livros compondo os acervos de tais plataformas, a escolha de um livro para colocar na lista de leituras torna-se uma tarefa árdua e exaustiva para o usuário. Assim, uma possível maneira de indicar a relevância de um livro seria através de sua pontuação (rating), que consistiria de uma nota atribuída por um usuário que realizou a leitura deste livro. Outra forma seria por meio da quantidade de leituras concluídas de tal obra.

Embora sejam atualmente as principais maneiras de auxiliar na tomada de decisão de leitura de um livro, tais métodos baseiam-se, majoritariamente, em quesitos quantitativos para a construção de indicadores, o que negligencia uma fonte de informação rica e detalhada que são as anotações de usuários, em especial, as resenhas de livros por apresentarem as opiniões pessoais de leitores.

Apesar das plataformas não estipularem regras, formatos ou restrições para o conteúdo das resenhas a serem postadas pelos leitores, tal conteúdo pode ser de grande valia para o usuário quando da tomada de decisão sobre qual livro iniciar a leitura ou colocar em sua lista de desejos. Além disso, todo o imenso conteúdo publicado nessas plataformas pode servir de insumo para diversas análises a respeito do comportamento dos usuários e de seus hábitos de leitura, bem como servir de fonte de dados para a obtenção de métricas alternativas para avaliação dos livros.

A análise de sentimento, também chamada de mineração de opiniões, ou ainda, de análise subjetiva, é uma técnica para análise das opiniões e atitudes das pessoas a partir de anotações de usuários para avaliar produtos ou serviços (LIU, 2010). Tem sido muito aplicada na área de comércio eletrônico para ajudar os usuários na tomada de decisão de compra de um produto, bem como apontar os aspectos positivos e negativos de um produto para seu fabricante (RAJU; NAIKODI; SURESH, 2016).

Recentemente, alguns trabalhos se propuseram a estudar uma métrica alternativa, baseada em técnicas de análise de sentimento, para classificar as resenhas publicadas em plataformas online, com o intuito de verificar se os livros mais lidos e comentados nestas plataformas realmente despertaram somente sentimentos positivos em seus leitores, o que justificaria as altas pontuações (ratings) recebidas. Dentre estes trabalhos destacam-se o publicado por Zhou et al. (2016), que propõe medir o impacto de livros acadêmicos por meio de mineração de resenhas em plataformas online e da aplicação da técnica de análise de sentimento sobre as resenhas coletadas.

Em uma abordagem diferente, Piryani et al. (2018) apresenta um processo de avaliação de livros de Ciência da Computação por meio de resenhas extraídas da Amazon e Goodreads. Para tanto, os autores aplicam a análise de sentimento nas resenhas e comparam os resultados com as métricas tradicionais de avaliação de impacto. Chiavetta, Bosco e Pilato (2016) propõem um sistema de classificação de resenhas de livros pertencentes ao idioma italiano. Para isso, tal sistema baseia-se em recursos linguísticos e técnicas de processamento de linguagem natural no processo de aferição do sentimento.

Diante deste cenário, ainda não há estudos explorando o potencial das resenhas de livros publicadas na plataforma Skoob como métrica alternativa para a avaliação de livros. Acredita-se que isso se deve principalmente à questão linguística e ao foco da plataforma em livros não acadêmicos, ou seja, de literatura geral (ficção e não-ficção). É nesse contexto que se insere o presente trabalho, ao aplicar a análise de sentimento nas resenhas publicadas nesta plataforma, de modo a propor um novo parâmetro de avaliação que possa contribuir para a tomada de decisão do usuário no processo de seleção de livros de literatura para leitura.

Trata-se de uma pesquisa exploratória, de abordagem quantitativa e qualitativa, que utilizou, para realizar a análise de sentimento, a técnica de detecção de polaridade, de modo a automatizar a identificação do grau de polaridade das opiniões contidas nas resenhas, o qual pode ser positivo, negativo ou neutro.

O intuito da análise de sentimento aqui descrita é propor um instrumento alternativo para a tomada de decisão no processo de seleção de livros de literatura, por meio da coleta e análise das opiniões contidas nas resenhas publicadas em plataformas de redes sociais de leitores. Espera-se que esta nova abordagem contribua para a otimização do referido processo de seleção em meio à enorme quantidade de resenhas de livros que são publicadas diariamente nessas plataformas.

Nas seções a seguir, são apresentadas uma revisão sobre a análise de sentimento e a técnica de detecção de polaridade, as características da plataforma Skoob, os procedimentos metodológicos, a discussão dos resultados e as considerações finais.

1 ANÁLISE DE SENTIMENTO

A análise de sentimento é uma subárea da inteligência artificial, com foco no desenvolvimento de modelos computacionais que possam simular a cognição humana. Assim, de modo a se criar softwares mais eficientes, desenvolvedores e pesquisadores demonstram grande interesse em explorar os benefícios já alcançados nesta área, uma vez que várias aplicações têm surgido com intuito de extrair opiniões, bem como inferir o sentimento público (PAK; PAROUBEK, 2010).

Existem diversas técnicas provenientes da inteligência artificial que têm sido utilizadas para analisar textos (HOTHO; NÜRNBERGER; PAAß, 2005). Para esta pesquisa, optou-se pela análise de sentimento, que consiste em uma técnica de aprendizagem de máquina baseada em mineração contextual, embasada por algoritmos de deep learning. Tais algoritmos são capazes de analisar dados não-estruturados sem que haja algum tipo de pré-processamento (GOODFELLOW; BENGIO; COURVILLE, 2016).

Basicamente, uma opinião é formada por dois componentes: um alvo e um sentimento sobre esse alvo, que pode ser um produto, um assunto, uma pessoa, entre outras coisas. Deste modo, pode-se caracterizar um sentimento como sendo uma emoção ou atitude de uma pessoa em relação ao seu alvo.

Segundo Cambria, Livingstone e Hussain (2012), emoções são estados de sentimento que resultam em reações físicas e psicológicas, pensamento e comportamento, e é um dos assuntos mais complexos da psicologia, principalmente pelo aspecto ambíguo da língua. O estudo das emoções e opiniões tenta compreender de que modo os sentimentos são expressos a partir de opiniões positivas e negativas acerca de um assunto. Para isso, os métodos empregados compreendem desde questionários até pesquisas de campo (BECKER; TUMITAN, 2013). No entanto, este tipo de abordagem geralmente apresenta custos elevados, limitando-se a pequenas amostras.

Com o crescimento das mídias sociais e o aumento expressivo de opiniões pessoais publicadas na Web, é que surgiu, em meados do século XXI, o termo análise de sentimento, sendo inicialmente associado ao desenvolvimento dos métodos de processamento natural e de aprendizagem de máquina (PANG; LEE, 2008).

A crescente quantidade de dados publicados diariamente na Web criou diversos obstáculos para o estudo da análise de sentimento, exigindo a construção e o domínio de ferramentas que auxiliam no tratamento de grandes bases de dados. Aferir o sentimento requer uma análise aprofundada do contexto na qual a mensagem se encontra (BECKER; TUMITAN, 2013). Exige ainda o reconhecimento de regras semânticas e sintáticas para determinar o entendimento da linguagem, tanto implícita quanto explícita.

Inúmeras técnicas têm sido utilizadas para analisar o sentimento em conteúdos publicados na Web, dentre as quais podemos citar: a fusão multimodal, o reconhecimento de emoções e a detecção de polaridade. Esta última foi a técnica selecionada para ser aplicada na análise de resenhas de livros, uma vez que os seus textos são curtos, o que possibilita efetuar a análise e classificação de modo automático, criando conhecimento estruturado a partir de um sentimento pré-determinado. O objetivo dessa técnica é a classificação de uma sentença como sendo positiva, negativa ou neutra. Para isso, utilizase um dicionário léxico de sentimento, semelhante a um dicionário de palavras que, ao invés de apresentar como conteúdo o significado de cada palavra, possui em seu lugar um significado quantitativo, sendo ‘-1’ negativo, ‘0’ neutro e ‘+1’ positivo.

Atualmente é uma das estratégias mais eficientes, tendo como base a utilização de um grande dicionário de termos, onde cada termo está associado a um sentimento. O processo de classificação inicia quando o método recebe uma sentença de entrada; em seguida é realizado um processamento de linguagem natural, assim como uma pesquisa no léxico dos termos que formam esta mensagem. Ao final do processo, o método é capaz de inferir qual é a polaridade ou sentimento implícito na sentença de entrada (BENEVENUTO; RIBEIRO; ARAÚJO, 2015).

Assim, o intuito de utilizar a análise de sentimento no estudo desenvolvido neste artigo é obter representações mais apuradas, fazendo uso de resenhas, em especial as coletadas da plataforma Skoob.

2 PLATAFORMA SKOOB

Skoob é uma plataforma na Web que tem por objetivo ambientar uma rede social composta por leitores, editoras e os administradores do site, que interagem entre si sobre assuntos relacionados a livros e literatura. Os leitores mantêm em seu perfil no site uma “estante”, na qual ficam catalogados os livros que foram lidos ou que desejam ler no futuro. Ainda nesta estante, o leitor pode classificar seus livros por meio de uma pontuação e organizá-los em categorias (livros lidos, livros que está relendo, livros que deseja ler, livros vai reler ou livros que abandonou), sendo possível também indicar quais seus favoritos e quais os mais desejados.

A plataforma permite ainda a interação entre seus usuários, de forma que é possível visualizar no site todos os seguidores de um usuário logado e também os usuários que o mesmo segue. Também é possível visualizar o que seus amigos estão lendo no momento e quais as últimas avaliações de livros que fizeram.

Quando é efetuada a busca por determinado livro, o usuário é direcionado para uma página onde é possível encontrar informações sobre a obra, tais como capa, nome do autor, editora, e outros dados sobre a edição e publicação. A presença de estrelas ao lado da capa do livro, têm o papel de exibir o valor médio das avaliações que todos os usuários fizeram do livro. Na Figura 1 é possível visualizar que o livro “O Pequeno Príncipe” recebeu uma média de 4,5 estrelas (de uma escala de 5 estrelas) nas avaliações dos usuários, o que significa uma pontuação (rating) alta. Além disso, exibe a informação de quantos usuários já leram, quantos estão lendo, quantos querem ler, quantos estão relendo, quantos abandonaram a leitura e quantas resenhas foram feitas sobre o livro.

Avaliações sobre o livro “O Pequeno Príncipe” na plataforma Skoob.
Figura 1
Avaliações sobre o livro “O Pequeno Príncipe” na plataforma Skoob.
Fonte: Skoob (2020).

O usuário, quando logado na plataforma, é estimulado a construir vínculos com outros usuários, por meio do compartilhamento de suas opiniões e avaliações. Para isso, uma das principais fontes que a plataforma disponibiliza são as resenhas de livros, a partir das quais é que se iniciam as discussões sobre um determinado livro. Tais resenhas são interessantes de serem investigadas, uma vez que fornecem uma descrição e apresentam também as opiniões dos usuários sobre a obra. A Figura 2 apresenta exemplos de resenhas publicadas para o livro “O Pequeno Príncipe”, de autoria de Antoine Saint-Exupéry.

Resenhas sobre o livro “O Pequeno Príncipe” na plataforma Skoob.
Figura 2
Resenhas sobre o livro “O Pequeno Príncipe” na plataforma Skoob.
Fonte: Skoob (2020).

É comum que usuários analisem as opiniões de outros usuários para decidirem se devem ou não ler determinado livro. Ao ler as resenhas, um usuário verifica se o livro atende as suas expectativas em determinadas características, analisando se a maioria dos revisores apreciam ou não os pontos que ele julga interessante. A aplicação de técnicas de análise de sentimento, proposta neste trabalho, pode automatizar este processo, ao capturar as emoções dos leitores expressas em suas resenhas, para criar uma nova perspectiva de avaliação que auxilie o usuário na escolha, ou não, de um determinado livro para leitura.

3 PROCEDIMENTOS METODOLÓGICOS

De caráter exploratório, o presente estudo abordou duas estratégias distintas para coletar e analisar os dados. Inicialmente utilizou-se uma estratégia quantitativa para contabilizar as resenhas e, posteriormente, uma estratégia qualitativa, utilizando a análise de sentimento para classificar os textos das resenhas de acordo com o respectivo grau de polaridade (positivo, negativo ou neutro).

O estudo de aplicação da análise de sentimento nas resenhas de livros, proposto neste trabalho, abrange três etapas fundamentais, as quais realizam funções específicas, a saber: coleta, processamento e avaliação de textos. A Figura 3 apresenta as etapas específicas realizadas para o desenvolvimento deste artigo.

Etapas realizadas neste estudo.
Figura 3
Etapas realizadas neste estudo.
Fonte: Elaborado pelos autores.

Na primeira etapa (coleta) são coletados trechos de textos das resenhas, a fim de constituírem o corpus da análise que será efetuada pela etapa de processamento, responsável pela classificação dos mesmos. Uma vez realizadas as classificações, seguese para a etapa de avaliação, a qual emprega a técnica de detecção de polaridade, resultando em ranques alternativos que utilizam informações sobre os pontos positivos e negativos do livro para que o usuário possa tomar sua decisão de leitura. Cada uma destas etapas será detalhada a seguir.

Inicialmente, na etapa de coleta de dados, foram extraídos, nos dias 8 e 9 de dezembro de 2020, textos de resenhas publicadas na plataforma Skoob. Foram selecionadas, no total, 45.114 resenhas referentes aos 20 livros mais lidos entre os usuários da plataforma. Para a extração de textos das resenhas selecionadas foi utilizada a técnica computacional chamada web scraping, construída na linguagem de programação Python. Tal técnica permite extrair informações relevantes de determinado site para posteriormente serem analisadas. A Tabela 1 apresenta o ranque dos 20 livros mais lidos, com suas respectivas avaliações e quantidade de resenhas publicadas.

Tabela 1
Ranque dos 20 livros mais lidos na plataforma Skoob.
Ranque dos 20 livros mais lidos na plataforma Skoob.
Fonte: Skoob (2020).

Em seguida, na etapa de processamento, foi utilizada a biblioteca Vader, também na linguagem de programação Python, para o processamento de linguagem natural, com a finalidade de analisar os sentimentos contidos em cada frase dos textos coletados nas resenhas. Optou-se pelo uso desta biblioteca pois, segundo a literatura (HUTTO; GILBERT, 2014; PÅLSSON; SZERSZEN, 2016), ela apresenta resultados superiores para o contexto de redes sociais. Inicialmente, esta biblioteca foi desenvolvida para funcionar apenas no idioma inglês. No entanto, Almeida (2018) apresentou uma adaptação para suportar textos em português. A biblioteca funciona por meio de um léxico, no qual cada palavra já possui uma nota atribuída. Assim, quando uma frase é processada, um resultado é emitido de acordo com a classificação obtida a partir da polaridade do sentimento nela expresso, que pode ser positivo, negativo ou neutro.

Para ilustrar esta etapa, a Figura 4 apresenta um esquema de seu funcionamento, que parte de uma pequena resenha sobre um livro, retirada da plataforma Skoob. Após ser processada pelo classificador de sentimento (Vader), é então gerado um resultado de acordo com a polaridade do sentimento obtida.

Esquema da etapa de processamento.
Figura 4
Esquema da etapa de processamento.
Fonte: Elaborado pelos autores.

Este processo foi aplicado a todas as resenhas de um livro que foram coletadas na plataforma. Assim, por meio do processamento das resenhas pelo classificador de sentimentos, foi gerado um conjunto de resultados com as classificações obtidas de acordo com as respectivas polaridades dos sentimentos (positivo, negativo ou neutro).

Efetuado o processamento, segue-se para a fase de avaliação, onde foi realizada a construção do ranque alternativo e a normalização dos dados. Para isso, foi considerado o respectivo número de resenhas positivas, negativas ou neutras, dividido pelo número total de resenhas. Por exemplo, o livro ‘O Pequeno Príncipe’ possui 4264 resenhas publicadas. Destas, 2990 foram classificadas como positivas, 976 como negativas e 298 neutras. Assim, para obter o percentual positivo, dividiu-se 2990 por 4264, cujo resultado é 70,1%.

Tal processo foi aplicado para todas as resenhas dos 20 livros mais lidos da plataforma Skoob, conforme descrito anteriormente. Assim, foram obtidos os percentuais de sentimentos por polaridade para cada livro, apresentando uma classificação alternativa organizada de modo decrescente, do livro com o maior para o menor percentual de sentimento positivo. A classificação, de acordo com o sentimento positivo, assim como os percentuais por polaridade, é exibida na Tabela 2 a seguir.

Tabela 2
- Percentual e classificação de acordo com o sentimento positivo de cada livro.
- Percentual e classificação de acordo com o sentimento positivo de cada livro.
Fonte: Elaborado pelos autores.

A partir desta classificação alternativa, foi possível caracterizar os livros de acordo com os sentimentos existentes nas resenhas dos usuários, distinguindo-se dos critérios tradicionais de apoio a seleção de livros, como por exemplo, livros mais lidos ou com maior pontuação (rating).

4 ANÁLISE DOS RESULTADOS

Após a execução das etapas descritas anteriormente, será analisado a seguir o ranque de sentimento positivo proposto neste trabalho devido ao fato deste apontar tendências de leitura e pelo potencial para engajar novos leitores atraídos por indicações positivas de outros leitores (NASCIMENTO; ODDONE, 2016).

Neste sentido, foram realizados dois estudos distintos. O primeiro consiste na análise e comparação dos livros, no ranque de sentimento, que mais subiram e desceram posições em relação ao ranque dos 20 livros mais lidos da plataforma Skoob. No segundo estudo investigou-se os livros, no ranque de sentimento, que mais subiram e desceram posições se comparados ao ranque dos livros com maiores pontuações (rating).

Por fim, foram verificados e discutidos os resultados obtidos, a fim de detectar possíveis ocorrências que possam auxiliar na construção de indicadores alternativos, bem como no processo de tomada de decisão pelo usuário.

4.1 Estudo 1: Livros mais lidos x Análise de sentimento

Neste primeiro estudo, analisou-se os 20 livros mais lidos da plataforma Skoob quando comparados com a classificação alternativa sugerida neste trabalho. Deste modo, foi possível elaborar a Tabela 3, que compara os ranques dos livros mais lidos e dos livros com maior percentual de sentimentos positivos em suas resenhas.

Tabela 3
- Comparativo entre os ranques de livros mais lidos e de maior percentual de sentimentos positivos.
- Comparativo entre os ranques de livros mais lidos e de maior percentual de sentimentos positivos.
Fonte: Elaborado pelos autores.

Da análise desta tabela é possível notar que, para a maior parte dos livros, não houve alteração significativa de posição no ranque quando classificados, tanto pelo critério de mais lidos, quanto pelo critério de maior percentual de sentimentos positivos encontrados nas resenhas. No entanto, foi constatado que dois grupos, de 5 livros cada, tiveram uma movimentação significativa no ranque, subindo ou descendo mais de 5 posições, na comparação entre os dois critérios. A Tabela 4 mostra a relação dos cinco livros que mais subiram posições no ranque quando classificados pelo critério de maior percentual de sentimentos positivos.

Tabela 4
Relação dos 5 livros que mais subiram posições no ranque de análise de sentimento quando comparados com o critério de livros mais lidos
Relação dos 5 livros que mais subiram posições no ranque de análise de sentimento quando comparados com o critério de livros mais lidos
Fonte: Elaborado pelos autores.

Nesta tabela é possível visualizar que o vigésimo livro (último do Top 20) mais lido pelos usuários da plataforma Skoob, intitulado ‘O mar de Monstros’, foi o segundo livro que mais recebeu sentimentos positivos nas resenhas dos leitores. Já o décimo segundo livro da lista, intitulado ‘O Ladrão de Raios’, foi o quarto livro que mais recebeu sentimentos positivos nas resenhas dos leitores. Isso poderá influenciar um usuário da plataforma que esteja indeciso por qual livro iniciar a leitura ou colocar na sua lista de próximas leituras. Provavelmente esse usuário levará em consideração, quando de sua tomada de decisão, o fato de que ambos os livros, por serem bem avaliados nas resenhas de outros usuários, possam vir a se tornar suas primeiras prioridades de leitura.

Por sua vez, a Tabela 5 mostra os cinco livros mais lidos da plataforma Skoob que mais desceram posições no ranque quando classificados pelo critério de maior percentual de sentimentos positivos.

Tabela 5
- Relação dos 5 livros que mais desceram posições no ranque de análise de sentimento quando comparados com o critério de livros mais lidos
- Relação dos 5 livros que mais desceram posições no ranque de análise de sentimento quando comparados com o critério de livros mais lidos
Fonte: Elaborado pelos autores.

Nesta tabela é possível visualizar que, por exemplo, o terceiro livro mais lido pelos usuários da plataforma Skoob, intitulado ‘A Culpa é das Estrelas’, foi somente o décimo oitavo livro que mais recebeu sentimentos positivos nas resenhas dos leitores. Já o oitavo livro da lista, intitulado ‘A Menina que Roubava Livros’, foi apenas o décimo nono livro que mais recebeu sentimentos positivos nas resenhas dos leitores. Isso também poderá influenciar um usuário da plataforma que, em sua tomada de decisão, provavelmente deixará estes dois livros de fora de sua lista de primeiras prioridades de leitura.

4.2 Estudo 2: Rating x Análise de Sentimento

No segundo estudo foram analisados os percentuais de sentimentos positivos quando comparados com a pontuação (rating) de cada livro investigado neste trabalho. Para a construção do ranque de Pontuação, considerou-se de modo decrescente os livros que apresentaram maior Pontuação e, em casos de empate de pontuação, selecionou-se o livro com maior quantidade de leituras. Assim, elaborou-se a Tabela 6, que compara o ranque dos livros com maiores pontuações com o ranque dos livros com maior percentual de sentimentos positivos em suas resenhas.

Tabela 6
Comparativo entre os ranques de livros com maior pontuação (rating) e de maior percentual de sentimentos positivos.
Comparativo entre os ranques de livros com maior pontuação (rating) e de maior percentual de sentimentos positivos.
Fonte: Elaborado pelos autores.

Da mesma forma como realizado no primeiro estudo, foram agrupados os livros que mais subiram posições no ranque e os livros que mais desceram posições no ranque quando classificados pelo critério de maior percentual de sentimentos positivos encontrados nas resenhas, em comparação com o critério de maior pontuação (rating). A Tabela 7 apresenta a relação dos cinco livros que mais subiram posições no ranque.

Tabela 7
Relação dos 5 livros que mais subiram posições no ranque de análise de sentimento quando comparados com o critério de classificação por rating.
Relação dos 5 livros que mais subiram posições no ranque de análise de sentimento quando comparados com o critério de classificação por rating.
Fonte: Elaborado pelos autores.

Nesta tabela é possível observar que, com exceção dos livros “Crepúsculo” e “A Cabana”, os demais livros relacionados também apareceram na relação de livros que mais subiram posições quando comparados com os mais lidos (Tabela 4). Tal fato pode auxiliar o usuário em sua seleção pela leitura de um livro, visto que os livros “O Mar de Monstros”, “Amanhecer” e “O Ladrão de Raios” ganharam posições considerando-se os diferentes critérios de classificação investigados neste trabalho.

Por fim, na Tabela 8 são apresentados os cinco livros que mais desceram posições no ranque se comparado ao critério de pontuação (rating).

Tabela 8
Relação dos 5 livros que mais desceram posições no ranque de análise de sentimento quando comparados com o critério de classificação por rating.
Relação dos 5 livros que mais desceram posições no ranque de análise de sentimento quando comparados com o critério de classificação por rating.
Fonte: Elaborado pelos autores.

Ao comparar os livros relacionados nesta tabela com os que mais desceram posições, exibidos na Tabela 5, é possível notar que se trata dos mesmos títulos, com a exceção do livro “Harry Potter e as Relíquias da Morte”. Tal livro quando comparado com o ranque de obras mais lidas obtém uma mudança de posicionamento insignificante para este estudo, perdendo apenas uma posição na classificação de sentimento. Tal coincidência pode contribuir no processo de seleção da obra a ser lida.

Assim, frente aos resultados ora apresentados, acredita-se no potencial da aplicação da análise de sentimento nas resenhas de livros como uma alternativa para ajudar o usuário da plataforma Skoob em sua tomada de decisão de leitura de um ou mais livros.

5 CONSIDERAÇÕES FINAIS

As resenhas de livros são insumos importantes em uma rede social de leitores, uma vez que podem influenciar as preferências de leitura de seus usuários, além de apresentar as características positivas e negativas de um determinado livro, o que contribui para a construção do conhecimento nesta rede. A aplicação da Análise de sentimento nas opiniões contidas em tais resenhas pode fornecer indicadores de modo automatizado e rápido, possibilitando aferir o comportamento dos usuários em relação aos livros que leram, além de ser utilizada como uma métrica alternativa para avaliação de livros, e como uma ferramenta para ampliar as possibilidades de análises de textos e apoio na tomada de decisão dos usuários.

Neste artigo foram apresentados alguns indicadores relacionados ao ranque dos 20 livros mais lidos e avaliados da plataforma Skoob, a partir da coleta e classificação das resenhas destes livros de acordo com a polaridade positiva dos sentimentos nelas expressados. Tais indicadores assemelham-se às métricas alternativas, que visam medir a importância de produtos científicos por meio de diferentes formas e padrões na web social, e não apenas a publicação em veículos tradicionais, de forma a criar instrumentos alternativos de avaliação.

Diante dos estudos apresentados e dos resultados obtidos e analisados, a aplicação da análise de sentimento nas resenhas de livros publicadas pelos leitores mostra-se como de grande potencial para auxiliar outros leitores na tomada de decisão por qual livro iniciar a leitura ou por quais livros colocar em sua lista de próximas leituras. Isto pode reduzir as chances de escolha de um livro que esteja abaixo de sua expectativa, evitando assim um abandono de leitura. Espera-se ainda que os resultados obtidos a partir da aplicação desta técnica estimulem o usuário a contribuir com a plataforma, por meio da elaboração de resenhas para os livros que já leu e, desta forma, melhorar o ranque desses livros.

Além disso, considerando-se o estudo dos livros investigados e, levando em conta os diferentes critérios de classificação, constatou-se que nem sempre os livros mais lidos ou com maiores pontuações (rating) são, efetivamente, os que refletem os maiores percentuais de sentimentos de cunho positivos.

Destaca-se que o rating é uma classificação apontada pelos leitores, portanto esse segundo estudo demonstra que há uma dissonância entre o que se escreve nas resenhas e a pontuação atribuída aos livros, o que de certa forma fortalece a ideia da importância do estudo de análise de sentimentos.

Como trabalho futuro, pretende-se ampliar o estudo com a investigação de uma quantidade maior de livros, além de comparar os resultados obtidos da aplicação da técnica de análise de sentimento com os resultados obtidos a partir da aplicação de outras técnicas e algoritmos, o que pode levar à construção de uma ferramenta para tomada de decisão de leitura que permita a aplicação e comparação de várias métricas alternativas para a avaliação de livros.

REFERÊNCIAS

ALMEIDA, R. J. A. LeIA - Léxico para Inferência Adaptada. 2018. Disponível em: Disponível em: https://github.com/rafjaa/LeIA. Acesso em: 04 dez. 2020.

BECKER, K.; TUMITAN, D. Introdução à mineração de opiniões: conceitos, aplicações e desafios. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS, 28., 2013, Recife. Anais […]. Porto Alegre: Sociedade Brasileira de Computação, 2013. p. 27-52.

BENEVENUTO, F.; RIBEIRO, F.; ARAÚJO, M. Métodos para análise de sentimentos em mídias sociais. In: SIMPÓSIO BRASILEIRO DE SISTEMAS MULTIMÍDIA E WEB. MINICURSOS, 21., 2015, Manaus. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação , 2015. p. 31-59.

CAMBRIA, E.; LIVINGSTONE, A.; HUSSAIN, A. The Hourglass of Emotions. In: ESPOSITO, A.; ESPOSITO, A. M.; VINCIARELLI, A.; HOFFMANN, R.; MÜLLER, V. C. (org.). Cognitive Behavioural Systems. Heidelberg: Springer, 2012. Disponível em: http://dx.doi.org/10.1007/978-3-642-34584-5_11. Acesso em: 30 jun. 2021.

CHIAVETTA, F.; BOSCO, G. L.; PILATO, G. A lexicon-based approach for sentiment classification of Amazon books reviews in Italian language. In: INTERNATIONAL CONFERENCE ON WEB INFORMATION SYSTEMS AND TECHNOLOGIES, 12., 2016, Rome. Proceedings […]. Rome: INSTICC, 2016. p. 159-170.

GOODFELLOW, I.; BENGIO, Y.; COURVILLE, A. Deep Learning. Cambridge: MIT Press, 2016. Disponível em: Disponível em: http://www.deeplearningbook.org. Acesso em: 25 jun. 2021.

HUTTO, C.; GILBERT, E. Vader: A parsimonious rule-based model for sentiment analysis of social media text. In: PROCEEDINGS OF THE INTERNATIONAL AAAI CONFERENCE ON WEB AND SOCIAL MEDIA, 8., 2014, Ann Arbor. Proceedings […]. Palo Alto: AAAI, 2014. p. 216-225.

HOTHO, A.; NÜRNBERGER, A.; PAAß, G. A brief survey of text mining. LDV Forum, Trier, v. 20, n. 1, p. 19-62, 2005.

LIU, B. Sentiment analysis and subjectivity. Handbook of natural language processing, v. 2, n. 2010, p. 627-666, 2010.

NASCIMENTO, A. G.; ODDONE, N. E. Métricas alternativas para a avaliação da produção científica: a altmetria e seu uso pelos bibliotecários. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 17., 2016, Salvador. Anais [...]. Salvador: ANCIB, 2016. p. 3071-3085.

PANG, B.; LEE, L. Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval, Delft, v. 2, n. 1-2, p. 1-94, 2008.

PÅLSSON, A.; SZERSZEN, D. Sentiment Classification in Social Media: An Analysis of Methods and the Impact of Emoticon Removal. 2016. Disponível em: Disponível em: https://www.divaportal.org/smash/get/diva2:930520/FULLTEXT01.pdf. Acesso em: 16 jun. 2021.

PAK, A.; PAROUBEK, P. Twitter as a corpus for sentiment analysis and opinion mining. In: INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, 7., 2010, Valletta. Proceedings […]. Paris: ELRA, 2010. p. 1320-1326.

PIRYANI, R.; GUPTA, V.; SINGH, V. K.; PINTO, D. Book impact assessment: A quantitative and text-based exploratory analysis. Journal of Intelligent & Fuzzy Systems, Amsterdam, v.34, n. 6, p. 1-10, 2018.

RAJU, B. N.; NAIKODI, C.; SURESH, L. Sentiment analysis of product attribute using social media. International Journal of Engineering Research, Bengaluru, v. 5, n. 4, p. 808-813, 2016.

SKOOB. Plataforma de Rede Social para Leitores. Disponível em: Disponível em: https://www.skoob.com. br. Acesso em: 08 dez. 2020.

WANG, K.; LIU, X.; HAN, Y. Exploring Goodreads reviews for book impact assessment. Journal of Informetrics, Amsterdam, v. 13, n. 3, p. 874-886, 2019.

ZHOU, Q.; ZHANG, C.; ZHAO, S. X.; CHEN, B. Measuring book impact based on the multi-granularity online review mining. Scientometrics, Amsterdam, v. 107, n. 3, p. 1-21, 2016.

Notas

1 http://www.goodreads.com
2 http://www.skoob.com.br
CONJUNTO DE DADOS DE PESQUISA O conjunto de dados que dá suporte aos resultados deste estudo não está disponível publicamente.
LICENÇA DE USO Os autores cedem à Encontros Bibli os direitos exclusivos de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution (CC BY) 4.0 International. Estra licença permite que terceirosremixem, adaptem e criem a partir do trabalho publicado, atribuindo o devido crédito de autoria e publicação inicial neste periódico. Os autores têm autorização para assumir contratos adicionais separadamente, para distribuição não exclusiva da versão do trabalho publicada neste periódico (ex.: publicar em repositório institucional, em site pessoal, publicar uma tradução, ou como capítulo de livro), com reconhecimento de autoria e publicação inicial neste periódico.
PUBLISHER Universidade Federal de Santa Catarina. Programa de Pós-graduação em Ciência da Informação. Publicação no Portal de Periódicos UFSC. As ideias expressadas neste artigo são de responsabilidade de seus autores, não representando, necessariamente, a opinião dos editores ou da universidade.
EDITORES Edgar Bisset Alvarez, Ana Clara Cândido, Patrícia Neubert e Genilson Geraldo.

Autor notes

CONTRIBUIÇÃO DE AUTORIA Concepção e elaboração do manuscrito: R. S. Marinho, C. M. Pereira, J. E. Santarem Segundo

Coleta de dados: R. S. Marinho

Análise de dados: R. S. Marinho, C. M. Pereira

Discussão dos resultados: R. S. Marinho, C. M. Pereira

Revisão e aprovação: J. E. Santarem Segundo

ronnieshida@gmail.comclayton.martins@unesp.brsantarem@usp.br

HMTL gerado a partir de XML JATS4R por