Carta ao Editor
Considerações sobre a análise de correlação linear
Considerations on linear correlation analysis
Recepção: 05 Fevereiro 2019
Aprovação: 17 Junho 2019
O artigo “Triagem do processamento auditivo central: contribuições do uso combinado de questionário e tarefas auditivas”, publicado, recentemente, no 23º volume do presente periódico(1), traz significativa contribuição na busca por procedimentos válidos e confiáveis de triagem do processamento auditivo, tópico recorrente em consensos internacionais sobre o tema(2,3). Entretanto, o manuscrito contém dois importantes equívocos quanto às análises de correlação linear, que podem levar à interpretação errônea dos resultados da pesquisa e dos conceitos estatísticos envolvidos.
Na seção “Resultados” do artigo, a Tabela 3 apresenta 78 análises de correlação entre a pontuação do questionário Scale of Auditory Behaviors e a porcentagem de acertos nos testes que compõem a Avaliação Simplificada do Processamento Auditivo.
O primeiro equívoco consiste no fato de que o coeficiente de correlação (r), obtido por meio do teste de correlação de Pearson, é representado inadequadamente na forma de porcentagem.
A equação que determina r limita seu valor aos números reais contidos entre -1 e 1. Os sinais positivo ou negativo indicam, respectivamente, correlações diretamente ou inversamente proporcionais, enquanto o valor absoluto indica a força da correlação, sendo que valores absolutos maiores apontam correlações mais fortes(4).
A representação de r por termos percentuais pode levar o leitor a interpretações incorretas dos resultados, sendo a mais comum a ideia de que a porcentagem indicada representa a proporção da variância de uma variável que pode ser explicada por outra variável(5). Esta interpretação, porém, só é possível se se elevar r ao quadrado, obtendo o coeficiente de determinação (r2)(6).
Sendo assim, recomenda-se reportar os valores de r em números reais contidos entre -1 e 1, limitando sua interpretação à força de correlação, e reservar o uso de porcentagem para representação de r2(7).
O segundo equívoco diz respeito à ausência de correção para múltiplas comparações dos valores de p referentes a cada r.
Sabe-se que, quanto mais hipóteses testadas simultaneamente, maior é a probabilidade de incorrer no erro tipo I (rejeição da hipótese nula, quando esta é verdadeira). Isto significa que a realização de múltiplas análises de correlação aumenta o risco de encontrar correlações estatisticamente significantes ao acaso. Assim, a interpretação dos resultados de um estudo e a sua conclusão podem ser alteradas se forem ignorados os efeitos das múltiplas comparações(8).
Diversos métodos de correção para múltiplas comparações podem ser utilizados, como o método de Bonferroni, que consiste na divisão do valor de p originalmente proposto, pelo número de comparações a serem realizadas(9). No referido estudo, a aplicação deste método levaria a considerar como estatisticamente significantes apenas os valores de p ≤ 0,00064, consequentemente modificando a interpretação dos resultados apresentados.
A estatística é uma ciência que se baseia em conceitos por vezes abstratos e que, por este motivo, podem ser facilmente confundidos por leitores e pesquisadores. Contudo, dada a importância desta ciência para a construção de novos conhecimentos e para a tomada de decisões na prática clínica, o esclarecimento de concepções errôneas faz-se necessário, para que o conhecimento científico possa progredir em bases sólidas.
* Autor correspondente: Carlos Alberto Leite Filho. E-mail: calfilho@usp.br