Artículos
Análise estrutural do Inventário de Depressão Beck versão curta (BDI-13)
Structural analysis of the Beck Depression Inventory short version (BDI-13)
Análise estrutural do Inventário de Depressão Beck versão curta (BDI-13)
Revista Interamericana de Psicología/Interamerican Journal of Psychology, vol. 56, no. 2, e1515, 2022
Sociedad Interamericana de Psicología

Received: 29 December 2020
Accepted: 22 April 2022
Resumo: A depressão é conhecida como doença do século, é caracterizado como um dos transtornos mentais mais frequentes da atualidade. Objetivamos validar para o português a versão reduzida do Inventário de Depressão de Beck (BDI-13). Para atingir o presente objetivo, realizamos dois estudos. O primeiro estudo (N= 268) teve a finalidade de conhecer a estrutura fatorial exploratória do BDI-13 por meio da análise dos componentes principais, bem como a análise de consistência interna. Os resultados demonstraram uma estrutura unidimensional comportando os 13 itens. O segundo estudo (N = 250) teve a finalidade de confirmar a estrutura presente no primeiro estudo, testando modelos alternativos das estruturas fatoriais, por meio da análise fatorial confirmatória. Os resultados indicaram que o modelo mais adequado é o modelo tridimensional, apresentando os melhores índices de ajuste. A presente escala apresentou validade fatorial bem como consistência interna adequada para fins de pesquisa.
Palavras-chave: inventário de depressão, depressão, validação fatorial, tridimensional.
Abstract: Depression is known as the disease of the century, being one of the most common mental disorders nowadays. We aimed to validate the reduced version of the Beck Depression Inventory (BDI-13) for Brazilian Portuguese. To achieve this goal, we conducted two studies. The first study (N = 268) had the purpose of knowing the exploratory factorial structure of the BDI-13 through the analysis of the main components, as well as the analysis of internal consistency. The results showed a one-dimensional structure comprising the 13 items. The second study (N = 250) aimed to confirm the structure present in the first study, testing alternative models of factorial structures, through confirmatory factor analysis. The results indicated that the most suitable model is the three-dimensional model, presenting the best fit indexes. The present scale presented factor validity as well as adequate internal consistency for research purposes.
Keywords: depression inventory, depression, factorial validation, three-dimensional.
Introdução
A depressão é conhecida como doença do século e caracterizada como um dos transtornos mentais mais frequentes da atualidade. Segundo o Diagnostic and Statistical Manual of Mental Disorders, 5.ª edição (DSM-V, 2014) a depressão pode ser entendida como um transtorno de humor que se subdivide em diversas classificações, variando em duração, grau e etiologia. Geralmente, há a presença de humor triste, irritável ou vazio, e ainda alterações somáticas, cognitivas e afetivas, que interferem significativamente ao longo da vida. Quanto a Classificação Estatística Internacional de Doenças e Problemas Relacionados à Saúde (ICD 11, 2018), diversas são as classificações para que abrangem a depressão como: transtorno depressivo de episódio único (6A70), transtorno distímico (6A72) e transtorno misto de depressão e ansiedade (6A73), além de suas subdivisões.
É visto em estudos que a depressão possui maior índice de acometimento em mulheres, sendo aproximadamente o dobro de casos em relação ao homem (Angst et al., 2002; Weissman et al., 1996), esse índice se sustenta conforme as faixas etárias de adolescentes, adultos e idosos (Angst et al., 2002). Estima-se que mais de 300 milhões de pessoas no mundo sofrem com a depressão (OPAS/OMS, 2017). No Brasil, segundo a OMS (2017), cerca de 11 milhões de brasileiros, isso é 6% da população, é diagnosticada com transtorno depressivo, em algum grau, tornando o Brasil como país mais depressivo da América Latina.
Visando estudar acerca dessa epidemia mundial, diversas escalas são propostas e validadas no mundo todo. Em uma revisão integrativa, como proposto pelas etapas metodológicas por Ganong (1987), encontramos 11 escalas na base de dados Scopus . Estas escalas foram validadas em contexto estadunidense e brasileiro, e ainda, aplicadas na população geral, ou população específica, por idade como: adolescentes, idosos, ou até mesmo por pessoas acometidas por alguma deficiência ou transtorno psicológico, como a esquizofrenia. Entre as escalas validadas para o contexto dos Estados Unidos da América (EUA), a Depression Rating Scale for Schizophrenics (Addington, et al., 1990), possui 14 itens distribuídos em dois fatores, manejado em uma população específica de indivíduos com transtorno esquizofrênico. Outra escala que busca captar o fenômeno da depressão é a Reynolds Adolescent Depression Scale (RADS; Reynolds, 2002), possui 30 itens que permitem a identificação no nível de gravidade sintomatológica, subdividindo-se em quatro fatores: Humor Disfórico, Anedonia / Afeto Negativo, Autoavaliação Negativa e Reclamações Somática, aplicado em uma população de adolescentes.
No Brasil, diversas escalas são validadas, entre essas encontradas para a população em geral: A Escala de Autoavaliação da Depressão de Zung (Zung, 1965) traduzida e validada para o Brasil por Chagas et al. (2010), composta de 20 itens que apresentam sintomas afetivos, psicológicos e somáticos. A Escala de Avaliação da Depressão de Hamilton (Moreno & Moreno, 1998), que possui 17 itens, divididos em categorias como humor, somáticos, motores, sociais, cognitivos e ansiedade. O Inventário de Depressão Maior (Mulrow et al., 1995) validada para o português por Parcias, et al. (2011), contendo 10 itens distribuídos em dois fatores. Ambas as escalas foram aplicadas na população geral.
Quanto às escalas validadas para a população clínica temos: A Escala Hospitalar de Ansiedade e Depressão (HAD) elaborada por Zigmond e Snaith, (1983) e traduzida por Botega et al. (1995). Esta escala possui 14 itens distribuídos em dois fatores: ansiedade (7 itens) e depressão (7 itens). Outra escala que possui o mesmo sentido de captar a depressão por meio de sintomas da demência é a Escala Cornell de Depressão em Demência construída por Schreiner et al. (2003) e traduzida para a língua portuguesa por Carthery-Goulart et al. (2007) possuindo 15 itens em uma estrutura unidimensional. Para a população idosa, foram encontradas: a Escala de Depressão para Idosos (EDI; Giavoni, et al., 2008) composta por 50 itens divididos em dois fatores, cognitivo-afetivo e somático-motor e a desenvolvida por Yesavage et al. (1982) e validada no idioma português por Paradela, et al. (2005) composta 30 itens distribuídos em 4 fatores (e.g., bem estar, humor deprimido, otimismo e sintomas somáticos).
Ainda temos a Escala de Depressão de Beck (BDI-21; Beck, et al., 1996) traduzida e validada para o idioma português por Gorenstein, et al. (1998), composta 21 itens divididos em três fatores, representando as dimensões de autodepreciação, cognição-afeto e a somática. Há também uma versão mais recente validada para o Brasil por Castro et al. (2010) em que se avaliou o BDI- 21 de forma unidimensional. Ambas as versões das escalas BDI-21 foram manejadas em uma população clínica, buscando avaliar o fenômeno da depressão por meio de seus sintomas mais expressivos. Como apresenta Wang e Gorenstein (2013), o instrumento apresenta alta confiabilidade, melhor validade de conteúdo, estrutural e concorrente, com base em evidências psicométricas, portanto, justifica-se a escolha da mesma enquanto instrumento proposto para atualização no presente estudo.
Compreendemos que existe uma diversidade de escalas existentes no Brasil e no mundo que trabalham acerca da mensuração da depressão e ainda a relevância da temática enquanto problemática de saúde pública mundial. Mas, propusemos a validação para o português da versão reduzida do Inventário de Depressão de Beck, versão com 13 itens (BDI-13; suplementar 1). Haja visto que a validação de um inventário de depressão com menor quantidade de itens pode captar o fenômeno de maneira mais breve. Em comparação com outras escalas já validadas (Carthery-Goulart et al., 2007; Castro et al., 2010; Gorenstein, et al., 1998; Moreno & Moreno, 1998). A utilização de escalas curtas diminui o impacto de variáveis intervenientes relacionadas ao participante tais como: a fadiga (Gosling, et al., 2003). Desse modo, resta-se analisar se uma versão reduzida é capaz de apresentar propriedades psicométricas significativas.
Para além de propor um instrumento para o contexto atual, haja visto que os instrumentos mais recentes foram validados há mais de 10 anos (Giavoni, et al., 2008; Parcias, et al., 2011). O estudo propõe a validade Baseada no Padrão de Resposta dos Itens, sendo uma nova validade proposta pela AERA, APA e NCME (1999), em substituição ao modelo tripartite (AERA, et al., 1966). A análise por meio da Teoria de Resposta ao Item (TRI), apresenta maior fidedignidade ao instrumento a medida que os resultados não são influenciado pela variação amostral e ainda o desempenho do item é avaliado de forma individual, não sendo dependendo dos demais itens do instrumento (Pasquali, 2018). Portanto, optou-se por realizar essa etapa a fim de tornar o instrumento mais robusto, visto que apenas um (BDI-21; Castro et al., 2010) entre os demais, realizaram tal procedimento estatístico.
A partir da discussão anterior, essa pesquisa objetiva validar o Inventário de Depressão de Beck-13 (BDI-13). Para atingir tal objetivo, foram realizados dois estudos. O primeiro estudo possui finalidade de conhecer a estrutura fatorial exploratória do BDI-13, versão reduzida. Quanto ao segundo estudo, esse possui a finalidade de confirmar a estrutura presente no primeiro estudo, testando outras estruturas fatoriais. Espera-se que a estrutura mais adequada seja o modelo tridimensional proposto pelos autores (Dadfar & Kalibatseva, 2016), mas também um modelo unidimensional (Catro et al., 2010), ou seja, seja o modelo bi-factor. Além disso, tanto o modelo tridimensional (Gorenstein & Andrade, 1998) quanto o modelo unidimensional (Castro et al., 2010) já foram encontrados em validações brasileiras em uma versão longa.
Método
Participantes
O presente trabalho contou com uma amostra total, não probabilística (de conveniência) de 518 pessoas da população geral (M = 22,50; DP= 8,48, variando de 18 a 60 anos), predominantemente dos estados de Pernambuco (37,65%) e Paraíba (37,3%). Sendo a maioria do sexo feminino (72,95%), solteiros(as) (85,4%), com o ensino superior incompleto (49,2%) e de classe média baixa (38,1%). A seguir, serão apresentados os perfis sociodemográficos dos participantes, divididos em duas amostras distintas para o Estudo 1 (N1) e o Estudo 2 (N2).
N1 — Participaram 268 pessoas da população em geral, sendo a maioria dos Estados da Paraíba (38,5%) e Pernambuco (36,2%), com idades entre 18 e 60 anos (M = 21; DP= 8,29), a maioria é do sexo feminino (72%), solteiros(as) (85,4%) com o ensino superior incompleto (49%) e de classe média baixa (38,1%). Contamos com uma amostra não probabilística e por conveniência. Calculamos, a partir dos dados, a análise de potência sensível para estimar os parâmetros da análise fatorial, usando o WebPower (Zhang & Yuan, 2018). O tamanho de nossa amostra (N = 268), usando os graus de liberdade observado = 65, e definindo uma qualidade de ajuste aceitável para os dados (com base em RMSEA = 0,05) dá uma potência de 0,90, indicando que o modelo hipotetizado é suportado pelos graus de liberdade e valor do RMSEA.
N2 — Participaram 250 pessoas da população em geral, sendo a maioria dos Estados de Pernambuco (39,1%) e Paraíba (36,1%), com idades entre 18 e 60 anos (M = 24; DP= 8,67), a maioria é do sexo feminino (73,9%), solteiros(as) (85,4%) com o ensino superior incompleto (49,4%) e de classe média baixa (38,1%). Contamos com uma amostra não probabilística e por conveniência. Calculamos, a partir dos dados, a análise de potência sensível para estimar os parâmetros dessa análise fatorial confirmatória, usando o WebPower (Zhang & Yuan, 2018). O tamanho de nossa amostra (N = 250), usando os graus de liberdade observado = 49, e definindo uma qualidade de ajuste aceitável para os dados (com base em RMSEA = 0,05) dá uma potência de 0,89, indicando que o modelo hipotetizado é suportado pelos graus de liberdade e valor do RMSEA.
Instrumentos
A Beck Depression Inventory (BDI) desenvolvida por Beck et al. (1961;1996) e traduzida para o português pelos autores Gorenstein e Andrade (1998). A versão utilizada no presente estudo foi validada originalmente por Dadfar e Kalibatseva (2016) aplicando os itens com correlações mais altas com o escore total do BDI-21 e avaliações clínicas. Essa versão obteve confiabilidade de 0,85. A escala é composta por 13 frases que expressam sentimentos de como a pessoa está se sentindo na semana decorrente (e.g., 0 =Não me sinto triste, 1= Eu me sinto triste; 2= Estou sempre triste e não consigo sair disso; e 3 = Estou tão triste ou infeliz que não consigo suportar). Aos participantes é pedido que elas marquem a opção que mais se aproxima do seu sentimento. Quanto mais as pessoas marcarem o item 3 mais expressivo é o nível de sintomatologia depressiva. Além disso, os participantes responderam a questões demográficas (sexo, idade, estado civil, escolaridade, classe socio-econômica e estado em que reside).
Procedimentos
Os itens foram traduzidos para uma versão em português por Gorenstein e Andrade (1998) em versão longa, composta por 21 itens. Como se tratava da mesma escala, não foram necessárias novas traduções, porém dois pesquisadores bilíngues analisaram os itens para verificar se de fato as traduções correspondiam à versão em inglês dos autores Dadfar e Kalibatseva (2016). Após essa fase da análise dos itens, a coleta de dados foi realizada no meio virtual, por um formulário desenvolvido na plataforma Google Forms, onde todos os itens necessitavam ser respondidos para a pesquisa ser finalizada. O formulário foi divulgado nas redes sociais (email, Instagram, Whatsapp).
Considerações Éticas
Os dados foram coletados conforme a Declaração Universal de Princípios Éticos para Psicólogos (IAAP & IUPsyS, 2008), as Diretrizes Éticas Internacionais para Pesquisa Biomédica Envolvendo Temas Humanos (CIOMS, et al., 2016) e as atuais declarações da IAPA sobre ações éticas no momento da apresentação (IAPA, 1978, 2008a, 2008b, 2014, 2016, 2018, 2019). O presente estudo está sob o protocolo sob a supervisão do Comitê de Ética do parecer (informação suprimida). Consideramos as recomendações da Resolução 510/16 e 466/12 do Conselho Nacional de Saúde. Todas as recomendações estavam esclarecidas no Termo de Consentimento Livre e Esclarecido (TCLE) para os participantes.
Análise dos dados
N1- Os dados foram analisados por meio do software Factor (versão, 10.10; Ferrando & Lorenzo-Seva, 2017). Calculamos estatísticas descritivas para caracterização da amostra (frequência, médias e desvios padrão). Foram realizadas a análise fatorial exploratória de mínimos quadrados com base em correlações policóricas, com estimador Robust Diagonally Weighted Least Squares (RDWLS), a dimensionalidade da fatoração da escala, os índices de consistência interna como o alfa de Cronbach e o Ômega de McDonald. Também realizamos, por meio da linguagem R (versão 4.0), a calibração dos itens como: a discriminação, dificuldade dos e a curva de informação dos itens por meio do Modelo de Resposta Gradual de Samejina (Samejina, 1969).
N2- Os dados também foram analisados por meio do software R Studio (versão 3.0.1). Foram realizadas a análise fatorial confirmatória utilizando por meio do estimador Weighted Least Square Mean and Variance Adjusted (WLSMV), considerando os seguintes índices de ajuste: Chi-Square Test (χ2), Degrees of Freedom (DF), χ2/df , considerado valores entre 1 e 3 (Anunciação, 2018) o Comparative Fit-Index (CFI), Tucker Lewis Index (TLI) e o Goodness of Fit Index (GFI) com o ponto de corte sendo > 0,90 (Kline, 2015); o Root-Mean-Square Error of Aproximation (RMSEA) com o ponto de corte sendo valores < 0,10; Standardized Root Mean Square Residual (SRMR) com ponto de corte < 0,10 (Kline, 2015); e Expected Cross Validation Index (ECVI), serve para comparar modelos não alinhados, quanto mais baixo for o valor melhor é o modelo em comparação aos modelos testados (Kline, 2015).
Resultados
Estudo 1. Evidências de validade exploratória, precisão e validade baseada em padrão de resposta por item do Inventário de Depressão de Beck (BDI-13)
Inicialmente buscamos testar a estrutura da matriz de correlação por meio da análise dos componentes principais do Inventário de depressão de Beck-13 (BDI-13). Para isso, realizamos o teste de Kaiser-Meyer-Olkin (KMO) e o teste de esfericidade de Bartlett que buscam avaliar o índice de adequação da amostra e procura avaliar se a matriz é fatorável. Observamos que KMO = 0,98 e o teste de esfericidade de Bartlett χ2 (78) = 2178,3; p < 0,001, demonstraram que a BDI-13 possui adequação da amostra assim como é passível de fatoração.
Para determinar as dimensões, nos baseamos no valor do critério de Kaiser, ao qual demonstrou valor próprio de 7,30 apenas na primeira dimensão, explicando 56% da variância explicada, ou seja, esse fator consegue explicar mais da metade da variância do traço latente. Objetivamos confirmar nossos achados, usamos um critério mais robusto, o critério de Horn, também conhecido como Análise Paralela. Para o critério de Horn (1965), assumimos os dados do banco (268 participantes e 13 variáveis) com 1000 simulações, sendo percebido a presença de um único fator que corresponde ao esperado. Isso porque o valor próprio observado deve ser maior que o seu correspondente no valor simulado. O valor simulado ao primeiro fator foi de 1,38 em comparação ao valor observado de 7,30, significando que existe um fator. O segundo fator apresentou um valor simulado de 1,29 em comparação ao valor observado de 0,92, indicando que o segundo fator não existe e que, portanto, aderimos à distribuição dos itens como unidimensional.
Analisamos também a unidimensionalidade do BDI-13 por meio da Unidimensional Congruence (UniCo), aceitando valores maiores que 0,95; Explained Common Variance (ECV) aceita valores acima de 0,85; e Residual Absolute Loadings (MIREAL), que aceita valores inferiores a 0,30 (Ferrando & Lorenzo-Seva, 2018), isto é, esses índices servem para reforçar a unidimensionalidade existente do BDI-13. Com isso, observamos que UniCo = 0,98; ECV = 0,91 e MIREAL = 0,17, demonstraram o modelo da unidimensionalidade é suportado pelos dados.
Analisamos também que as cargas fatoriais foram todas acima de 0,40, isto é, todos os itens contribuem de forma significativa na formação do construto teórico (Tabela 1). Isto é, variaram de 0,54 (item 13) e 0,81 (item 6). Já as comunalidades variaram de 0,30 (item 13) e 0,66 (item 6). A confiabilidade da escala foi analisada de duas formas, por meio do alfa de Cronbach e do ômega de McDonald. Tanto o alfa de Cronbach (α = 0,93) como o ômega de McDonald (ω = 0,93), foram estatisticamente satisfatórios.

Teoria de Resposta ao Item
Seguimos dois pressupostos da TRI. O primeiro consideramos a independência local dos itens, isto é, que o traço latente é considerado, mas que as respostas não dependem umas das outras (Yang & Kao, 2014). Isso porque as pessoas que sentem depressão não sentem as mesmas sintomatologias de forma única, mas com níveis variados (DSM-V, 2014; ICD 11; 2018). E comprovamos por meio da estrutura fatorial que a BDI-13 é unidimensional. Desse modo, na suposição importante que complementa o pressuposto da independência local é a unidimensionalidade do presente inventário (Boateng et al., 2018). Logo, a suposição do pressuposto de que existe apenas um traço latente para o conjunto dos itens é satisfeita. Isso significa que as estimativas do traço latente são dependentes do modelo e não da característica da amostra ou do teste realizado (Yang & Kao, 2014).
Por meio da calibração dos itens, analisamos dois parâmetros (2-PL), (a) discriminação e a (b) dificuldade com que esse item se apresenta para os respondentes. O parâmetro de discriminação de itens permite determinar o quão bem os itens identificam os pacientes em diferentes níveis do traço latente. Todos os itens apresentaram respostas positivas em sua discriminação, representando que os respondentes possuem níveis crescentes no traço latente podem endossar tanto respostas menos severas como respostas mais severas (Yang & Kao, 2014). Segundo Baker (2001), propõe que categorias de discriminação de 0, 1 a 0,34 são muito baixas; 0,65 a 1,34 moderadas e > 1,70 altas. Logo, todos os itens apresentaram discriminações consideradas altas, ou seja, os itens conseguem diferenciar os participantes em seu nível de endossamento de cada sintomatologia da depressão (Tabela 2).
A cada nível theta que pode variar de -3 a 3, com aqueles mais próximos de -3 tendo depressão menos severa e aqueles próximos a 3 tendo depressão mais severa. As pessoas que possuem endossamento quanto a localização (ou dificuldade) no nível theta, possui menos severidade nos sintomas depressivos. O item 11 “Inibição do trabalho / dificuldade do trabalho”, por exemplo, apresentou dificuldade negativa no b1 (-0,13) isso indica que os participantes podem endossar de forma mais constante essa categoria em comparação com o b3 (3,26).
Em geral, uma curva de informação de item mais alta é determinada por maior discriminação de item e maior dificuldade de item em um valor específico de teta em relação a outros itens na escala. Adotamos como critério o ponto 0 <θ <2 na curva de informação, como característica para discriminar os participantes com maior ou menor nível de depressão. Logo, o item que pode diferenciar mais esses participantes são o item 6 “Decepção” (a = 2,57; b1 = 0,01 a b3 = 2,30), seguido pelo item 3 “Sentimentos de fracasso” (a = 2,36; b1 = 0,51 a b3 = 2,28) e o que menos diferencia os participantes no nível de depressão é o item 13 “Perda de apetite” (a = 0,95; b1 = 0,95 a b3 = 4,61) (Figura 1). Tomados em conjunto, esta análise TRI mostra que os 13 itens no BDI-13 podem discriminar indivíduos em um intervalo amplo ou estreito de theta, portanto, têm validade de medição adequada (Yang & Kao, 2014).
Estudo 2. Comprovação da estrutura fatorial do Inventário de Depressão de Beck (BDI-13)
Tendo como norteador a estrutura fatorial testada no Estudo 1, também realizamos teste de modelos alternativos, de modo a compará-los. Com isso, testamos o modelo unidimensional; o modelo tridimensional, sugerido pelo estudo de Dadfar e Kalibatseva (2016), o modelo hierárquico, composto por 1 dimensão geral de primeira ordem e três fatores específicos de segunda ordem e o modelo bi-factor com 1 referência a dimensão cognitiva, isto é, três dimensões correlacionadas e uma dimensão geral (Ver Tabela 3). A dimensão cognitiva foi escolhida para ser a referência por ser a dimensão que mais fica comprometida, afetando tanto as dimensões somáticas como as afetivas.

A escolha do modelo mais adequado se deu por meio dos índices de ajustes mais adequados, considerando o menor valor de χ²/df (Anunciação, 2018), como também o menor valor de ECVI (Kline, 2015). Observamos a partir da tabela 2, que o modelo tridimensional possui os mesmos índices de ajuste do modelo hierárquico. Isso indicaria que a depressão não pode ser analisada por meio das variáveis observadas diretamente, isto é, a depressão seria analisada por meio do conjunto das dimensões de primeira ordem (afetivo, somático e cognitivo) que indicaria se o participante possui variações no grau da depressão. Mas, segundo Kline (2015) quando a comparação do modelo atual (hierárquico) com o modelo anterior (tridimensional) não for significativo, isso indica que o modelo mais adequado é o modelo anterior. Logo, a depressão pode ser analisada diretamente pelos fatores de primeira ordem (Dadfar & Kalibatseva, 2016), ou seja, o participante pode indicar seu grau de depressão a partir do sintoma relatado por ele. Já o modelo bi-factor com S-1 mostrou ser mais adequado para medir a depressão. Significa dizer que a depressão tanto pode ser examinada como um construto unidimensional como também pode ser examinado como um construto tridimensional.


Quanto às cargas fatoriais, (lambdas [λ]), do modelo bi-factor S-1, esse modelo mostrou que as cargas não foram estatisticamente diferentes de zero (p <0,001), o que demonstra que as variáveis observáveis não estão contribuindo de forma significativa na formação do traço latente específicos. Apresentaram cargas variando de 0,13 (item 2) a 0,43 (item 12) em suas respectivas dimensões específicas, afetivo e somático. Segundo Boateng et al. (2018) para ser um modelo bi-factor todas as cargas da dimensão geral têm que ser maiores que as cargas das dimensões específicas. Logo, o pressuposto para ser bi-factor S-1 foi satisfatório. Quando examinamos as cargas do modelo unidimensional e tridimensional que são os modelos alinhados, verificamos que todas as cargas fatoriais foram significativas, logo, percebemos que a variação das cargas fatoriais do modelo bi-factor S-1 sofre modificação pela quantidade de variância explicada nos dois construtos, tanto nas dimensões específicas quanto na dimensão geral. NaFigura 2, é possível perceber que todos os itens da dimensão geral possuem λ > 0,40, tornando-os estatisticamente adequados para pertencerem à dimensão (Nunnally & Bernstein, 1994).
Quanto a análise de confiabilidade, a BDI-13 apresentou o ômega de McDonald (ω = 0,89) e o alfa de Cronbach (α= 0,88) psicometricamente satisfatórios. As dimensões da BDI apresentaram consistência interna suficientes para dados acadêmicos, considerados razoáveis na Dimensão Somática (ω = 0,66; α= 0,63) e o Dimensão Cognitiva (ω = 0,68; α = 0,66) e aceitável na Dimensão Afetiva (ω =0,86; α = 0,85), já que obtiveram coeficientes > 0,60 (Nunnally & Bernstein, 1994).

Discussão
Ao longo dos dois estudos, testamos a estrutura fatorial da BDI-13. O primeiro estudo consistiu na exploração da BDI-13, do qual verificamos uma estrutura unidimensional. No segundo estudo consistiu da verificação do modelo mais adequado para BDI-13, testando a estrutura tridimensional, hierárquica e bi-factor como modelo alternativo às testagens do Estudo 1. Verificamos nesse estudo que o modelo mais adequado possui três dimensões correlacionadas e uma dimensão geral, ou seja, o modelo bi-factor. Os dois estudos apresentaram confiabilidade variando de razoável a aceitável tanto nos índices gerados pelo alfa de Cronbach como o do ômega de McDonalds (Nunnally & Bernstein, 1994).
No primeiro estudo, encontramos uma estrutura unidimensional que comportou todos os itens com cargas maiores que 0,40, indicando que eles contribuem com mais de 20% na variância do traço latente (Boateng et al., 2018). Além de avaliarmos como os itens se comportam na formação do traço latente, também examinamos a contribuição de cada item ao traço latente. Com isso, verificamos que os itens da BDI-13 também apresentaram discriminação e dificuldades diferenciadas para cada participante, ou seja, conforme os thetas dos participantes eles podem endossar qualquer categoria de respostas. Aqueles com intensos sintomas da depressão sempre pontuarão na alta categoria de resposta no número 3, indicando os sintomas mais severos. O item mais discriminativo foram “decepção” e “sentimentos de fracasso” coerentes com os estudos de Castro et al. (2010), demonstrando que esses itens possuem boa capacidade de diferenciação dos participantes. Por isso, na área da saúde mental, principalmente o termo mais adequado para se denominar quanto ao parâmetro da dificuldade é a “localização” (Yang & Kao, 2014). Pois, dependendo da localização do valor, esse participante poderá apresentar sintomas mais leves ou mais severos quanto a depressão. Não existem itens fáceis ou difíceis (Yang & Kao, 2014), existe a expressão de como o participante está sentindo naquela semana (Dadfar & Kalibatseva, 2016).
Os índices de adequação do BDI-13 indicaram que o modelo proposto por Dadfar e Kalibatseva (2016) - tridimensional- também é um modelo adequado na composição da estrutura fatorial. Não só modelo tridimensional, mas também o modelo unidimensional consegue abarcar a dimensão da depressão. Além disso, as cargas fatoriais da dimensão geral foram todas acima de 0,40, o que indicam que eles contribuem com mais de 20% na formação do traço latente. Suas correlações fortes indicam que poderia ter um modelo geral que comportasse os três fatores (modelo hierárquico). No entanto, com a testagem de modelo, observou que o modelo tridimensional e modelo hierárquico não se diferem estatisticamente, logo, esse modelo hierárquico não é um modelo mais adequado. Pois, se fosse possível, os sintomas de depressão só seriam visíveis se as pessoas sofressem com os três tipos em conjunto, para então serem diagnosticados como depressivos. Porém, para a DSM-V (2014) e ICD-11 (2018), para uma pessoa ser diagnosticada com o sintoma da depressão, ela pode apresentar alguns sintomas, que podem variar em termos das alterações somáticas, cognitivas e afetivas, e não necessariamente precisa que se apresente todos os sintomas em conjunto.
Uma das contribuições do nosso processo de validação fatorial concentra-se na realização da Teoria de Resposta ao Item (TRI). A TRI descreve a relação que a Teoria Clássica dos Testes (TCT), não conseguiu avaliar ser a relação do traço latente com as propriedades dos itens de forma individual (Yang & Kao, 2014; Boateng et al., 2018). Catro et al. (2010) retrata que a TRI possibilita verificar a relação do nível de intensidade de sintomas depressivos relacionados com a probabilidade de respostas a cada item do BDI-13. Logo, os participantes serão diferenciados conforme suas categorias de respostas.
Também contribuímos testando modelos alternativos na composição do BDI-13, já que estudos anteriores não testaram a melhor estrutura dos sintomas da depressão (Dadfar & Kalibatseva, 2016), assim como também não aparece a análise estrutural do inventário (Beck et al., 1961). Essa estrutura baseada no modelo bi-factor S-1 pode ajudar profissionais a entender que a depressão é formada por três dimensões diferenciados e uma dimensão geral que abarca todas as variáveis observadas (sintomas manifestados) e não necessariamente precisam que eles aparecem de forma conjunta, mas eles podem ser manifestos de forma diferente. É claro que a depressão não será diagnosticada apenas com o BDI-13, mas esse apresenta um suporte prático e empírico para se fazer um processo de anamnese por completo, analisando os aspectos do histórico familiar e social, sintomas relacionados a outros transtornos mentais.
Apesar de o nosso estudo ter apresentando validade fatorial, ele não está isento de limitações. A primeira delas é que o uso de uma amostra quase exclusivamente composta por indivíduos com ensino superior incompleto, em oposição a uma amostra clínica. Alguns exemplos de estudos com participantes provenientes de amostras clínicas são os de Gorenstein e Andrade (1998) e Castro, et al. (2010) (utilização do BDI de 21 itens com sujeitos enfrentando sintomatologia depressiva), assim como nos estudos de Dadfar e Kalibatseva (2016) que avaliou a estrutura da versão curta em amostras clínicas iranianas. Um estudo futuro poderia analisar se a estrutura fatorial presente nos estudantes universitários também permanece a mesma estrutura fatorial em amostras clínicas.
A nossa segunda limitação é que nossa amostra contou com a maioria ser do sexo feminino, o que impossibilitou a testagem da invariância fatorial, que buscaria avaliar se a estrutura se mantém para ambos os sexos. Estudos futuros podem balancear a amostra para que fiquem de maneira equiparadas entre os sexos. Outra possibilidade futura é a comparação entre amostras clínicas e não clínicas, considerando tratamentos farmacológicos e psicoterapêuticos, verificando se ao longo de seis meses houve modificação em termos do endossamento dos sintomas nos participantes que recebem tratamento apenas farmacológicos e participantes que recebem psicofármacos e psicoterapia.
Por fim, o uso de um estudo online pode ser considerado uma limitação, já que o controle de variáveis intervenientes na participação é reduzido. Por outro lado, o uso da internet como universo de coleta de dados aumenta a probabilidade de acessar amostras mais representativas da população, já que o pesquisador não é restringido por sua localização geográfica.
Portanto, o estudo cumpriu com os objetivos, assim como confirmou as hipóteses testadas nos dois estudos. Apresentamos uma versão mais curta que possui a mesma capacidade que a versão longa em captar sintomas depressivos em pessoas que possuem predisposição em desenvolver esse transtorno. Considerando que pacientes depressivos podem não se sentir confortáveis a responder escalas extensas, essa medida supre com essa lacuna social. Também preenchemos a lacuna teórica que é a validação fatorial dessa medida para o contexto brasileiro que podem ser manejados em brasileiros. Por fim, o estudo atual fornece evidências de que o BDI-13 é um instrumento confiável e válido para rastreamento de depressão.
Referências
Addington, D., Addington, J., & Schissel, B. (1990). A depression rating scale for schizophrenics. Schizophrenia research, 3(4), 247-251. https://doi.org/10.1016/0920-9964(90)90005-R
American Educational Research Association, American Psychological Association, & National Council on Measurement in Education. (1999). Standards for educational and psychological testing. American Educational Research Association.
American Psychological Association, American Educational Research Association, & National Council on Measurement in Education. (1966). Standards for educational and psychological tests and manuals. American Psychological Association.
Angst, J., Gamma, A., Gastpar, M., Lépine, J.-P., Mendlewicz, J., & Tylee, A. (2002). Gender differences in depression. European Archives of Psychiatry and Clinical Neuroscience, 252(5), 201–209. https://doi.org/10.1007/s00406-002-0381-6
Anunciação, L. (2018). An overview of the history and methodological aspects of psychometrics history and methodological aspects of psychometrics. Journal for ReAttach Therapy and Developmental Diversities, 1(1), 44-58. https://doi.org/10.26407/2018jrtdd.1.6eISSN:2589-7799
Baker, F. B. (2001). The basics of item response theory. ERIC. For full text: http://ericae.net/irt/baker
Beck, A. T., Ward, C., Mendelson, M., Mock, J., & Erbaugh, J. (1961). Beck depression inventory (BDI). Archives of General Psychiatry, 4(6), 561-571.
Beck, A. T., Steer, R. A., & Brown, G. (1996). Beck depression inventory–II. Psychological Assessment. https://doi.org/10.1037/t00742-000
Botega, N. J., Bio, M. R., Zomignani, M. A., Garcia Jr, C., & Pereira, W. A. B. (1995). Transtornos do humor em enfermaria de clínica médica e validação de escala de medida (HAD) de ansiedade e depressão. Revista de Saúde Pública, 29(5), 359–363. https://doi.org/10.1590/s0034-89101995000500004
Botega, N.J., Pondé, M.P., Medeiros, P., Lima, M.G., & Guerreiro, C. A. M. (1998). Validação da escala hospitalar de ansiedade e depressão (HAD) em pacientes epilépticos ambulatoriais. Jornal Brasileiro de Psiquiatria, 47 (6), 285–289.
Boateng, G. O., Neilands, T. B., Frongillo, E. A., Melgar-Quiñonez, H. R., & Young, S. L. (2018). Best practices for developing and validating scales for health, social, and behavioral research: a primer. Frontiers in public health, 6, 149. https://doi.org/10.3389/fpubh.2018.00149
Carthery-Goulart, M. T., Areza-Fegyveres, R., Schultz, R. R., Okamoto, I., Caramelli, P., Bertolucci, P. H. F., & Nitrini, R. (2007). Versão brasileira da Escala Cornell de depressão em demência. Arquivos de Neuro-psiquiatria, 65(3B), 912-915. https://doi.org/10.1590/s0004-282x2007000500037
Chagas, M. H. N., Tumas, V., Loureiro, S. R., Hallak, J. E., Trzesniak, C., de Sousa, J. P. M., ... & Crippa, J. A. S. (2010). Validity of a Brazilian version of the Zung self-rating depression scale for screening of depression in patients with Parkinson's disease. Parkinsonism & related disorders, 16(1), 42-45. https://doi.org/10.1016/j.parkreldis.2009.07.010
Castro, S. M. de J., Trentini, C., & Riboldi, J. (2010). Teoria da resposta ao item aplicada ao Inventário de Depressão Beck. Revista Brasileira de Epidemiologia, 13(3), 487-501. https://dx.doi.org/10.1590/S1415-790X2010000300012
Dadfar, M., & Kalibatseva, Z. (2016). Psychometric properties of the persian version of the short beck depression inventory with Iranian psychiatric outpatients. Scientifica, 2016, 1-6. https://doi.org/10.1155/2016/8196463
Ferrando, P. J., & Lorenzo-Seva U. (2018). Assessing the quality and appropriateness of factor solutions and factor score estimates in exploratory item factor analysis. Educational and Psychological Measurement, 78, 762-780. https://doi.org/10.1177/0013164417719308
Ferrando, P.J., & Lorenzo-Seva, U. (2017). Program FACTOR at 10: origins, development and future directions. Psicothema, 29(2), 236-241. https://doi.org/10.7334/psicothema2016.304
Ganong, L. H. (1987). Integrative reviews of nursing research. Research in nursing & health, 10(1), 1-11.
Giavoni, A., Melo, G. F. D., Parente, I., & Dantas, G. (2008). Elaboração e validação da Escala de Depressão para Idosos. Cadernos de Saúde Pública, 24, 975-982. https://doi.org/10.1590/s0102-311x2008000500004
Gorenstein, C., & Andrade, L. H. S. G. (1998). Inventário de depressão de Beck: propriedades psicométricas da versão em português. Revista de Psiquiatria Clínica, 25(5), 245-50.
Gosling, S. D., Rentfrow, P. J., & Swann Jr, W. B. (2003). A very brief measure of the Big-Five personality domains. Journal of Research in personality, 37(6), 504-528.
Horn, J. L. (1965). A rationale and test for the number of factors in factor analysis. Psychometrika, 30(2), 179-185.
World Health Organization, ICD-11. International Classification of Diseases. https://www.cdc.gov/nchs/icd/icd10.htm
Kline, R. B. (2015). Principles and practice of structural equation modeling. Guilford publications.
Moreno, R. A., & Moreno, D. H. (1998). Escalas de depressão de Montgomery & Asberg (MADRS) e de Hamilton (HAM-D). Revista Psiquiatria Clínica, 262-72.
Mulrow, C., Williams, J., Gerety, M., Ramirez, G., Montiel, O., & Kerber, C. (1995). Case-finding instruments for depression in primary care settings. Annals of internal medicine, 122(12), 913-21.
Nunnally, J.C. & Bernstein, I.H. (1994) The Assessment of Reliability. Psychometric Theory, 3, 248-292.
OPAS/OMS Brasil. (2017). Aumenta o número de pessoas com depressão no mundo. Pan American Health Organization / World Health Organization.https://www.paho.org/bra/index.php?option=com_content&view=article&id=5354:aumenta-o-numero-de-pessoas-com-depressao-no-mundo&Itemid=839
Paradela, E. M. P., Lourenço, R. A., & Veras, R. P. (2005). Validação da escala de depressão geriátrica em um ambulatório geral. Revista de saúde pública, 39, 918-923. https://doi.org/10.1590/s0034-89102005000600008
Parcias, S., Rosario, B. P. D., Sakae, T., Monte, F., Guimarães, A. C., & Xavier, A. J. (2011). Validação da versão em português do Inventário de Depressão Maior. Jornal Brasileiro de Psiquiatria, 60(3), 164-170. https://doi.org/10.1590/S0047-20852011000300003
Pasquali, L. (2018). TRI–Teoria de resposta ao item. Teoria, procedimentos e aplicações. Curitiba: Appris.
Reynolds, W. M. (2002). Manual for the Reynolds Adolescent Depression Scale—Second Edition (RADS-2). Psychological Assessment Resources.
Samejima, F. (1969). Estimation of latent ability using a response pattern of graded scores. Psychometrika monograph supplement.
Schreiner, A. S., Hayakawa, H., Morimoto, T., & Kakuma, T. (2003). Screening for late life depression: cut‐off scores for the geriatric depression scale and the cornell scale for depression in dementia among japanese subjects. International journal of geriatric psychiatry, 18(6), 498-505. https://doi.org/10.1002/gps.880
Wang, Y. P., & Gorenstein, C. (2013). Psychometric properties of the Beck Depression Inventory-II: a comprehensive review. Brazilian Journal of Psychiatry, 35, 416-431.
Weissman, M. M., Bland, R. C., Canino, G. J., Faravelli, C., Greenwald, S., Hwu, H. G., ... & Lépine, J. P. (1996). Cross-national epidemiology of major depression and bipolar disorder. Jama, 276(4), 293-299. https://doi.org/10.1001/jama.1996.03540040037030
Yang, F.M., & Kao, S. T. (2014) Item response theory for measurement validity. Shanghai Arch Psychiatry, 26(3), 171–177. https://doi.org/10.3969/j.issn.1002-0829.2014.03.010
Yesavage, J.A., Brink, T.L., Rose, T.L., Lum, O, Huang, V., & Adey, M., (1893). Development and validation of a geriatric depression screening scale: a preliminary report. Journal of Psychiatric Research;17(1),37-49.
Zhang, Z., & Yuan, K. H. (2018). Practical statistical power analysis using Webpower and R. ISDSA Press.
Zigmond, A. S., & Snaith, R. P. (1983). The hospital anxiety and depression scale. Acta psychiatrica scandinavica, 67(6), 361-370. https://doi.org/10.1111/j.1600-0447.1983.tb09716.x
Zung, W. W. (1965). A self-rating depression scale. Archives of general psychiatry, 12(1), 63-70. https://doi:10.1001/archpsyc.1965.01720310065008
Author notes
Correspondence about this article should be addressed Thais Emanuele Pessoa: thaisgaldino@live.com
Conflict of interest declaration