Resumen: Introducción: investigaciones recientes han descrito que en la adultez mayor pueden presentarse cambios en la producción del tono y timbre de la voz. Dichos cambios pueden ser indicadores de alteraciones cognitivas tempranas, incluso en estadios preclínicos del deterioro cognitivo. El propósito de este estudio fue identificar en la literatura hallazgos relevantes sobre el análisis acústico en personas mayores con deterioro cognitivo. Materiales y métodos: se llevó a cabo un estudio de revisión sistemática de la literatura, en el que se consultaron las siguientes bases de datos: PlosOne, Science Direct, PubMed/PMC y Google Scholar. Se utilizaron metabuscadores como: acoustic analysis, Alzheimer’s disease, mild cognitive impairment, prosody, voice analysis y voice production; además, se incluyeron artículos empíricos que describieran un análisis acústico en población adulta mayor con deterioro cognitivo. La evaluación fue realizada de manera independiente por dos evaluadores, quienes determinaron el riesgo de sesgo en la revisión. Se encontraron 59 artículos relacionados con el tema, de los cuales solo 25 cumplieron con los criterios de inclusión. Resultados: los artículos revisados identificaron cambios en la prosodia lingüística y paralingüística, el timbre y la tonalidad de la voz, asociados con el deterioro cognitivo del adulto mayor. Conclusión: los protocolos de estudio en el análisis acústicos podrían ser una buena herramienta para el apoyo en el diagnóstico clínico diferencial del deterioro cognitivo en la vejez y una buena oportunidad para la identificación de riesgo en etapas preclínicas de las demencias.
Palabras clave:acústica del lenguaje; disfunción cognitiva; habla; vozacústica del lenguaje; disfunción cognitiva; habla; voz.
Abstract: Introduction: In recent research, changes in the vocal tone and timbre production that occur in late adulthood have been described. These changes indicate early cognitive disturbances, even in preclinical stages of cognitive decline. This study aims to identify relevant findings from the literature regarding acoustic analysis in elderly adults with cognitive impairment. Material and methods: A systematic review study was conducted, in which the following databases were consulted: PlosOne, Science Direct, PubMed/PMC, and Google Scholar. Search engines such as acoustic analysis, Alzheimer’s disease, mild cognitive impairment, prosody, voice analysis, and voice production were used. Additionally, empirical articles describing the acoustic analysis in elderly adults with cognitive risk are included. The evaluation was independently performed by two evaluators, who determined the risk of bias in the review. A total of 59 articles related to the topic were found, of which 25 met the inclusion criteria. Results: The reviewed articles identified changes in linguistic and paralinguistic prosody, timbre, and vocal tonality, which are associated with cognitive decline in the elderly. Conclusion: Study protocols in the acoustic analysis could be a good tool to support the differential clinical diagnosis of cognitive deterioration in late adulthood and a good opportunity to identify the risk in preclinical stages of dementia.
Keywords: Acoustics of language; cognitive dysfunction; speech; voice.
Resumo: Introdução: pesquisas recentes descrevem que mudanças na produção do tom e timbre da voz podem ocorrer na idade adulta avançada; essas mudanças podem ser indicadores de alterações cognitivas precoces, inclusive em estágios pré-clínicos de deterioração cognitiva. O objetivo deste estudo foi identificar achados relevantes na literatura sobre análise acústica em idosos com déficit cognitivo. Materiais e métodos: foi realizado um estudo de revisão sistemática da literatura, no qual foram consultadas as seguintes bases de dados: PlosOne, Science Direct, PubMed/PMC e Google Scholar; foram utilizados mecanismos de procura, tais como: acoustic analysis, alzheimer’s disease, mild cognitive impairment, prosody, voice analysis . voice production. Foram incluídos artigos empíricos que descrevem a análise acústica na população idosa com déficit cognitivo. A avaliação foi realizada de forma independente por dois avaliadores, que determinaram o risco de viés na revisão. Foram encontrados 59 artigos relacionados ao tema, dos quais apenas 25 atenderam aos critérios de inclusão. Resultados: os artigos revisados identificaram alterações na prosódia linguística e para-linguística, no timbre e no tom de voz, associadas à deterioração cognitiva em idosos. Conclussão: os protocolos de estudo em análise acústica podem ser uma boa ferramenta para apoiar o diagnóstico clínico diferencial do comprometimento cognitivo na velhice e uma boa oportunidade para identificar o risco em estágios pré-clínicos de demência.
Palavras-chave: acústica da linguagem; disfunção cognitiva; fala; voz.
Artículos de investigación clínica o experimental
Análisis acústico en el diagnóstico del deterioro cognitivo: revisión sistemática de la literatura, 2008-2020
Acoustic Analysis in Mild Cognitive Diagnosis: Systematic Review of the Literature in 2008–2020
Análise acústica no diagnóstico da deterioração cognitiva: revisão sistemática da literatura 2008-2020

Recepción: 24 Noviembre 2020
Aprobación: 09 Agosto 2021
El envejecimiento suele caracterizarse por cambios biológicos, psicológicos y socioculturales (1). En algunos casos, este proceso evoluciona de manera patológica y ello se da como consecuencia del padecimiento de enfermedades físicas o mentales, con un profundo cambio en la autonomía del individuo. Un ejemplo de ello lo describe el deterioro cognitivo (DC), que impacta negativa y paulatinamente las funciones mentales, la personalidad y la sociabilidad del individuo (2,3).
El DC afecta en el mundo al 8 % de las personas mayores de 60 años, cifra que tiende a incrementarse con el fenómeno de envejecimiento poblacional (4,5). El grupo de trabajo del National Institute on Aging y la Alzheimer’s Association han procurado revisar minuciosamente los criterios diagnósticos del DC, describiendo que se caracteriza por presentar déficits en una o más funciones cognitivas (6-11). En estadios demenciales se manifiesta como una enfermedad crónica y altamente incapacitante (12). El DC, en sus primeras etapas, se caracteriza por la afectación de la memoria episódica reciente y de la fluencia del lenguaje; pero, en etapas más avanzadas, las personas son incluso incapaces de mantener una conversación y responder ante su entorno (13,14).
Las alteraciones del lenguaje en el DC varían desde la disminución en la fluencia verbal, pasando por procesos alterados de lectoescritura y presencia de anomias, hasta profundas alteraciones en la comprensión (15-23). Por ejemplo, se han identificado alteraciones en la velocidad de la narración durante una conversación espontánea, y esto se ha relacionado con la reducción en la evocación de palabras y con un número mayor de silencios entre ellas (14,19,20,24-29). También se han descrito dificultades articulatorias tipo disartria, paráfrasis fonológicas o presencia de circunloquios al utilizar más palabras de las necesarias para expresar una idea, y se han relacionado con atrofia en las redes cerebrales motoras y del lenguaje (30,31-34). Los hallazgos sobre el análisis automático del lenguaje son prometedores en lo que respecta a la detección temprana del DC, ya que algunos de estos cambios se manifiestan sutilmente en etapas preclínicas del deterioro (24).
Dentro de los parámetros de medición de la voz se encuentran las mediciones de jitter, o variabilidad de la perturbación de las frecuencias por periodos de la voz, y de shimmer, o medición de la amplitud, volumen e intensidad de una onda; el APQ3, o cociente de perturbación de amplitud de tres puntos; el Mean Harmonic to Noise Ratio, o la relación armónico-ruido, referido a la medida que cuantifica la cantidad de ruido aditivo en la señal de la voz, y, finalmente, los parámetros del cepstrum, que aportan información sobre el ritmo de cambio en las diferentes bandas del espectro acústico. En específico, se mide el Smoothed Cepstral Peak Prominence, prominencia del pico cepstral suavizado, el cual representa la diferencia entre el pico cepstral más prominente y el punto con la misma frecuencia (35-41).
Estudios recientes han mostrado interés en el análisis acústico del lenguaje, especialmente en el estudio de los rasgos suprasegmentales prosódicos del habla, como son la entonación y el ritmo, y han identificado marcadores clave para el diagnóstico precoz del deterioro cognitivo (34,42). Los estudios de análisis acústico o en los parámetros de la voz en el DC son recientes y se han fundamentado bajo la hipótesis de que dentro de las alteraciones del lenguaje también se presentan cambios en la prosodia, o sea, la variación sonora, el tono y el tiempo que acompaña al habla natural y la voz (43). Ballard et al. han asociado estos cambios con la pérdida de masa muscular, degeneración y disminución de las fibras de órganos que intervienen en la producción del habla, por ejemplo, la laringe (32,44). Esta estructura, en conjunto con otros órganos de la cavidad oral (labios, lengua y boca), permite el mecanismo de fonación en los sonidos que emitimos a través de la voz y que se presentan en algunos estadios del deterioro cognitivo. Así mismo, Hernández et al. sugieren que las medidas basadas en F. tienen la limitación de requerir la detección exacta de los ciclos de la F., lo que disminuye su fiabilidad en voces con algún grado de disfonía, por lo que recomiendan el análisis de la prominencia del pico cepstral, una medida de la periodicidad armónica espectral que no requiere mediciones exactas de la F., aun en las voces disfónicas (45-49). Además de lo anterior, es imperativo destacar que en este proceso de medición las emociones también desempeñan un papel fundamental, ya que pueden afectar la frecuencia fundamental o tono (19,24).
Por otro lado, estudios de medición de la actividad electromiográfica de la laringe han mostrado una reducción en las tasas de disparo en el músculo tirohioideo de las personas mayores, lo que explicaría en parte los cambios producidos en la voz (32,33). Estos hallazgos son prometedores en el estudio de nuevos marcadores clínico-patológicos asociados al deterioro cognitivo en sus fases asintomáticas, deterioro leve y demencia. Por lo anterior, el propósito de este estudio fue identificar en la literatura hallazgos relevantes sobre el análisis acústico en personas mayores con deterioro cognitivo.
El método aplicado para este estudio se basó en los parámetros PRISMA (50). Se llevó a cabo un estudio de revisión sistemática de la literatura sobre los hallazgos del análisis acústico en el DC. Dos evaluadores independientes calcularon el riesgo de sesgo y consultaron los resúmenes publicados entre febrero del 2008 y julio del 2020 en las siguientes bases de datos: PlosOne, Science Direct, Pubmed/PMC y Google Scholar, tanto en inglés como en español. Los metabuscadores fueron: voice analysis, acoustic analysis, mild cognitive impairment, Alzheimer’s disease, voice production y prosody; todos incluidos en los descriptores en Ciencias de la salud (DeCS). Se encontraron 59 publicaciones científicas en idioma inglés y español, de las cuales solo 25 cumplieron con los criterios de inclusión (figura 1).

Los autores extrajeron los datos utilizando una matriz de Excel, donde se describió el contenido de los artículos seleccionados, incluyendo autores, título, objetivo del estudio, material y métodos, resultados y conclusiones. Después se leyeron los títulos y resúmenes de los artículos, considerando los criterios de inclusión. Adicionalmente, leyeron de forma completa todos los estudios para corroborar la claridad de los resultados. Se incluyeron estudios de comparación entre grupos, casos y controles y de desarrollo tecnológico que hubieran realizado análisis acústico en población con DC (tabla 1) y enfermedad de Alzheimer (tabla 2). Por último, se consultó un tercer evaluador que corroboró la calidad de la información.
La evaluación tradicional de los parámetros de la voz se encuentra detallada en las tablas 1 y 2. Los parámetros más simples y utilizados incluyen la medición de la frecuencia fundamental media (F0). La media de la F0 nos muestra el tono promedio de la voz de una persona, si esta es aguda o grave. También suele estimarse la desviación estándar de la frecuencia fundamental (DE F0), que hace referencia a la variabilidad de la F0 en los cambios patológicos de la voz; por ejemplo, se evidencian valores anormales de F0, debido quizá a un exceso de esfuerzo de la musculatura laríngea o a un aumento de la densidad de la cubierta de las cuerdas vocales, que aportan valores más bajos de F0 de los esperados.
Estas mediciones permiten distinguir el cambio sistemático en la magnitud de las respuestas vocales F. asociados a la edad o una patología específica; por ejemplo: dichas respuestas aumentan gradualmente y alcanzan el valor máximo en el rango entre los 51 y los 60 años, y luego disminuyen entre los 61 y los 75 años. Estos cambios se consideran normales y asociados con la edad. En las tablas 1 y 2 se presenta un resumen corto del método y de los resultados encontrados de los 25 artículos utilizados para esta revisión.


AUc: área bajo la curva o area under curve, por sus siglas en inglés; scI: deterioro cognitivo subjetivo; DM: demencia mixta


Esta revisión evidenció que el análisis de la voz bajo un enfoque de tareas lingüísticas múltiples y de complejidad variada es prometedor para la discriminación diagnóstica del DC (14,52,53,55-65). Se identificaron perfiles específicos de alteración sonora para los individuos con DC y el perfil incluye mayor número de periodos en los que la voz vibra a menos ciclos por segundo, una voz más profunda, más lenta y pulsos glóticos lentos o variación brusca de la presión del aire cuando las cuerdas vocales se unen para formar un cierre completo. Ello da como resultado una tonalidad de la voz monótona y la aparición de ruidos característicos relacionados con voces temblorosas, con menos intensidad y menor control del flujo del aire (27).
Los estudios de Meilán et al. lograron identificar ocho parámetros importantes relacionados con alteraciones en la voz correspondientes a individuos con DC: a) porcentaje del periodo sin emisión de sonido, b) Brillan Apq11, c) brillan Apq3, d) número de saltos de voz, e) desviación estándar de F3., f) edad, g) relación de ruido armónico y autocorrelación y h) discriminación del tipo de participantes —en el 91.2 % de los casos; 90.05 % en la validación cruzada— (27,28,39). Estos parámetros lograron discriminar a los participantes con envejecimiento normal y Alzheimer hasta en un 97 %, y con DC, en más del 76.3% de los casos (35,38-40). Resultados similares se evidenciaron en otros estudios con un 96% a 75% de precisión diagnóstica (14,41,52). Igualmente, se debe resaltar que los estudios del análisis acústico han resultado ser útiles en la correspondencia con otras alteraciones neurológicas, como el Párkinson, la esquizofrenia, la enfermedad de Huntington, la demencia frontotemporal y la demencia con cuerpos de Lewy, y constituyen una medición prometedora, económica y rápida para el apoyo de la evaluación clínica tradicional de diversos trastornos psiquiátricos (13,21,43,44,51,52,55,56,60,61,65). Pese a lo anterior, la mayor parte de los estudios revisados fueron de mediciones transversales, de casos y controles, que devienen en una limitación metodológica a la hora de generalizar los resultados, a lo que se sugerirían estudios de seguimiento de cohorte con mediciones repetidas, que aseguren con mayor precisión la predicción y clasificación diagnóstica.
Los perfiles clínicos generados por el análisis acústico podrán ser de gran utilidad y son prometedores en el momento de una clasificación rápida en la consulta clínica, al convertirse en una herramienta más que apoya el diagnóstico dentro de una evaluación integral del DC y la enfermedad de Alzheimer en estadios tempranos o como un biomarcador diagnóstico. Sin embargo, no podría utilizarse como único criterio diagnóstico, dada la complejidad sintomática de estas patologías.
Así mismo, algunos aspectos que podrían mejorar la generalización de los resultados en estos estudios predictivos serían mediciones acústicas en escenarios de lenguaje espontáneo o menos controlados, ya que, especialmente en pacientes con un deterioro en curso, el análisis en laboratorios acústicos y bajo estímulos controlados puede producirles estrés (3,25,26,29) y modificar el resultado en la producción del lenguaje, o también generar alteraciones fonológicas, en el ritmo, la tonalidad y espacios entre las palabras, que variarían los parámetros de producción de la voz (27,52,54,57,58,61-66). Además de lo anterior, no se han realizado comparaciones en estas mediciones en pacientes con diferentes idiomas y acentos, para determinar si estas características podrían influir en características acústicas específicas dentro de los análisis.
El análisis automático del habla, al ser una medida objetiva, económica, simple y no invasiva, es una herramienta útil para proporcionar indicadores adicionales al proceso evaluativo y diagnóstico de la DC y el deterioro cognitivo leve (52,53,55-57,63-65). Estas mediciones disminuyen sesgos comunes de la evaluación clínica tradicional basada en el uso de test cognitivos, dado que el idioma, la cultura y el grado de experticia y subjetividad del evaluador no afectan en ningún sentido los protocolos de medición de la voz (13,19,27,29,45,51). Los estudios revisados aportan a la identificación de diferentes perfiles con parámetros confiables de alteración en la voz y el habla, correspondientes a deterioro cognitivo leve, demencia y envejecimiento normal. Estos hallazgos suman a los criterios clínico-patológicos asociados con el DC y deberían considerarse en un proceso de diagnóstico clínico. Sin embargo, a pesar de las ventajas de estas mediciones, se requieren más estudios cuyos resultados logren ser representativos y definitivos, con mayor robustez metodológica, que contemplen un número mayor de casos analizados, estudios de seguimiento (longitudinales) y protocolos libres de sesgos culturales del idioma.
Ambos autores contribuimos en la búsqueda de información, desarrollo del PRISMA y todo lo concerniente a la escritura del artículo.
Ninguno declarado.
Para citar este artículo:: Rodríguez-Fandiño JC, Salazar Montes AM. Análisis acústico en el diagnóstico del deterioro cognitivo: revisión sistemática de la literatura, 2008-2020. Rev Cienc Salud. 2021;19(3):1-16. https://doi.org/10.12804/revistas.urosario.edu.co/revsalud/a.9877
Autor de correspondencia: jcrodriguezf@unbosque.edu.co



AUc: área bajo la curva o area under curve, por sus siglas en inglés; scI: deterioro cognitivo subjetivo; DM: demencia mixta

