Resumen: El suicidio es un problema de salud a nivel mundial. Si bien existe literatura que ha abordado distintas perspectivas de la conducta y riesgo suicida, se requiere ahondar en nuevos métodos que permitan su valoración. Es por ello que se buscó evaluar a través de la literatura la utilidad de las medidas de voz y de habla en la detección y seguimiento de la conducta suicida. Esto se realizó mediante una búsqueda de literatura científica en diferentes bases de datos. Dentro de los resultados obtenidos fue posible observar que las tareas más utilizadas para evaluar voz y habla en la conducta y riesgo suicida, son las de libre expresión como la entrevista y la lectura de texto. La evidencia muestra un vínculo entre los parámetros acústicos de la voz y del habla y el riesgo suicida; también su utilidad en el seguimiento de ésta.
Palabras clave: Conducta suicida, riesgo suicida, voz, habla, parámetros acústicos, ideación suicida, intento suicida.
Abstract: Suicidal behavior and the acoustic parameters of voice and speech. Systematic review. Suicide is a global health problem. Although there is literature that has addressed different perspectives on suicidal behavior and risk, it is necessary to delve into new methods that allow their assessment. That is why we sought to evaluate through the literature the usefulness of voice and speech measures in detecting and monitoring suicidal behavior. This was done through a search of scientific literature in different databases. The results showed that the tasks most used to assess voice and speech in behavior and suicidal risk are those of free expressions, such as the interview and text reading. Evidence shows a link between acoustic parameters of voice and speech and suicide risk, also its usefulness in monitoring it.
Keywords: Suicidal behavior, suicidal risk, voice, speech, acoustic parameters, suicidal ideation, suicidal attempt.
Artículos de revisión
Conducta suicida, riesgo suicida y los parámetros acústicos de la voz y el habla. Revisión sistemática
Suicidal behavior, suicide risk and the acoustic parameters of voice and speech. A systematic review.
Recepción: 09 Agosto 2021
Aprobación: 01 Diciembre 2021
De acuerdo con la Organización Mundial de la Salud (OMS, 2021), cada año cerca de 700000 personas se suicidan y muchas más intentan hacerlo. El suicidio es una tragedia que afecta a familias, comunidades, países y tiene efectos duraderos (OMS, 2021). El suicidio se puede producir a cualquier edad y, en el año 2016, fue la segunda causa principal de defunción en el grupo etario de 15 a 29 años en todo el mundo y para los jóvenes de edades comprendidas entre los 15 y los 19 años, el suicidio es la cuarta causa de muerte (OMS, 2021).
La conceptualización de la conducta suicida no es una tarea sencilla, con respecto a esto O’Carroll et al. (1996) desarrollaron una nomenclatura que es una de las más operativas y en ella distingue entre la ideación suicida, conducta instrumental, intento de suicido y suicidio consumado. Más tarde, Silverman et al. (2007) incorporaron una nueva categoría denominada comunicación suicida, que incluye la amenaza y el plan suicida. En esta nueva nomenclatura se incorpora: 1) Ideación suicida que se refiere a pensamientos sobre la voluntad de quitarse la vida, 2) Comunicación suicida que es el acto de transmitir la intención de querer morir, 3) Conducta suicida que incorpora una conducta potencialmente lesiva, autoinfligida con deseo de acabar con su vida.
Asociado a lo anterior es posible destacar un concepto denominado “riesgo suicida”, que se entenderá como la probabilidad de que un individuo realice un intento suicida. Con respecto a esto es importante mencionar que, desde la Teoría Ideación Acción, el riesgo de suicidio posee propiedades tanto estables como dinámicas, una suposición que implica un curso temporal no lineal (Miller, 2018).
En este sentido, es necesario mencionar que existen distintos factores de riesgo que al estar presentes influyen de forma característica en el individuo provocando un aumento del riesgo suicida. Estos factores se pueden categorizar de diversas maneras: entre ellas se tienen factores biológicos, genéticos, psicológicos, socioeconómicos y culturales. El más importante corresponde al intento de suicidio previo (Organización Panamericana de Salud, 2021). Sin embargo, a medida que una persona presenta más factores de riesgo, en conjunto y considerando factores fijos y variables, aumenta la probabilidad de que tenga conducta suicida. En base a lo anterior, se puede afirmar que la conducta suicida no representa una conducta aleatoria debido a que, hasta cierto punto, se puede predecir e intervenir al identificar los factores de riesgo y los factores protectores.
La voz se define como el principal medio de comunicación del ser humano; siendo una declaración sonora de la identidad física, social y psicológica e, incluso, del estado emocional de las personas (López & Medina, 2016). En este sentido, se ha visto que el comportamiento de algunos rasgos de voz y habla entregan información para la detección de crisis suicidas y de estados depresivos, siendo antecedentes por considerar por el personal de salud (Van Puyvelde et al., 2018).
Los componentes fisiológicos son representados por las características fonético-acústicas de la voz las cuáles a su vez permiten su valoración objetiva. Éstas incluyen a los parámetros acústicos (frecuencia fundamental, intensidad, shimmer, jitter, relación armónico ruido) y formantes vocálicos (López & Medina, 2016). Los cambios en los parámetros acústicos pueden ser explicados debido a que al medir objetivamente la señal acústica resultante de la producción de habla y voz, se está cuantificando el comportamiento de los subsistemas neurológicos y fisiológicos que se coordinan para crear la emisión oral y su respectiva articulación (Dietrich et al., 2020).
Está bien documentado que las emociones influyen en la voz. El comportamiento suicida se ha vinculado a la depresión y, por ende, algunos investigadores están tratando de encontrar signos tempranos para ayudar a detectar la depresión a través del análisis acústico de la voz de un paciente (Tonn et al., 2020).
En la época actual, gracias al surgimiento de nuevas tecnologías, se ha abierto la oportunidad a crear y desarrollar nuevas formas de evaluación del riesgo suicida. En este punto se ha descrito a la tecnología basada en la voz y el habla como una herramienta útil para identificar el riesgo suicida (Tonn et al., 2020). La creación de un dispositivo basado en los parámetros acústicos de la voz y el habla podría proporcionar una medida cuantitativa basada en la fisiología de los estados suicidas, añadiendo así una herramienta al arsenal clínico. Además, esta medida cuantitativa podría brindar a los profesionales involucrados una métrica mediante la cual podrían medir la efectividad de las terapias aplicadas y hacer seguimiento de pacientes de alto riesgo (Belouali et al., 2021).
France y Shiavi (2000) determinaron mediante un análisis de F0, F1, F2 y F3 una asociación entre trastornos psicomotores, depresión y riesgo suicida al comparar tres grupos: un grupo sin ideación suicida, un segundo grupo con trastorno depresivo y el tercero con riesgo suicida. En general, existió tanto para la depresión como para el riesgo suicida una tendencia de aumento en las frecuencias de los formantes y del ancho de banda de F1, una disminución de los anchos de banda de F2 y F3 y un aplanamiento espectral relativo.
En un estudio realizado por Low et al. (2009) utilizaron características de los Coeficientes Cepstrales en las Frecuencias de Mel (MFCC) para clasificar adolescentes con depresión severa y pacientes sanos utilizando un clasificador múltiple gaussiano, optimizó la clasificación con el uso de 30 filtros en el banco de filtros y 12 coeficientes. Así, logró determinar que existen mejoras superiores al 3% al incluir los MFCC delta-delta al clasificador. Además, al realizar la clasificación por género, el rendimiento mejoró un 8%, logrando un porcentaje de acierto en el grupo control del 61% usando muestras de ambos géneros, y un 69% al utilizar sólo muestras femeninas.
En la misma línea de investigación anterior, Figueroa et al. (2020) determinaron que existen características acústicas de la voz que se correlacionan con la ideación suicida en ambos sexos. Para ello, analizaron 60 muestras de audio pertenecientes a jóvenes chilenos entre 18 y 19 años. Como resultado, obtuvieron que aquellos con ideación suicida presentaron una disminución de la frecuencia fundamental (F0) y formantes (F1, F2), y un aumento significativo del Jitter. Belouali et al. (2021) identificaron un conjunto combinado de 15 características acústicas y lingüísticas del habla, concluyendo mediante este sistema que se identificó correctamente la ideación suicida en veteranos con 86% de sensibilidad, 70% de especificidad y un área bajo la curva de ROC del 80%.
En este sentido, se puede considerar la voz y el habla como un indicador del estado emocional que puede contribuir a la detección de la conducta suicida (Figueroa et al., 2020). Sin embargo, los resultados encontrados en la literatura son heterogéneos, variando según idioma, edad, sexo e incluso por los cambios de ánimo y personalidad del hablante (Cummins et al., 2015). Por otro lado, existen pocos estudios que indiquen qué parámetros, tareas y técnicas son más adecuadas para realizar un análisis acústico de la voz y del habla para la detección temprana de sujetos que padezcan ideación suicida. Es por esto, que el objetivo de este estudio es evaluar, a través de la literatura, la utilidad de las medidas de voz y de habla en la detección de la conducta suicida, para lo que se utilizaron las respuestas a las siguientes preguntas: ¿Existe relación entre la conducta suicida y parámetros acústicos de la voz y habla?, ¿Existe alguna tarea experimental que sea más adecuada para evaluar la voz y habla en conducta suicida? y ¿Cuáles son los mejores métodos que existen para realizar el análisis de los datos de voz y de habla en conducta suicida?
Revisión sistemática de la literatura bajo los lineamientos de la declaración PRISMA (Liberati et al., 2009). La selección de los artículos incluyó a población adolescente y adulta. Se incorporaron estudios de corte transversal, reportes de casos y estudios experimentales sin límite de años de antigüedad.
Se consideraron estudios en humanos con conducta suicida, tanto en español como en inglés, que incluyeran parámetros de la voz y del habla, análisis acústicos, análisis mediante algoritmos, tecnologías de análisis de voz y de habla sin restricciones temporales.
Estudios que contemplen expresiones faciales y uso de texto como unidad de análisis u otras unidades de medidas que no sean acústicas, y revisiones sistemáticas de la literatura.
La pregunta de investigación fue: ¿Existe relación entre conducta suicida y parámetros acústicos de la voz y habla? Se realizó la búsqueda en las siguientes bases de datos: PubMed, IEEE Xplore y Web of Science y se buscaron los siguientes términos: Suicidal Behaviour, Suicide Ideation, Acoustic parameters, Jitter, Shimmer, Voice, Speech, Alpha ratio, y Spectral tilt con sus operadores boleanos, los que se utilizaron fueron OR y AND.
La estrategia de búsqueda que se utilizó en PubMed, fue la siguiente: ((((((((((acoustic parameters) OR (jitter)) OR (shimmer)) OR (voice)) OR ("Voice"[Mesh])) OR (speech)) OR ("Speech"[Mesh])) OR (prosody)) OR (alpha ratio)) OR (spectral tilt)) AND (((((suicidal behaviour) OR ("Suicidal Ideation"[Mesh])) OR (suicide)). Fecha de búsqueda: entre julio y octubre de 2020.
La estrategia de búsqueda que se utilizó en IEEE Xplore, fue: ((suicidal OR suicide) AND (voice OR Speech OR prosody)).
Y la estrategia de búsqueda de WOS fue: TEMA: ("acoustic parameters" OR jitter OR shimmer OR voice OR speech OR prosody OR alpha ratio OR spectral tilt) AND TEMA: ("suicidal behaviour" OR "Suicidal Ideation" OR suicide OR suicidal).
Los artículos se seleccionaron por título, resumen y texto completo, eliminando aquellos que no se vinculaban al tema y también aquellos que no cumplían con los criterios de inclusión/exclusión, obteniendo un total de 11, los cuales fueron incluidos en la presente revisión (Figura 1).

En cuanto a los resultados de los once estudios, siete corresponden a estudios observacionales (no experimentales), siendo en su mayoría de corte transversal, los cuatro estudios restantes poseen un diseño experimental. En cuanto a los objetivos de los artículos estos se orientaron a evaluar diferencias en los parámetros de la voz y del habla y también en cómo estos parámetros pueden representar medidas de clasificación para sujetos con riesgo suicida. La población de estos estudios incluye mayoritariamente personas adultas entre 18 y 65 años, con ideación suicida, intento suicida reportado y riesgo suicida (Tabla 1).
En los estudios analizados se puede observar el uso de diversas tareas de evaluación, tales como habla espontánea (Akkaralaertsest & Yingthawornsuk, 2019; France & Shiavi, 2000; Ozdas, Shiavi, Wilkes, et al., 2004), entrevista (Figueroa et al., 2020; Hashim et al., 2016; Ozdas et al., 2000; Parekh & Patil, 2017; Scherer et al., 2013; Subari et al., 2010; Suwannakhun & Yingthawornsuk, 2019; Yingthawornsuk, 2016; Yingthawornsuk & Shiavi, 2008), conversación (Ozdas, Shiavi, Wilkes, et al., 2004), lectura de texto (Burke et al., 2019; Hashim et al., 2016; Yingthawornsuk & Shiavi, 2008), emisión de vocal /a/ (Figueroa et al., 2020). Además, es posible observar que en algunos de estos artículos se utiliza una tarea aislada y en otros se presentan de manera combinada. De lo anterior se extrae que las tareas más utilizadas son la de libre expresión como la entrevista y la lectura de texto (Tabla 2).
De acuerdo con los métodos de análisis, se observó que son bastante heterogéneos, en tanto cada uno evidencia una metodología en particular. Estos métodos se pueden clasificar en dos grandes grupos: a) aquellos que buscan establecer diferencias contrastando medidas acústicas y b) aquellos que utilizan sistemas de clasificación para el riesgo suicida.
En el primer grupo se utilizó mayormente la medición y el análisis de parámetros acústicos a través de programa Praat o N power (Figueroa et al., 2020; France & Shiavi, 2000), análisis espectral (Ozdas, Shiavi, Silverman, et al., 2004) y modelo de mezcla Gaussiana (Yingthawornsuk & Shiavi, 2008).


El segundo grupo estableció sistemas de clasificación a través de la utilización de diversos softwares tales como opensmile, COVAREP, Matlab y también utilizaron técnicas de digitalización, predicción lineal y algoritmos, entre otras (ver Tabla 2).
Con respecto a los estudios analizados, es importante mencionar que todos ellos utilizan como criterio de inclusión el riesgo suicida. Sin embargo, no todos son muy claros con respecto al tipo de conducta suicida que incluyeron en el estudio. En muchas de las investigaciones revisadas, el riesgo suicida estuvo vinculado al reporte de intentos suicidas previos, ya sea en las últimas horas, días o semanas. En cuanto al análisis que utilizan, es posible observar parámetros acústicos de la voz, del habla, prosódicos, sistemas de probabilidades, coeficientes mel-cepstrales y entropías de sub-banda.
Los parámetros acústicos de la voz y el habla más destacados son: Jitter, Frecuencia Fundamental (F0) y formantes (Figueroa et al., 2020; France & Shiavi, 2000; Ozdas et al., 2000; Ozdas, Shiavi, Silverman, et al., 2004; Scherer et al., 2015). En relación al Jitter, se observó que este es más alto en personas con ideación suicida (Figueroa et al., 2020; Ozdas et al., 2000; Ozdas, Shiavi, Silverman, et al., 2004). La frecuencia fundamental (F0) presentó una disminución en sujetos con ideación suicida (Figueroa et al., 2000) y respecto a los formantes, se encontró que F1, F2 y F3 presentan un aumento tanto en hombres como mujeres con depresión (France & Shiavi, 2000) y una disminución de F1 y F2 en sujetos con ideación suicida (Figueroa et al., 2000).
Dentro de los sistemas de clasificación, fue posible observar que algunos de ellos presentan porcentajes cercanos al 90% (Ozdas et al., 2000; Ozdas, Shiavi, Wilkes, et al., 2004) obteniendo una alta precisión para la clasificación de personas con riesgo suicida (ver Tabla 2).
El objetivo de esta revisión fue determinar la relación entre riesgo y/o conducta suicida y los parámetros acústicos de la voz y el habla que incidirían en éstas. A través de los resultados de esta investigación, fue posible observar una relación entre las variables anteriormente descritas. Sin embargo, de los resultados obtenidos en estas investigaciones se sugiere que existen diferencias en el tipo de parámetros utilizados y también en el tipo de conducta suicida asociada al riesgo, puesto que en algunos estudios se incorporó a personas con riesgo medidos a través de intentos suicidas, ideación e ideación y depresión. Esto es importante ya que algunas de estas condiciones podrían manifestarse de manera distinta en los hallazgos de voz y habla. Es por ello que se sugiere en investigaciones futuras categorizar el riesgo en función del tipo de conducta suicida, en tanto podría ser un elemento clarificador para los sistemas de predicción del riesgo suicida.
Por otro lado, también es necesario considerar modelos teóricos que permiten entender qué es lo que lleva a una persona a cometer suicidio. En este sentido, Joiner (2005) desarrolló la Teoría Interpersonal del Suicidio, esta teoría vincula el deseo suicida con la presencia de factores interpersonales, tales como: la falta de pertenencia, la sensación de ser una carga significativa para otros y la capacidad adquirida de llevar a cabo el suicidio. De esta manera, dicho autor declara que las personas que sienten el deseo de suicidarse y además han desarrollado la capacidad de hacerlo serán las que lleven a cabo intentos de suicidio con mayor letalidad y tengan más posibilidades de morir por esa causa (Chu et al., 2017). Vinculando esta idea al uso de tecnologías predictivas, Joiner et al. (2021) plantea que en ausencia de la teoría existe una escasa capacidad para darse cuenta si el modelo logra identificar con precisión aquellos constructos que se desean medir, por lo que resultaría insuficiente para predecir el suicidio en lo seres humanos. Es por ello, que consideramos que los métodos objetivos de valoración de riesgo debiesen contemplar el modo en el que influyen las distintas conductas y el análisis de los factores fijos y variables a los métodos de valoración predictiva. Ya que, de ese modo, se lograría un modelo más robusto orientado a determinar de qué forma los distintos factores inciden en las variaciones de parámetros biológicos de voz y habla, lo que se traduciría en valores con un mayor nivel de sensibilidad, especificidad, valores predictivos positivos y negativos.
Otro hallazgo de importancia es que existen múltiples tareas para evaluar la voz y el habla en el riesgo suicida, siendo las tareas de libre expresión y lectura de texto las más utilizadas. En este sentido, Jiang et al. (2017) plantean que, si bien estas tareas son las más efectivas, existen diferencias en cuanto al sexo, siendo la tarea de descripción de imágenes la que muestra mejores resultados en el sexo masculino y la tarea de libre expresión mejores resultados en el sexo femenino.
Por su parte Mitra et al. (2015) plantean en su estudio que las tareas de lectura y de libre expresión se comportan de manera diferente, coincidiendo con el resto de los autores en que la mejor tarea es la de libre expresión (Figueroa et al., 2020; Hashim et al., 2016; Jiang et al., 2017, 2018; Mitra et al., 2015; Ozdas et al., 2000; Parekh & Patil, 2017; Scherer et al., 2013, 2015; Subari et al., 2010; Suwannakhun & Yingthawornsuk, 2019; Tonn et al., 2020; Yingthawornsuk, 2016; Yingthawornsuk & Shiavi, 2008; Zhang et al., 2020). Esta información es de utilidad, ya que nos indica que en las evaluaciones debemos incluir, por lo menos, una tarea de libre expresión, lectura de texto y/o descripción de imágenes.
Otro aspecto relevante guarda relación con la heterogeneidad de los métodos y unidades de análisis de datos de voz y habla en el riesgo suicida. Para clarificar un poco esta idea es posible agrupar en a) Métodos basados en diferencias de parámetros y b) Métodos predictivos del riesgo suicida. Asimismo, los estudios que contrastaron medidas basadas en el análisis de parámetros acústicos, los parámetros usados frecuentemente fueron: 1) F0, 2) Jitter y 3) Formantes. France y Shiavi (2000) plantean que en estudios anteriores se han identificado estos parámetros vocales como posibles señales de depresión y que existe evidencia de que estos parámetros pueden usarse para la detección de la depresión y tendencias suicidas.
Por otra parte, aquellos estudios que consideraron métodos predictivos del riesgo suicida, denotaron una falta en la estandarización de las técnicas para extraer determinadas características de la voz como frecuencia fundamental, formantes, Jitter y MFCC y cada estudio combinaba de manera distinta estos parámetros. Aun así, muchos obtuvieron altos porcentajes de precisión para distinguir a personas con riesgo suicida y sintomatología depresiva. Esto se refleja en los hallazgos obtenidos por Kiss y Vicsi (2017), quienes aplicaron sistemas de clasificación en tres grupos de personas de diferentes países obteniendo resultados con una alta precisión, por lo que además podrían ser probados en varios idiomas. Esto indica que independientemente del método, incluso aplicándolos de manera combinada, estos parámetros podrían presentar una oportunidad para ser utilizados en la evaluación remota del riego suicida.
Apoyando esta idea Alghowinem et al. (2013) plantean que las variaciones en algunos parámetros de voz y habla han entregado información importante para la detección de crisis suicidas y estados depresivos, estableciendo indicadores para los profesionales de la salud que deben tener en cuenta. Lo anterior coincide con los resultados encontrados, en donde France y Shiavi (2000) plantearon que las características derivadas de las mediciones de densidad espectral de intensidad y formantes son los mejores discriminadores entre el habla deprimida y suicida, tanto en el sexo femenino como en el masculino. Ozdas et al. (2000) mostraron una tendencia significativa de aumento a corto plazo del Jitter para el habla de sujetos suicidas. Scherer et al., (2015)indicaron quela reducción del rango de F0 en la producción de vocales caracteriza el habla conversacional de las personas con depresión, así como con tendencias suicidas. Figueroa et al. (2000)demostraron que la frecuencia fundamental (F0), los formantes (F1, F2) y Jitter, son los que mayoritariamente vinculan la presencia de ideación suicida en hombres y mujeres. Lo mencionado anteriormente, permite demostrar que los parámetros acústicos de la voz guardan relación con el riesgo suicida, por lo que sería importante considerar su medición en los protocolos de prevención y seguimiento de pacientes con riesgo como un indicador que apoye otro tipo de sistemas de evaluación.
Con respecto a esto, es importante subrayar que a diferencia de muchos procedimientos que evalúan fenómenos relativamente estables, todavía no se posee una sola prueba o grupo de pruebas que identifique con precisión el surgimiento de una crisis suicida (Fowler, 2012). Por el contrario, existe una amplia variabilidad en la medición del comportamiento suicida, demostrando que no existe un consenso de cómo evaluarla. Es por ello que desarrollar nuevos sistemas de evaluación y conocimiento en la población podría contribuir a la disminución de la conducta suicida (Zalsman et al., 2016). En este sentido, este estudio aporta conocimiento a los criterios de evaluación del riesgo suicida, entregando información para la creación de un protocolo aplicable en diversos contextos clínicos.
Con respecto a las limitaciones de este estudio, es importante mencionar que se consideró como criterio de inclusión la conducta suicida. Sin embargo, en muchos estudios no había una forma unificada para evaluarla, esto es importante ya que la conducta suicida engloba un amplio espectro de conductas que podrían tributar de manera diferenciada a la valoración del riesgo suicida. Esto a su vez podría traducirse en hallazgos diferenciados en cuanto a la voz y el habla.
Por último, es importante mencionar que la pandemia de COVID-19 ha creado profundos desafíos para los sistemas de atención médica en todo el mundo. En este sentido, se espera que producto de esta situación se incrementen los problemas de salud mental, lo que probablemente genere un aumento de los suicidios a mediano o largo plazo. Esto obliga a los profesionales de la salud a encontrar nuevas formas de brindar servicios de salud mental, siendo necesaria la atención a través de la telemedicina, poniendo a disposición recursos emergentes relacionados con el suicidio (Brown et al., 2020). Por ello, contar con sistemas que permitan monitorear la salud mental de manera dinámica por medio de una plataforma tecnológica o una llamada telefónica, representa una oportunidad de acción desde las ciencias del habla en el marco de la prevención del suicidio contribuyendo, de esta forma, a las políticas públicas vinculadas a la salud mental.
Citar este artículo como: Coliñir Olea, N.; Figueroa Saavedra, C.; & Jara Cabrera, G. (2023). Conducta suicida, riesgo suicida y los parámetros acústicos de la voz y el habla. Revisión sistemática. Revista Argentina de Ciencias del Comportamiento, 15(2), 1-14.
https://revistas.unc.edu.ar/index.php/racc/article/view/34361 (pdf)
Los autores agradecen a Andrés Fernando Benítez Concha por su aporte en la revisión de este manuscrito.
Esta investigación fue financiada por el programa de iniciación científica y el Proyecto GENERA UA-2019-004 de la Universidad Autónoma de Chile.
carla.figueroa@uautonoma.cl


