Artículos de revisión

Conducta suicida, riesgo suicida y los parámetros acústicos de la voz y el habla. Revisión sistemática

Suicidal behavior, suicide risk and the acoustic parameters of voice and speech. A systematic review.

Coliñir Olea, Nicole
Universidad Autónoma de Chile, Chile
Figueroa Saavedra, Carla
Universidad Autónoma de Chile, Chile
Jara Cabrera, Gersonb
Universidad de La Frontera, Chile

Conducta suicida, riesgo suicida y los parámetros acústicos de la voz y el habla. Revisión sistemática

Revista Argentina de Ciencias del Comportamiento, vol. 15, núm. 2, 1-14, 2023

Universidad Nacional de Córdoba

Recepción: 09 Agosto 2021

Aprobación: 01 Diciembre 2021

Financiamiento

Fuente: Universidad Autónoma de Chile.

Nº de contrato: UA-2019-004

Fuente: Universidad Autónoma de Chile.

Descripción del financiamiento: Esta investigación fue financiada por el programa de iniciación científica y el Proyecto GENERA UA-2019-004 de la Universidad Autónoma de Chile.

Resumen: El suicidio es un problema de salud a nivel mundial. Si bien existe literatura que ha abordado distintas perspectivas de la conducta y riesgo suicida, se requiere ahondar en nuevos métodos que permitan su valoración. Es por ello que se buscó evaluar a través de la literatura la utilidad de las medidas de voz y de habla en la detección y seguimiento de la conducta suicida. Esto se realizó mediante una búsqueda de literatura científica en diferentes bases de datos. Dentro de los resultados obtenidos fue posible observar que las tareas más utilizadas para evaluar voz y habla en la conducta y riesgo suicida, son las de libre expresión como la entrevista y la lectura de texto. La evidencia muestra un vínculo entre los parámetros acústicos de la voz y del habla y el riesgo suicida; también su utilidad en el seguimiento de ésta.

Palabras clave: Conducta suicida, riesgo suicida, voz, habla, parámetros acústicos, ideación suicida, intento suicida.

Abstract: Suicidal behavior and the acoustic parameters of voice and speech. Systematic review. Suicide is a global health problem. Although there is literature that has addressed different perspectives on suicidal behavior and risk, it is necessary to delve into new methods that allow their assessment. That is why we sought to evaluate through the literature the usefulness of voice and speech measures in detecting and monitoring suicidal behavior. This was done through a search of scientific literature in different databases. The results showed that the tasks most used to assess voice and speech in behavior and suicidal risk are those of free expressions, such as the interview and text reading. Evidence shows a link between acoustic parameters of voice and speech and suicide risk, also its usefulness in monitoring it.

Keywords: Suicidal behavior, suicidal risk, voice, speech, acoustic parameters, suicidal ideation, suicidal attempt.

De acuerdo con la Organización Mundial de la Salud (OMS, 2021), cada año cerca de 700000 personas se suicidan y muchas más intentan hacerlo. El suicidio es una tragedia que afecta a familias, comunidades, países y tiene efectos duraderos (OMS, 2021). El suicidio se puede producir a cualquier edad y, en el año 2016, fue la segunda causa principal de defunción en el grupo etario de 15 a 29 años en todo el mundo y para los jóvenes de edades comprendidas entre los 15 y los 19 años, el suicidio es la cuarta causa de muerte (OMS, 2021).

La conceptualización de la conducta suicida no es una tarea sencilla, con respecto a esto O’Carroll et al. (1996) desarrollaron una nomenclatura que es una de las más operativas y en ella distingue entre la ideación suicida, conducta instrumental, intento de suicido y suicidio consumado. Más tarde, Silverman et al. (2007) incorporaron una nueva categoría denominada comunicación suicida, que incluye la amenaza y el plan suicida. En esta nueva nomenclatura se incorpora: 1) Ideación suicida que se refiere a pensamientos sobre la voluntad de quitarse la vida, 2) Comunicación suicida que es el acto de transmitir la intención de querer morir, 3) Conducta suicida que incorpora una conducta potencialmente lesiva, autoinfligida con deseo de acabar con su vida.

Asociado a lo anterior es posible destacar un concepto denominado “riesgo suicida”, que se entenderá como la probabilidad de que un individuo realice un intento suicida. Con respecto a esto es importante mencionar que, desde la Teoría Ideación Acción, el riesgo de suicidio posee propiedades tanto estables como dinámicas, una suposición que implica un curso temporal no lineal (Miller, 2018).

En este sentido, es necesario mencionar que existen distintos factores de riesgo que al estar presentes influyen de forma característica en el individuo provocando un aumento del riesgo suicida. Estos factores se pueden categorizar de diversas maneras: entre ellas se tienen factores biológicos, genéticos, psicológicos, socioeconómicos y culturales. El más importante corresponde al intento de suicidio previo (Organización Panamericana de Salud, 2021). Sin embargo, a medida que una persona presenta más factores de riesgo, en conjunto y considerando factores fijos y variables, aumenta la probabilidad de que tenga conducta suicida. En base a lo anterior, se puede afirmar que la conducta suicida no representa una conducta aleatoria debido a que, hasta cierto punto, se puede predecir e intervenir al identificar los factores de riesgo y los factores protectores.

Hallazgos de Voz y Habla en Conducta Suicida.

La voz se define como el principal medio de comunicación del ser humano; siendo una declaración sonora de la identidad física, social y psicológica e, incluso, del estado emocional de las personas (López & Medina, 2016). En este sentido, se ha visto que el comportamiento de algunos rasgos de voz y habla entregan información para la detección de crisis suicidas y de estados depresivos, siendo antecedentes por considerar por el personal de salud (Van Puyvelde et al., 2018).

Los componentes fisiológicos son representados por las características fonético-acústicas de la voz las cuáles a su vez permiten su valoración objetiva. Éstas incluyen a los parámetros acústicos (frecuencia fundamental, intensidad, shimmer, jitter, relación armónico ruido) y formantes vocálicos (López & Medina, 2016). Los cambios en los parámetros acústicos pueden ser explicados debido a que al medir objetivamente la señal acústica resultante de la producción de habla y voz, se está cuantificando el comportamiento de los subsistemas neurológicos y fisiológicos que se coordinan para crear la emisión oral y su respectiva articulación (Dietrich et al., 2020).

Está bien documentado que las emociones influyen en la voz. El comportamiento suicida se ha vinculado a la depresión y, por ende, algunos investigadores están tratando de encontrar signos tempranos para ayudar a detectar la depresión a través del análisis acústico de la voz de un paciente (Tonn et al., 2020).

En la época actual, gracias al surgimiento de nuevas tecnologías, se ha abierto la oportunidad a crear y desarrollar nuevas formas de evaluación del riesgo suicida. En este punto se ha descrito a la tecnología basada en la voz y el habla como una herramienta útil para identificar el riesgo suicida (Tonn et al., 2020). La creación de un dispositivo basado en los parámetros acústicos de la voz y el habla podría proporcionar una medida cuantitativa basada en la fisiología de los estados suicidas, añadiendo así una herramienta al arsenal clínico. Además, esta medida cuantitativa podría brindar a los profesionales involucrados una métrica mediante la cual podrían medir la efectividad de las terapias aplicadas y hacer seguimiento de pacientes de alto riesgo (Belouali et al., 2021).

France y Shiavi (2000) determinaron mediante un análisis de F0, F1, F2 y F3 una asociación entre trastornos psicomotores, depresión y riesgo suicida al comparar tres grupos: un grupo sin ideación suicida, un segundo grupo con trastorno depresivo y el tercero con riesgo suicida. En general, existió tanto para la depresión como para el riesgo suicida una tendencia de aumento en las frecuencias de los formantes y del ancho de banda de F1, una disminución de los anchos de banda de F2 y F3 y un aplanamiento espectral relativo.

En un estudio realizado por Low et al. (2009) utilizaron características de los Coeficientes Cepstrales en las Frecuencias de Mel (MFCC) para clasificar adolescentes con depresión severa y pacientes sanos utilizando un clasificador múltiple gaussiano, optimizó la clasificación con el uso de 30 filtros en el banco de filtros y 12 coeficientes. Así, logró determinar que existen mejoras superiores al 3% al incluir los MFCC delta-delta al clasificador. Además, al realizar la clasificación por género, el rendimiento mejoró un 8%, logrando un porcentaje de acierto en el grupo control del 61% usando muestras de ambos géneros, y un 69% al utilizar sólo muestras femeninas.

En la misma línea de investigación anterior, Figueroa et al. (2020) determinaron que existen características acústicas de la voz que se correlacionan con la ideación suicida en ambos sexos. Para ello, analizaron 60 muestras de audio pertenecientes a jóvenes chilenos entre 18 y 19 años. Como resultado, obtuvieron que aquellos con ideación suicida presentaron una disminución de la frecuencia fundamental (F0) y formantes (F1, F2), y un aumento significativo del Jitter. Belouali et al. (2021) identificaron un conjunto combinado de 15 características acústicas y lingüísticas del habla, concluyendo mediante este sistema que se identificó correctamente la ideación suicida en veteranos con 86% de sensibilidad, 70% de especificidad y un área bajo la curva de ROC del 80%.

En este sentido, se puede considerar la voz y el habla como un indicador del estado emocional que puede contribuir a la detección de la conducta suicida (Figueroa et al., 2020). Sin embargo, los resultados encontrados en la literatura son heterogéneos, variando según idioma, edad, sexo e incluso por los cambios de ánimo y personalidad del hablante (Cummins et al., 2015). Por otro lado, existen pocos estudios que indiquen qué parámetros, tareas y técnicas son más adecuadas para realizar un análisis acústico de la voz y del habla para la detección temprana de sujetos que padezcan ideación suicida. Es por esto, que el objetivo de este estudio es evaluar, a través de la literatura, la utilidad de las medidas de voz y de habla en la detección de la conducta suicida, para lo que se utilizaron las respuestas a las siguientes preguntas: ¿Existe relación entre la conducta suicida y parámetros acústicos de la voz y habla?, ¿Existe alguna tarea experimental que sea más adecuada para evaluar la voz y habla en conducta suicida? y ¿Cuáles son los mejores métodos que existen para realizar el análisis de los datos de voz y de habla en conducta suicida?

Metodología

Diseño.

Revisión sistemática de la literatura bajo los lineamientos de la declaración PRISMA (Liberati et al., 2009). La selección de los artículos incluyó a población adolescente y adulta. Se incorporaron estudios de corte transversal, reportes de casos y estudios experimentales sin límite de años de antigüedad.

Criterios de Inclusión.

Se consideraron estudios en humanos con conducta suicida, tanto en español como en inglés, que incluyeran parámetros de la voz y del habla, análisis acústicos, análisis mediante algoritmos, tecnologías de análisis de voz y de habla sin restricciones temporales.

Criterios de Exclusión.

Estudios que contemplen expresiones faciales y uso de texto como unidad de análisis u otras unidades de medidas que no sean acústicas, y revisiones sistemáticas de la literatura.

Procedimiento y Análisis de Datos.

La pregunta de investigación fue: ¿Existe relación entre conducta suicida y parámetros acústicos de la voz y habla? Se realizó la búsqueda en las siguientes bases de datos: PubMed, IEEE Xplore y Web of Science y se buscaron los siguientes términos: Suicidal Behaviour, Suicide Ideation, Acoustic parameters, Jitter, Shimmer, Voice, Speech, Alpha ratio, y Spectral tilt con sus operadores boleanos, los que se utilizaron fueron OR y AND.

La estrategia de búsqueda que se utilizó en PubMed, fue la siguiente: ((((((((((acoustic parameters) OR (jitter)) OR (shimmer)) OR (voice)) OR ("Voice"[Mesh])) OR (speech)) OR ("Speech"[Mesh])) OR (prosody)) OR (alpha ratio)) OR (spectral tilt)) AND (((((suicidal behaviour) OR ("Suicidal Ideation"[Mesh])) OR (suicide)). Fecha de búsqueda: entre julio y octubre de 2020.

La estrategia de búsqueda que se utilizó en IEEE Xplore, fue: ((suicidal OR suicide) AND (voice OR Speech OR prosody)).

Y la estrategia de búsqueda de WOS fue: TEMA: ("acoustic parameters" OR jitter OR shimmer OR voice OR speech OR prosody OR alpha ratio OR spectral tilt) AND TEMA: ("suicidal behaviour" OR "Suicidal Ideation" OR suicide OR suicidal).

Los artículos se seleccionaron por título, resumen y texto completo, eliminando aquellos que no se vinculaban al tema y también aquellos que no cumplían con los criterios de inclusión/exclusión, obteniendo un total de 11, los cuales fueron incluidos en la presente revisión (Figura 1).

Diagrama de selección de artículos de la voz y habla en conducta suicida
Figura 1
Diagrama de selección de artículos de la voz y habla en conducta suicida
Nota. Basado en la metodología PRISMA

Resultados

En cuanto a los resultados de los once estudios, siete corresponden a estudios observacionales (no experimentales), siendo en su mayoría de corte transversal, los cuatro estudios restantes poseen un diseño experimental. En cuanto a los objetivos de los artículos estos se orientaron a evaluar diferencias en los parámetros de la voz y del habla y también en cómo estos parámetros pueden representar medidas de clasificación para sujetos con riesgo suicida. La población de estos estudios incluye mayoritariamente personas adultas entre 18 y 65 años, con ideación suicida, intento suicida reportado y riesgo suicida (Tabla 1).

En los estudios analizados se puede observar el uso de diversas tareas de evaluación, tales como habla espontánea (Akkaralaertsest & Yingthawornsuk, 2019; France & Shiavi, 2000; Ozdas, Shiavi, Wilkes, et al., 2004), entrevista (Figueroa et al., 2020; Hashim et al., 2016; Ozdas et al., 2000; Parekh & Patil, 2017; Scherer et al., 2013; Subari et al., 2010; Suwannakhun & Yingthawornsuk, 2019; Yingthawornsuk, 2016; Yingthawornsuk & Shiavi, 2008), conversación (Ozdas, Shiavi, Wilkes, et al., 2004), lectura de texto (Burke et al., 2019; Hashim et al., 2016; Yingthawornsuk & Shiavi, 2008), emisión de vocal /a/ (Figueroa et al., 2020). Además, es posible observar que en algunos de estos artículos se utiliza una tarea aislada y en otros se presentan de manera combinada. De lo anterior se extrae que las tareas más utilizadas son la de libre expresión como la entrevista y la lectura de texto (Tabla 2).

De acuerdo con los métodos de análisis, se observó que son bastante heterogéneos, en tanto cada uno evidencia una metodología en particular. Estos métodos se pueden clasificar en dos grandes grupos: a) aquellos que buscan establecer diferencias contrastando medidas acústicas y b) aquellos que utilizan sistemas de clasificación para el riesgo suicida.

En el primer grupo se utilizó mayormente la medición y el análisis de parámetros acústicos a través de programa Praat o N power (Figueroa et al., 2020; France & Shiavi, 2000), análisis espectral (Ozdas, Shiavi, Silverman, et al., 2004) y modelo de mezcla Gaussiana (Yingthawornsuk & Shiavi, 2008).

Tabla 1
Resumen de los artículos en población con conducta suicida
AutoresAño publicaciónDiseño investigaciónObjetivoPoblaciónEdadPaís de origenTamaño muestral
1France & Shiavi2000ObservacionalDeterminar la asociación entre las propiedades acústicas del habla y la depresión y el riesgo de suicidio.Hombres y mujeres con y sin depresión y riesgo suicida25-65 añosEstados Unidos115 / 48M y 67H
2Ozdas et al.2000Observacional de Corte transversalExplorar la capacidad de discriminación del Jitter entre pacientes suicidas y no suicidas.Hombres adultosNo se mencionaEstados Unidos10 suicidas a corto plazo / 10 sanos
3Ozdas, Shiavi, Silverman, et al.2004Observacional de Caso y controlExplorar la importancia del Jitter vocal y la pendiente del espectro de flujo glótico como indicadores de riesgo suicida a corto plazo.Pacientes suicidad, deprimidos mayores y no suicidas25-65 añosEstados Unidos30 sujetos
4Ozdas, Shiavi, Wilkes, et al.2004Observacional CorrelacionalDeterminar si las medidas acústicas de la voz, predicen las calificaciones clínicas de la severidad de la depresión.Pacientes suicidas, depresivos mayores y no suicidas25-65 añosEstados Unidos30 sujetos
5Yingthawornsuk & Shiavi, 20082008ExperimentalDeterminar características acústicas de pacientes diagnosticados clínicamente con depresión, remisión de la depresión y potencial suicida.Hombres adultos25-65 añosEstados Unidos6 muestras de habla de 3 grupos de sujetos: suicidio a corto plazo, depresión y remisión de la depresión.
6Scherer et al.2013ExperimentalInvestigar las características prosódicas y calidad de voz en una entrevista diádica de adolescentes suicidas y no suicidas.Adolescentes13-17 añosEstados Unidos16 / 8 M y 8 H
7Scherer et al.2015Observacional de Corte transversalEstudiar un enfoque de aprendizaje automático para evaluar las variables acústicas de pacientes con distintas condiciones psicológicas.Pacientes adultosEdad promedio de 44.7 añosEstados Unidos253 / 186 H y 67 M
8Hashim et al.2016Observacional ProspectivoDeterminar si las medidas acústicas de la voz, caracterizando las propiedades espectrales y de tiempo específicas, predicen las calificaciones clínicas de la severidad de la depresión.Pacientes adultos diagnosticados con depresión de alto riesgo, deprimidos no suicidas o remitidos22-62 añosEstados Unidos116 / 44 H y 72 M
9Suwannakhun & Yingthawornsuk2019Observacional de Corte transversalDiseñar un sistema de clasificación de la depresión basado en el habla.Base de datos mujeresNo se mencionaTailandia30 / 10 remitidas, 10 deprimidas y 10 suicidas de alto riesgo
10Akkaralaertsest & Yingthawornsuk2019Corte transversalInvestigar las características de las relaciones de energía espectral (SER) determinadas a partir de la densidad espectral de potencia (PSD) de las muestras de habla utilizadas para representar el nivel de gravedad de enfermedades emocionales como la depresión.Base de datos mujeres deprimidas, de alto riesgo de suicidio y normales25-65 añosTailandia30
11Figueroa et al.2020Corte transversalDeterminar la asociación entre parámetros acústicos de voz y habla y la ideación suicida entre universitarios de la ciudad de Temuco, ChileEstudiantes universitarios con ideación suicida y sin ideación suicida18-19 añosChile60 / 40M y 20H

Tabla 2
Resumen de la asociación entre los parámetros acústicos y conducta suicida.
Variables de Voz y o habla Conducta suicida asociada/riesgo suicidaInstrumento valoración conducta suicidaMétodo de análisis de voz y/o habla Método de recolección de datosResultados
1F0, F1, F2, F3 y modulación de amplitud (AM)Intento suicida /riesgo suicidaEntrevista con psicólogos y psiquiatrasAnálisis acústico N Power y MatlabHabla espontáneaLas características derivadas de las mediciones de densidad espectral de potencia y formantes son los mejores discriminadores significativos* entre el habla deprimida y suicida tanto en los estudios masculinos como femeninos.
2Duración del ciclo glotal, frecuencia fundamental (F0)y JitterIntento suicida/riesgo suicidaEntrevista y escala de HamiltonTécnica de onda transformada (WT)EntrevistaEl análisis estadístico mostró que las perturbaciones de F0 (Jitter) difieren significativamente** entre el habla de sujetos suicidas y no suicidas. Finalmente, un clasificador de máxima verosimilitud fue desarrollado, el cual obtuvo una puntuación de clasificación correcta de 80%.
3Jitter vocal y flujo glóticoIntento suicida /riesgo suicidaEntrevista, escala de Hamilton y depresión de BeckAnálisis espectro de flujo glótico y fluctuaciónConversaciónEl jitter vocal medio y los valores de pendiente espectral del flujo glótico, indican una tendencia creciente y significativa * para sujetos con depresión mayor y sujetos suicidas.
4Coeficientes cepstrales en escala MelNo declara conducta/ Riesgo suicidaEntrevistas.Digitalización utilizando un convertidor de analógico a digital.Habla espontáneaCoeficientes mel-cepstrales arrojaron un rendimiento de clasificación excepcional con puntuaciones de 80% entre pacientes suicidas a corto plazo y controles no deprimidos, 75% entre pacientes deprimidos y controles no deprimidos y 80% entre pacientes suicidas a corto plazo y pacientes deprimidos.
5Características acústicas derivadas de la energía de sub-bandaIntento suicida/riesgo suicidaEntrevista y escala depresión de BeckModelo de mezcla GaussianaEntrevista Lectura de textoLas variables asociadas a las bandas de energía demostraron la capacidad de distinguir los patrones de habla de los pacientes afectados por depresión o riesgo suicida, basado en análisis de clasificación del habla espontánea y automática. Siendo más efectivo el análisis en habla automática.
6Energía (dB), frecuencia fundamental (F0), pendiente máxima (peak), cociente de amplitud normalizado (NAQ)Ideación e intento suicida/riesgo suicidaEscala de calificación de gravedad del suicidio de Columbia, cuestionario de ideación suicida junior (SIQ-Jr) y cuestionario ubicuo (QR)Análisis de parámetros acústicos de la voz. El habla a través de WaveSurfer.EntrevistaExisten diferencias estadísticamente significativas ** entre las características del habla de los adolescentes suicidas y no suicidas. En particular los parámetros OQ, NAQ, y peak, revelan que las voces de los adolescentes suicidas suelen ser más jadeantes que la voz de los sujetos no suicidas.
7Frecuencia fundamental (F0), Formantes(F1, F2)Intento suicida / riesgo suicidaCorpus de entrevistas de evaluación de socorro (DAIC), Audio-Visual Depression Corpus (AVEC) y un corpus de una entrevista del hospital CincinnatiCaja de herramientas COVAREP, Matlab y OctaveEntrevistaLa reducción del rango de frecuencia en la producción de vocales caracteriza significativamente * el habla conversacional de las personas con depresión, trastorno de estrés postraumático, así como tendencias suicidas, que se pueden resumir en el término más amplio de angustia psicológica.
8Coeficientes cepstrales en escala MelIntento suicida/riesgo suicidaEscala de Hamilton y escala de depresión de BeckEl método de regresiones lineales múltiples usando mínimos cuadrados. Se utilizó Periodograma.Entrevista Lectura de textoEl análisis demostró que las características acústicas mediante tareas de lectura son efectivas para predecir los puntajes de escala Hamilton en pacientes masculinos y femeninos y los puntajes de escala Beck en hombres.
9Coeficientes cepstrales en escala MelIntento suicida/ riesgo suicidaEntrevista con psiquiatraTécnica PCA se ha aplicado a las características de MFCC para extraer los componentesEntrevistaLos resultados experimentales muestran que la propiedad MFCC (Mel-Scale Frequency Cepstral Coefficients) se puede utilizar en la clasificación de pacientes suicidas y depresivos remitidos. Logrando una precisión del 75% con el clasificador ML (máxima probabilidad)
10Energía de banda en distintas frecuencias.Intento suicida/ riesgo suicidaEntrevista con psiquiatraParámetros SER se organizaron y almacenaron en forma de matriz para el análisis estadístico.Habla espontáneaEl grupo de habla normal tiene el nivel de energía más alto en la banda de frecuencia número 1 (0-625Hz) en comparación con los respectivos niveles de energía más bajos de los grupos de habla deprimidos y suicidas.
11F0, F1, F2, F3, Jitter, dB, Ideación suicidaIdeación suicida/ riesgo suicidaEscala de suicidio de Okasha y escala de depresión de BeckAnálisis acústico (Praat)Emisión / a/ Entrevista Lectura de textoLa frecuencia fundamental (F0), los formantes (F1, F2) y Jitter, son los que mayoritariamente vinculan la presencia de ideación suicida de ambos sexos con diferencias significativas *.
Nota *p< .05, **p<.01

El segundo grupo estableció sistemas de clasificación a través de la utilización de diversos softwares tales como opensmile, COVAREP, Matlab y también utilizaron técnicas de digitalización, predicción lineal y algoritmos, entre otras (ver Tabla 2).

Con respecto a los estudios analizados, es importante mencionar que todos ellos utilizan como criterio de inclusión el riesgo suicida. Sin embargo, no todos son muy claros con respecto al tipo de conducta suicida que incluyeron en el estudio. En muchas de las investigaciones revisadas, el riesgo suicida estuvo vinculado al reporte de intentos suicidas previos, ya sea en las últimas horas, días o semanas. En cuanto al análisis que utilizan, es posible observar parámetros acústicos de la voz, del habla, prosódicos, sistemas de probabilidades, coeficientes mel-cepstrales y entropías de sub-banda.

Los parámetros acústicos de la voz y el habla más destacados son: Jitter, Frecuencia Fundamental (F0) y formantes (Figueroa et al., 2020; France & Shiavi, 2000; Ozdas et al., 2000; Ozdas, Shiavi, Silverman, et al., 2004; Scherer et al., 2015). En relación al Jitter, se observó que este es más alto en personas con ideación suicida (Figueroa et al., 2020; Ozdas et al., 2000; Ozdas, Shiavi, Silverman, et al., 2004). La frecuencia fundamental (F0) presentó una disminución en sujetos con ideación suicida (Figueroa et al., 2000) y respecto a los formantes, se encontró que F1, F2 y F3 presentan un aumento tanto en hombres como mujeres con depresión (France & Shiavi, 2000) y una disminución de F1 y F2 en sujetos con ideación suicida (Figueroa et al., 2000).

Dentro de los sistemas de clasificación, fue posible observar que algunos de ellos presentan porcentajes cercanos al 90% (Ozdas et al., 2000; Ozdas, Shiavi, Wilkes, et al., 2004) obteniendo una alta precisión para la clasificación de personas con riesgo suicida (ver Tabla 2).

Discusión

El objetivo de esta revisión fue determinar la relación entre riesgo y/o conducta suicida y los parámetros acústicos de la voz y el habla que incidirían en éstas. A través de los resultados de esta investigación, fue posible observar una relación entre las variables anteriormente descritas. Sin embargo, de los resultados obtenidos en estas investigaciones se sugiere que existen diferencias en el tipo de parámetros utilizados y también en el tipo de conducta suicida asociada al riesgo, puesto que en algunos estudios se incorporó a personas con riesgo medidos a través de intentos suicidas, ideación e ideación y depresión. Esto es importante ya que algunas de estas condiciones podrían manifestarse de manera distinta en los hallazgos de voz y habla. Es por ello que se sugiere en investigaciones futuras categorizar el riesgo en función del tipo de conducta suicida, en tanto podría ser un elemento clarificador para los sistemas de predicción del riesgo suicida.

Por otro lado, también es necesario considerar modelos teóricos que permiten entender qué es lo que lleva a una persona a cometer suicidio. En este sentido, Joiner (2005) desarrolló la Teoría Interpersonal del Suicidio, esta teoría vincula el deseo suicida con la presencia de factores interpersonales, tales como: la falta de pertenencia, la sensación de ser una carga significativa para otros y la capacidad adquirida de llevar a cabo el suicidio. De esta manera, dicho autor declara que las personas que sienten el deseo de suicidarse y además han desarrollado la capacidad de hacerlo serán las que lleven a cabo intentos de suicidio con mayor letalidad y tengan más posibilidades de morir por esa causa (Chu et al., 2017). Vinculando esta idea al uso de tecnologías predictivas, Joiner et al. (2021) plantea que en ausencia de la teoría existe una escasa capacidad para darse cuenta si el modelo logra identificar con precisión aquellos constructos que se desean medir, por lo que resultaría insuficiente para predecir el suicidio en lo seres humanos. Es por ello, que consideramos que los métodos objetivos de valoración de riesgo debiesen contemplar el modo en el que influyen las distintas conductas y el análisis de los factores fijos y variables a los métodos de valoración predictiva. Ya que, de ese modo, se lograría un modelo más robusto orientado a determinar de qué forma los distintos factores inciden en las variaciones de parámetros biológicos de voz y habla, lo que se traduciría en valores con un mayor nivel de sensibilidad, especificidad, valores predictivos positivos y negativos.

Otro hallazgo de importancia es que existen múltiples tareas para evaluar la voz y el habla en el riesgo suicida, siendo las tareas de libre expresión y lectura de texto las más utilizadas. En este sentido, Jiang et al. (2017) plantean que, si bien estas tareas son las más efectivas, existen diferencias en cuanto al sexo, siendo la tarea de descripción de imágenes la que muestra mejores resultados en el sexo masculino y la tarea de libre expresión mejores resultados en el sexo femenino.

Por su parte Mitra et al. (2015) plantean en su estudio que las tareas de lectura y de libre expresión se comportan de manera diferente, coincidiendo con el resto de los autores en que la mejor tarea es la de libre expresión (Figueroa et al., 2020; Hashim et al., 2016; Jiang et al., 2017, 2018; Mitra et al., 2015; Ozdas et al., 2000; Parekh & Patil, 2017; Scherer et al., 2013, 2015; Subari et al., 2010; Suwannakhun & Yingthawornsuk, 2019; Tonn et al., 2020; Yingthawornsuk, 2016; Yingthawornsuk & Shiavi, 2008; Zhang et al., 2020). Esta información es de utilidad, ya que nos indica que en las evaluaciones debemos incluir, por lo menos, una tarea de libre expresión, lectura de texto y/o descripción de imágenes.

Otro aspecto relevante guarda relación con la heterogeneidad de los métodos y unidades de análisis de datos de voz y habla en el riesgo suicida. Para clarificar un poco esta idea es posible agrupar en a) Métodos basados en diferencias de parámetros y b) Métodos predictivos del riesgo suicida. Asimismo, los estudios que contrastaron medidas basadas en el análisis de parámetros acústicos, los parámetros usados frecuentemente fueron: 1) F0, 2) Jitter y 3) Formantes. France y Shiavi (2000) plantean que en estudios anteriores se han identificado estos parámetros vocales como posibles señales de depresión y que existe evidencia de que estos parámetros pueden usarse para la detección de la depresión y tendencias suicidas.

Por otra parte, aquellos estudios que consideraron métodos predictivos del riesgo suicida, denotaron una falta en la estandarización de las técnicas para extraer determinadas características de la voz como frecuencia fundamental, formantes, Jitter y MFCC y cada estudio combinaba de manera distinta estos parámetros. Aun así, muchos obtuvieron altos porcentajes de precisión para distinguir a personas con riesgo suicida y sintomatología depresiva. Esto se refleja en los hallazgos obtenidos por Kiss y Vicsi (2017), quienes aplicaron sistemas de clasificación en tres grupos de personas de diferentes países obteniendo resultados con una alta precisión, por lo que además podrían ser probados en varios idiomas. Esto indica que independientemente del método, incluso aplicándolos de manera combinada, estos parámetros podrían presentar una oportunidad para ser utilizados en la evaluación remota del riego suicida.

Apoyando esta idea Alghowinem et al. (2013) plantean que las variaciones en algunos parámetros de voz y habla han entregado información importante para la detección de crisis suicidas y estados depresivos, estableciendo indicadores para los profesionales de la salud que deben tener en cuenta. Lo anterior coincide con los resultados encontrados, en donde France y Shiavi (2000) plantearon que las características derivadas de las mediciones de densidad espectral de intensidad y formantes son los mejores discriminadores entre el habla deprimida y suicida, tanto en el sexo femenino como en el masculino. Ozdas et al. (2000) mostraron una tendencia significativa de aumento a corto plazo del Jitter para el habla de sujetos suicidas. Scherer et al., (2015)indicaron quela reducción del rango de F0 en la producción de vocales caracteriza el habla conversacional de las personas con depresión, así como con tendencias suicidas. Figueroa et al. (2000)demostraron que la frecuencia fundamental (F0), los formantes (F1, F2) y Jitter, son los que mayoritariamente vinculan la presencia de ideación suicida en hombres y mujeres. Lo mencionado anteriormente, permite demostrar que los parámetros acústicos de la voz guardan relación con el riesgo suicida, por lo que sería importante considerar su medición en los protocolos de prevención y seguimiento de pacientes con riesgo como un indicador que apoye otro tipo de sistemas de evaluación.

Con respecto a esto, es importante subrayar que a diferencia de muchos procedimientos que evalúan fenómenos relativamente estables, todavía no se posee una sola prueba o grupo de pruebas que identifique con precisión el surgimiento de una crisis suicida (Fowler, 2012). Por el contrario, existe una amplia variabilidad en la medición del comportamiento suicida, demostrando que no existe un consenso de cómo evaluarla. Es por ello que desarrollar nuevos sistemas de evaluación y conocimiento en la población podría contribuir a la disminución de la conducta suicida (Zalsman et al., 2016). En este sentido, este estudio aporta conocimiento a los criterios de evaluación del riesgo suicida, entregando información para la creación de un protocolo aplicable en diversos contextos clínicos.

Con respecto a las limitaciones de este estudio, es importante mencionar que se consideró como criterio de inclusión la conducta suicida. Sin embargo, en muchos estudios no había una forma unificada para evaluarla, esto es importante ya que la conducta suicida engloba un amplio espectro de conductas que podrían tributar de manera diferenciada a la valoración del riesgo suicida. Esto a su vez podría traducirse en hallazgos diferenciados en cuanto a la voz y el habla.

Por último, es importante mencionar que la pandemia de COVID-19 ha creado profundos desafíos para los sistemas de atención médica en todo el mundo. En este sentido, se espera que producto de esta situación se incrementen los problemas de salud mental, lo que probablemente genere un aumento de los suicidios a mediano o largo plazo. Esto obliga a los profesionales de la salud a encontrar nuevas formas de brindar servicios de salud mental, siendo necesaria la atención a través de la telemedicina, poniendo a disposición recursos emergentes relacionados con el suicidio (Brown et al., 2020). Por ello, contar con sistemas que permitan monitorear la salud mental de manera dinámica por medio de una plataforma tecnológica o una llamada telefónica, representa una oportunidad de acción desde las ciencias del habla en el marco de la prevención del suicidio contribuyendo, de esta forma, a las políticas públicas vinculadas a la salud mental.

Agradecimientos

Los autores agradecen a Andrés Fernando Benítez Concha por su aporte en la revisión de este manuscrito.

Esta investigación fue financiada por el programa de iniciación científica y el Proyecto GENERA UA-2019-004 de la Universidad Autónoma de Chile.

Referencias

Akkaralaertsest, T., & Yingthawornsuk, T. (30 de octubre – 1 de noviembre de 2019). Classification of Depressed Speech Samples with Spectral Energy Ratios as Depression Indicator. Proceedings of 14th International Joint Symposium on Artificial Intelligence and Natural Language Processing, ISAI-NLP 2019, Chiang Mai, Tailandia. https://doi.org/10.1109/iSAI-NLP48611.2019.9045167

Alghowinem, S., Goecke, R., Wagner, M., Epps, J., Breakspear, M., & Parker, G. (26-31 de mayo de 2013). Detecting depression: A comparison between spontaneus and read speech. Proceedings of 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, Vancouver, Canadá. https://doi.org/10.1109/ICASSP.2013.6639130

Brown, S., Iqbal, Z., Burbidge, F., Sajjad, A., Reeve, M., Ayres, V., Melling, R., & Jobes, D. (2020). Embedding an evidence-based model for suicide prevention in the national health service: A service improvement initiative. International Journal of Environmental Research and Public Health, 17(14), 4920. https://doi.org/10.3390/ijerph17144920

Burke, T., Ammerman, B., & Jacobucci, R. (2019). The use of machine learning in the study of suicidal and non-suicidal self-injurious thoughts and behaviors: A systematic review. Journal of Affective Disorders, 245, 869–884. https://doi.org/10.1016/j.jad.2018.11.073

Chu, C., Buchman-Schmitt, J. M., Stanley, I. H., Hom, M. A., Tucker, R. P., Hagan, C. R., Rogers, M. L., Podlogar, M. C., Chiurliza, B., Ringer, F. B., Michaels, M. S., Patros, C. H. G., & Joiner, T. E. (2017). The interpersonal theory of suicide: A systematic review and meta-analysis of a decade of cross-national research. Psychological Bulletin, 143(12), 1313–1345. https://doi.org/10.1037/bul0000123

Cummins, N., Scherer, S., Krajewski, J., Schnieder, S., Epps, J., & Quatieri, T. (2015). A review of depression and suicide risk assessment using speech analysis. Speech Communication, 71, 10-49. https://doi.org/10.1016/j.specom.2015.03.004

Dietrich, M., Andreatta, R. D., Jiang, Y., & Stemple, J. C. (2020). Limbic and cortical control of phonation for speech in response to a public speech preparation stressor. Brain Imaging and Behavior, 14(5), 1696-1713. https://doi.org/10.1007/s11682-019-00102-x

Figueroa, C., Otzen, T., Alarcón, C., Ríos, A., Frugone, D., & Lagos, R. (2020). Association between suicidal ideation and acoustic parameters of university students’ voice and speech: a pilot study. Logopedics Phoniatrics Vocology, 46(2), 55-62. https://doi.org/10.1080/14015439.2020.1733075

Fowler, J. (2012). Suicide risk assessment in clinical practice: pragmatic guidelines for imperfect assessments. Psychotherapy, 49(1), 81-90. https://doi.org/10.1037/a0026148

France, D., & Shiavi, R. (2000). Acoustical properties of speech as indicators of depression and suicidal risk. IEEE Transactions on Biomedical Engineering, 47(7), 829-837. https://doi.org/10.1109/10.846676

Hashim, N., Wilkes, M., Salomon, R., Meggs, J., & France, D. (2016). Evaluation of Voice Acoustics as Predictors of Clinical Depression Scores. Journal of Voice, 31(2), P256.E1-256.E6. https://doi.org/10.1016/j.jvoice.2016.06.006

Jiang, H., Hu, B., Liu, Z., Wang, G., Zhang, L., Li, X., & Kang, H. (2018). Detecting Depression Using an Ensemble Logistic Regression Model Based on Multiple Speech Features. Computational and Mathematical Methods in Medicine, 6508319. https://doi.org/10.1155/2018/6508319

Jiang, H., Hu, B., Liu, Z., Yan, L., Wang, T., Liu, F., Kang, H., & Li, X. (2017). Investigation of different speech types and emotions for detecting depression using different classifiers. Speech Communication, 90, 39-46. https://doi.org/10.1016/j.specom.2017.04.001

Joiner, T. (2005). Why people die by suicide (1st Ed.). Harvard University Press.

Joiner, T., Jeon, M., Lieberman, A., Janakiraman, R., Duffy, M., Gai, M., & Dougherty, S. (2021). On prediction, refutation, and explanatory reach: A consideration of the Interpersonal Theory of Suicidal Behavior. Preventive Medicine,152(1), 106453. https://doi.org/10.1016/j.ypmed.2021.106453.

Kiss, G., & Vicsi, K. (2017). Mono- and multi-lingual depression prediction based on speech processing. International Journal of Speech Technology, 20(4), 919–935. https://doi.org/10.1007/s10772-017-9455-8

Liberati, A., Altman, D., Tetzlaff, J., Mulrow, C., Gøtzsche, P., Ioannidis, J., Clarke, M., Devereaux, P., Kleijnen, J., & Moher, D. (2009). The PRISMA Statement for Reporting Systematic Reviews and Meta-Analyses of Studies That Evaluate Health Care Interventions: Explanation and Elaboration. Plos Medicine, 6(7), e1000100. https://doi.org/10.1371/journal.pmed.1000100

López, M., & Medina, V. (2016). Efecto de la expresión de emociones básicas sobre los parámetros acústicos y los formantes vocálicos en profesionales de la voz de la ciudad de Concepción, Chile, año 2016. (Tesis de Grado, Universidad del Desarrollo, Chile). Repositorio Universidad del Desarrollo. https://repositorio.udd.cl/bitstream/handle/11447/1300/Documento.pdf?sequence=1&isAllowed=y

Low, L., Maddage, N., Lech, M., & Allen, N. (15-17 de junio de 2009). Mel frequency cepstral feature and Gaussian Mixtures for modeling clinical depression in adolescents. Proceedings of 8th IEEE International Conference on Cognitive Informatics, Hong Kong, China. https://doi.org/10.1109/COGINF.2009.5250714

Miller, D. N. (2018). Understanding and preventing youth suicide: Ideation-to-action theories of suicidal behavior and their implications for school-based suicide prevention. En P. Terry & R. Price (Eds.), Understanding suicide: Perspectives, risk factors and gender differences (pp. 165–185). Nova Science Publishers.

Mitra, V., Shriberg, E., Vergyri, D., Knoth, B., & Salomon, R. (19-24 de abril de 2015). Cross-corpus depression prediction from speech. Proceedings of 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), South Brisbane, Australia. https://doi.org/10.1109/ICASSP.2015.7178876

O’Carroll, P., Berman, A., Maris, R., Moscicki, E., Tanney, B., & Silverman, M. (1996). Beyond the Tower of Babel: a nomenclature for suicidology. Suicide & Life-Threatening Behavior,26(3), 237–252. https://doi.org/10.1007/0-306-47150-7_7

Organización Mundial de la Salud, OMS (2021). Suicidio. https://www.who.int/es/news-room/fact-sheets/detail/suicide

Organización Panamericana de la Salud (2021). Prevención del suicidio.https://www.paho.org/es/temas/prevencion-suicidio

Ozdas, A., Shiavi, R., Silverman, S., Silverman, M., & Wilkes, D. (8-11 de octubre de 2000). Analysis of fundamental frequency for near term suicidal risk assessment. Proceedings of 2000 IEEE International Conference on Systems, Man and Cybernetics, Nashville, Estados Unidos. https://doi.org/10.1109/icsmc.2000.886379

Ozdas, A., Shiavi, R., Silverman, S., Silverman, M., & Wilkes, M. (2004). Investigation of vocal jitter and glottal flow spectrum as possible cues for depression and near-term suicidal risk. IEEE Transactions on Biomedical Engineering, 51(9), 1530–1540. https://doi.org/10.1109/TBME.2004.827544

Ozdas, A., Shiavi, R., Wilkes, D., Silverman, M., & Silverman, S. (2004). Analysis of Vocal Tract Characteristics for Near-term Suicidal Risk Assessment. Methods of Information in Medicine, 43(1), 36–38. https://doi.org/10.1055/s-0038-1633420

Parekh, P., & Patil, M. (1-2 de agosto de 2017). Clinical Depression Detection for Adolescent by speech Features. Proceedings of 2017 International Conference on Energy, Communication, Data Analytics and Soft Computing (ICECDS), Chennai, India. https://doi.org/10.1109/ICECDS.2017.8390102

Scherer, S., Pestian, J., & Morency, L. (19-24 de abril de 2015). Reduced vowel space is a robust indicator of psychological distress: a cross-corpus analysis. Proceedings of 2015 IEEE International Conference on Acoustics, Speech and Signal Processing, South Brisbane, Australia. https://doi.org/10.1109/ICASSP.2015.7178880

Scherer, S., Pestian, J., & Morency, L. (26-31 de mayo de 2013). Investigating the speech characteristics of suicidal adolescents. Proceedings of 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, Vancouver, Canadá. https://doi.org/10.1109/ICASSP.2013.6637740

Silverman, M., Berman, A., Sanddal, N., O’Carroll, P., & Joiner, T. (2007). Rebuilding the Tower of Babel: A Revised Nomenclature for the Study of Suicide and Suicidal Behaviors Part 1: Background, Rationale, and Methodology. Suicide and Life-Threatening Behavior, 37(3), 248–263. https://doi.org/10.1521/suli.2007.37.3.248

Subari, K., Wilkes, D., Shiavi, R., Silverman, S., & Silverman, M. (30 de noviembre–2 de diciembre de 2010). Comparison of speaker normalization techniques for classification of emotionally disturbed subjects based on voice. Proceedings of 2010 IEEE EMBS Conference on Biomedical Engineering and Sciences (IECBES), Kuala Lumpur, Malasia. https://doi.org/10.1109/IECBES.2010.5742248

Suwannakhun, S., & Yingthawornsuk, T. (30 de octubre–1 de noviembre de 2019). Characterizing Depressive Related Speech with MFCC. Proceedings of 14th International Joint Symposium on Artificial Intelligence and Natural Language Processing, ISAI-NLP, Chiang Mai, Tailandia. https://doi.org/10.1109/iSAI-NLP48611.2019.9045499

Tonn, P., Degani, Y., Hershko, S., Klein, A., Seule, L., & Schulze, N. (2020). Development of a Digital Content-Free Speech Analysis Tool for the Measurement of Mental Health and Follow-Up for Mental Disorders: Protocol for a Case-Control Study. JMIR Research Protocols, 9(5), e13852. https://doi.org/10.2196/13852

Van Puyvelde, M., Neyt, X., McGlone, F., & Pattyn, N. (2018). Voice Stress Analysis: A New Framework for Voice and Effort in Human Performance. Frontiers in Psychology, 9, 1994. https://doi.org/10.3389/fpsyg.2018.01994

Yingthawornsuk, T., & Shiavi, R. (14-17 de octubre de 2008). Distinguishing depression and suicidal risk in men using GMM based frequency contents of affective vocal tract response. Proceedings of 2008 International Conference on Control, Automation and Systems (ICCAS), Seúl, Corea del Sur. https://doi.org/10.1109/ICCAS.2008.4694621

Yingthawornsuk, T. (29 de noviembre–1 de diciembre de 2016). Spectral Entropy in Speech for Classification of Depressed Speakers. Proceedings of 12th International Conference on Signal Image Technology and Internet-Based Systems, Nápoles, Italia. https://doi.org/10.1109/SITIS.2016.113

Zalsman, G., Hawton, K., Wasserman, D., Van Heering, K., Arensman, E., Sarchiapone, M., Carli, V., Hoschl, C., Barzilay, R., Balazs, J., Purebl, G., Kajn, J., Sáiz, P., Lipsicas, C., Bobes, J., Cozman, D., Hegerl, U., & Zohar, J. (2016). Suicide prevention strategies revisited: 10-year systematic review. Lancet Psychiatry, 3(7), 646-59. https://doi.org/10.1016/S2215-0366(16)30030-X

Zhang, L., Duvvuri, R., Chandra, K., Nguyen, T., & Ghomi, R. (2020). Automated voice biomarkers for depression symptoms using an online cross-sectional data collection initiative. Depression and Anxiety, 37(7), 657–669. https://doi.org/10.1002/da.23020

Belouali , A., Gupta, S., Sourirajan, V., Yu, J., Allen, N., Alaoui, A., Dutton, M., & Reinhard, M. (2021). Acoustic and language analysis of speech for suicidal ideation among US veterans. BioData Mining, 14(1), 1-17. https://doi.org/10.1186/s13040-021-00245-y

Notas de autor

carla.figueroa@uautonoma.cl

Información adicional

Citar este artículo como: Coliñir Olea, N.; Figueroa Saavedra, C.; & Jara Cabrera, G. (2023). Conducta suicida, riesgo suicida y los parámetros acústicos de la voz y el habla. Revisión sistemática. Revista Argentina de Ciencias del Comportamiento, 15(2), 1-14.

Enlace alternativo

HTML generado a partir de XML-JATS por