Secciones
Referencias
Resumen
Servicios
Descargas
HTML
ePub
PDF
Buscar
Fuente


Consensus Auditory Perceptual Evaluation of Voice (CAPE-V): revisión sistemática de los métodos utilizados para su adaptación y validación
Consensus Auditory Perceptual Evaluation of Voice (CAPE-V): Systematic Review of Methods Used for Adaptation and Validation
Revista de investigación e innovación en ciencias de la salud, vol. 5, núm. 2, pp. 178-204, 2023
Fundación Universitaria María Cano

Artículo de revisión


Recepción: 04 Mayo 2023

Recibido del documento revisado: 09 Julio 2023

Aprobación: 27 Septiembre 2023

DOI: https://doi.org/10.46634/riics.206

Resumen

Introducción: CAPE-V es ampliamente utilizado para evaluación perceptual vocal y ha sido adaptado y validado en múltiples idiomas. A través de un análisis exhaustivo, este estudio buscó avanzar en establecer un estándar en el método utilizado para su adaptación y validación.

Objetivo: Revisar los artículos publicados entre 2002 y 2022 que han adaptado y validado CAPE-V a distintos idiomas, para evaluar exhaustivamente la adaptación, metodología y estadísticas utilizadas.

Métodos: Se realizó una revisión sistemática utilizando Scopus, Google Scholar y PubMed para identificar artículos que adaptaran y/o validaran CAPE-V entre 2002 y 2022. Se analizó el título y resumen para preseleccionar la muestra. Para evaluar el riesgo de sesgo de los estudios incluidos se analizó de forma crítica el texto completo.

Resultados: La búsqueda inicial identificó 568 artículos. Al eliminar duplicados se revisaron 559 y 23 fueron preseleccionados. 12 se incluyeron finalmente y fueron analizados, considerando adaptación, metodología y análisis estadístico. Los resultados revelan que la adaptación y validación de CAPE-V a diversos idiomas es fundamental para garantizar mediciones precisas y confiables en diferentes poblaciones.

Análisis y discusión: Existe heterogeneidad en la forma de realizar la adaptación y validación de CAPE-V. No obstante, todos los estudios tuvieron éxito en producir resultados válidos, subrayando la importancia de estos procesos para la práctica clínica.

Conclusiones: Las adaptaciones y validaciones de CAPE-V se realizaron heterogéneamente por ausencia de un protocolo estándar. Es necesario generar orientaciones para realizar estos procesos por el aporte de esta escala a la clínica, asegurando calidad y confiabilidad de los resultados.

Palabras clave: Evaluación de la voz, trastornos de la voz, validación, confiabilidad, validez, adaptación transcultural, CAPE-V..

Abstract

Introduction: CAPE-V is widely used for vocal perceptual evaluation and has been adapted and validated in multiple languages. Through an exhaustive analysis, this study sought to advance in establishing a standard in the method used in its adaptation and validation.

Objective: To review articles published between 2002 and 2022 that have adapted and validated CAPE-V in different languages, to thoroughly evaluate the adaptation, methodology, and statistics used.

Methods: A systematic review was conducted using Scopus, Google Scholar and PubMed to identify articles that adapted and/or validated CAPE-V between 2002 and 2022. The title and summary were analyzed to pre-select the sample. To evaluate the risk of bias of the included studies, the full text was critically analyzed.

Results: The initial search identified 568 items. When duplicates were removed, 559 were reviewed and 23 were pre-selected. 12 were finally included and analyzed considering adaptation, methodology, and statistical analysis. The results show that the adaptation and validation of CAPE-V to different languages is essential to ensure accurate and reliable measurements in different populations.

Analysis and discussion: There is heterogeneity in how CAPE-V is adapted and validated. However, all studies were successful in producing valid results, underlining the importance of these processes for clinical practice.

Conclusions: Adaptations and validations of CAPE-V were performed heterogeneously due to the absence of a standard protocol. It is necessary to generate guidelines to perform these processes by providing this scale to the clinic, ensuring quality and reliability of results.

Keywords: Voice assesment, voice disorders, validation, reliability, validity, cross cultural adaptation, CAPE-V.

Introducción

La producción vocal es un fenómeno de carácter multidimensional que involucra mecanismos fisiológicos, biomecánicos y aerodinámicos, y es por ello que su evaluación debe considerar la medición de todas estas dimensiones para determinar el impacto de cada una en la generación del trastorno vocal. Para esto se deben elaborar historias clínicas bien acabadas, además de efectuar una batería de exámenes que abarquen evaluación auditivo-perceptual, examen anatomo-funcional de la laringe, pruebas acústicas y aerodinámicas y autopercepción del paciente respecto del trastorno vocal [1].

Respecto a la evaluación perceptual auditiva vocal por parte del fonoaudiólogo, sin duda actualmente existe conciencia acerca de la relevancia que tiene para el estudio de la voz. No obstante, ha sido complejo para los investigadores entregar fundamentos teóricos lo suficientemente claros que expliquen qué es la calidad vocal, lo que redundaría en que existen escasas evidencias psicoacústicas para validar técnicas de evaluación. A pesar de lo anterior, se debe reconocer la importancia que este análisis tiene para llevar a cabo el diagnóstico vocal, dada su utilidad en la clínica diaria [2].

Actualmente existen varias escalas para la evaluación perceptual auditiva de la voz, entre ellas la que creó la American Speech-Language-Hearing Association (ASHA), llamada “Consensual Auditory Perceptual Evaluation of Voice (CAPE-V)”. El objetivo de la ASHA fue elaborar normas para este tipo de evaluación, basadas en la teoría, la psicoacústica, en una escala psicométrica y en la percepción de la voz, generando un instrumento que fuera de fácil aplicación y utilizable en la práctica clínica [3]. El objetivo prioritario de CAPE-V es describir la severidad de las características perceptuales de un trastorno vocal. Secundariamente pretende aportar a la comprensión anatomo-fisiológica de las alteraciones de la voz, para determinar si se requiere aplicar otras pruebas. Está concebida como una herramienta complementaria al resto de las que se utilizan en la evaluación vocal [3].

Frente a la escala CAPE-V han surgido una serie de interrogantes, entre ellas cuál es su confiabilidad intra e intersujetos, si la escala de 100 mm. y la nomenclatura utilizada en el protocolo (leve, moderada, severa) son adecuadas, con cuánta fiabilidad puede el clínico certificar la consistencia o inconsistencia de un parámetro, o si es CAPE-V efectivamente una optimización de la escala GRBAS [4]. Para dar respuesta a estos cuestionamientos se han realizado diversos estudios, que se abordarán en la presente investigación, y que han adaptado culturalmente y/o validado el instrumento con el fin de garantizar su confiabilidad, validez y aplicabilidad en el contexto específico en el que se utilizará.

Un análisis exhaustivo de todas las publicaciones que tengan por objeto la adaptación y/o validación de CAPE-V en distintos idiomas permitirá avanzar en establecer un estándar para estos procesos. Así planteado, este estudio tiene por objetivo revisar los artículos publicados entre 2002 y 2022 acerca de la adaptación y validación de CAPE-V, sistematizando la información disponible, para evaluar de forma crítica la adaptación, metodología y análisis estadístico que se utilizaron.

Métodos

Selección y descripción de la muestra

Se llevó a cabo una búsqueda sistemática de literatura relevante respecto a la adaptación y validación de CAPE-V, publicada entre 2002 y 2022, utilizando los motores de búsqueda Scopus, Google Scholar y PubMed. Las palabras claves utilizadas fueron evaluación de la voz - trastornos de la voz - validación - confiabilidad - validez - adaptación transcultural - CAPE-V. Se emplearon los operadores booleanos AND/OR para ampliar o reducir la búsqueda, según se requiriera.

Criterios de inclusión y exclusión definidos para la búsqueda de la literatura

  • Publicada entre 2002 y 2022.

  • Escrita en inglés o español.

  • Se incluyeron artículos de revistas y tesis de grado (maestría o doctorado). Se excluyeron capítulos de libros, presentaciones en congresos, revisiones sistemáticas y actas de congresos.

  • Se incluyeron solo investigaciones acerca de adaptación y validación de CAPE-V y que consideraran como escala de referencia a GRABS. Se excluyeron estudios experimentales que incluyeran a CAPE-V u otros en los que no se utilizara GRABS.

Información técnica

A través de la presente investigación se llevó a cabo una búsqueda automática y un análisis exhaustivo de todas las publicaciones que buscaran adaptar y validar la escala CAPE-V en distintos idiomas, con la finalidad de contribuir a establecer un estándar para estos procesos. Para ello se sistematizó la información disponible y se evaluó de forma crítica la adaptación, metodología y estadísticas utilizadas.

La búsqueda se llevó a cabo entre el 20 y 26 de enero de 2023. El acceso a los textos completos de los artículos se realizó a través de recursos de acceso abierto o por medio de las bases de datos del sitio institucional de la Universidad de Valparaíso de Chile, https://bibliotecas.uv.cl/, y estos se gestionaron utilizando el Mendeley Reference Manager. Luego de eliminar los duplicados se procedió a analizar el título y el resumen para la selección de la muestra.

No se utilizó ninguna herramienta específica para evaluar el riesgo de sesgo. Sin embargo, los textos completos de los estudios incluidos se analizaron de forma crítica considerando los siguientes criterios:

  • Metodología utilizada para la adaptación transcultural, lingüística y fonética.

  • Caracterización de los profesionales involucrados en la adaptación.

  • Procedimientos para la validación.

  • Características de las muestras vocales.

  • Cantidad y experiencia de los jueces evaluadores.

  • Análisis estadístico utilizado para la validación.

Por tratarse de una revisión sistemática, se realizó un análisis de los hallazgos de cada uno de los estudios, lo que se detalla en el apartado de “Resultados”.

Resultados

La búsqueda automática realizada en Scopus, Google Scholar y PubMed arrojó un total de 568 estudios, que luego de la eliminación de duplicados se redujo a 559. Al revisar manualmente y de forma crítica títulos y resúmenes y aplicar los criterios de inclusión y exclusión, se preseleccionaron 23 artículos. Se excluyeron 2 tesis, ya que se incluyeron los artículos relacionados con ellas; otra se descartó por encontrarse en un idioma distinto al inglés o español, y lo mismo ocurrió con algunos estudios que no resultaban relevantes para esta investigación. La muestra final para la revisión quedó conformada por 12 artículos, los que fueron revisados exhaustivamente en su texto completo por parte de la investigadora principal. Cada uno fue analizado considerando el proceso de adaptación, la metodología y el plan estadístico empleado para la validación. En la Figura 1 se presenta el diagrama de flujo del proceso adaptado desde PRISMA 2020 [5].


Figura 1
Proceso de búsqueda de literatura.
Nota. Fuente: adaptado de PRISMA. Flow Diagram [Internet]. Ottawa (ON): PRISMA; c2009[citado 27 de abril de 2023]. Disponible en: http://prismastatement.org/prismastatement/flowdiagram.aspx?AspxAutoDetectCookieSupport=1

A continuación, se presentan los resultados de los 12 artículos revisados a través de tablas. La Tabla 1 muestra información de los estudios, ordenados por año de publicación y considerando autor(es) e idioma al que fue adaptada la escala CAPE-V. La Tabla 2 presenta los criterios analizados en cada estudio respecto a quienes participaron en el proceso de adaptación transcultural, lingüística y fonética y qué procedimientos se utilizaron. La Tabla 3 enseña el análisis de cada artículo en relación con el equipamiento y procedimientos utilizados para la grabación de las muestras de voz. La Tabla 4 presenta las características de las muestras que participaron en cada estudio. La Tabla 5 describe la cantidad y experiencia de los jueces evaluadores y los procedimientos empleados para el análisis auditivo perceptual de voces. La Tabla 6 muestra el diseño y/o alcance y el análisis estadístico usado en cada una de las investigaciones analizadas.

Tabla 1
Información de los estudios incluidos en la revisión, ordenados por año de publicación.

Nota: Artículos de investigación seleccionados en la muestra del presente estudio.

Tabla 2
Participantes y procedimientos del proceso de adaptación transcultural, fonética y lingüística del CAPE-V.

Nota: Artículos de investigación seleccionados en la muestra del presente estudio.

Nota: Artículos de investigación seleccionados en la muestra del presente estudio.

Tabla 3
Descripción de equipamiento y procedimientos utilizados para la grabación de las muestras empleadas en la validación de las distintas versiones de CAPE-V.

Nota: Artículos de investigación seleccionados en la muestra del presente estudio.

Tabla 4
Características de las muestras utilizadas para la validación de las diversas versiones de CAPE-V.

Nota: Artículos de investigación seleccionados en la muestra del presente estudio.

Tabla 5
Descripción de la cantidad y experiencia de los jueces evaluadores y de procedimientos utilizados en el análisis auditivo perceptual de voces para la validación de las distintas versiones de CAPE-V.

Nota: Artículos de investigación seleccionados en la muestra del presente estudio.

Tabla 6
Diseño o alcance declarado y análisis estadístico utilizado en los distintos estudios

Nota: Artículos de investigación seleccionados en la muestra del presente estudio.

Discusión

Este artículo presenta una revisión sistemática de la literatura a través del análisis exhaustivo de todas las publicaciones que tuvieron como objetivo la adaptación y/o validación de CAPE-V en distintos idiomas, realizadas en el periodo 2002-2022, y pretende ofrecer elementos de juicio para establecer un estándar en cuanto a la realización de estos procesos. Se exploran temas como los procedimientos para efectuar la adaptación transcultural, la definición y características de la muestra, los procedimientos de grabación, el número y criterio para seleccionar a los jueces, los procedimientos para llevar a cabo la evaluación perceptual y el plan estadístico mínimo que se debería aplicar. En resumen, se busca contribuir a la normalización de los procesos de adaptación y evaluación de la voz, a fin de mejorar la calidad y la validez de los resultados obtenidos.

No obstante, todos los estudios analizados concluyen que la versión adaptada al idioma de CAPE-V es válida y confiable para ser utilizada en la evaluación perceptual de la voz en la respectiva población, los resultados de la revisión indican que existe gran heterogeneidad en la manera en que se llevaron a cabo la adaptación y la validación.

Con respecto a la adaptación de CAPE-V a los distintos idiomas, 3 de los 12 artículos analizados midieron la validez y confiabilidad a adaptaciones realizadas en otras investigaciones [6,7,16]. De los 9 restantes, 1 no señala cómo se llevó a cabo este proceso ni quienes participaron [14], y en el resto los procedimientos utilizados fueron muy heterogéneos. En general, se mantuvieron las 3 pruebas y se tuvo especial cuidado en conservar las características de las oraciones originales, respetando el contexto del idioma al que se tradujo. En algunas de las investigaciones se consideraron aspectos tales como neutralidad semántica [9], número de letras y sílabas de las oraciones [12], y porcentaje de sonidos objetivo por sentencia [13]. En el caso de la versión en chino mandarín [9], a la escala AV de 10 cm se le agregaron marcadores milimétricos y otros más altos cada 10 mm, convirtiéndolo en un punto 101 para facilitar su lectura [9]. De los 9 artículos que consideraron la adaptación, en 3 de ellos se obtuvo el permiso de la ASHA [10,11,15].

Cuando se menciona a los participantes, el número varía desde 1 a lo que es descrito como “consenso de expertos”. Con respecto a su formación, se incluyen foniatras, terapistas de habla y lenguaje, expertos en trastornos de la voz, fonéticos y lingüistas [6-13,15-17]. Solo en un caso se menciona la intervención de traductores [17].

Un aspecto que llama la atención es que, dentro de la adaptación, solamente en 2 de los 9 estudios se consideró traducción directa y retrotraducción [11,17]. Al respecto, la bibliografía señala que es necesario hablar de “adaptación” más que de “traducción”, ya que este último procedimiento es parte del primero, que es mucho más amplio y que asegura que un determinado instrumento pueda, efectivamente, ser usado en una población distinta de la original. La adaptación es un proceso más complicado que involucra varias etapas, como asegurar la evaluación del mismo constructo en las culturas e idiomas implicados, elegir adecuadamente a los traductores, efectuar los cambios necesarios para que la prueba pueda usarse en el nuevo idioma, demostrar que la nueva versión es equivalente a la original, etc. [21].

En cuanto a los procedimientos utilizados para la grabación de las muestras de voz, en 1 de los 12 estudios no se menciona nada al respecto [8]. En 5 de los 12 se usó el KayPentax Computerized Speech Lab (versiones 4500 y 4150) [6,7,9,13,14]; en otro estudio se utilizó el Analysis of Dysphonia of Speech and Voice (CSL Model 4500 [10]; en 1 de los 12 estudios se empleó una grabadora digital portátil TASCAM DR-05 [11]; y en 3 se usó un ordenador portátil, 2 con el programa Audacity y 1 con el Praat Versión 6.0.26 [12,16,17]. Finalmente, en la investigación restante no se indica en qué tipo de computador o programa se capturaron las voces [15]. En la versión hindi, en que la muestra se grabó en lugares diferentes, para las voces disfónicas se usó el Marantz 6000 [13].

En este mismo ámbito, la frecuencia de muestreo es informada en 8 ocasiones, pero es muy heterogénea: 22 kHz [6,9], 25 kHz [10], 44 kHz [12], 44,1 kHz [11,15,16], 50 kHz [14]. La resolución se informó solo en 4 oportunidades: 16 bits [11,12,16] y 32 bits [15].

Respecto a las características del micrófono utilizado, en algunos artículos no se indica nada o casi nada [7,8,13,14,17], en otros se entregan características básicas [6,9,10,15] y solo en 2 se describen con mayor detalle [11,16]. En cuanto a su tipo, 5 señalan haber usado de diadema [6,10,11,16,17], 2 de pedestal [6,9], 1 dinámico [9], 5 de condensador [11,12,14-16], 1 omnidireccional [11] y 1 unidireccional [17].

En cuanto a la distancia a la que fue colocado el micrófono respecto a la boca, en 2 estudios no se menciona [8,14], y en el resto va de 3-4 [17] o 4 cm [11,12,15], pasando por 5 cm [6,10], 10 cm [7,14] hasta llegar a 15 cm [9], que es un caso en que se especifica que este se encuentra montado en un soporte. Respecto al ángulo en el que se ubica, solo se consigna en 6 de los artículos: en 4 es de 45° [10-12,14] y en 2 se señala de 45° a 90° [7,17].

Se hace mención del ruido ambiente como mínimo [3,9], sala silenciosa o insonorizada [12,14] y <50 dB [7,10,11,15,17].

En contraste, la bibliografía revisada establece que para la grabación de muestras de voz o habla debiera usarse un micrófono de cabeza omnidireccional, debidamente calibrado, ubicado a una distancia de 4 a 10 cm de la boca, en un ángulo de 45°a 90°; con un preamplificador de ese micrófono y un sistema que permita la conversión, el almacenamiento y posterior análisis [1].

La grabación digital se puede llevar a cabo con una tarjeta interna de sonido de alta calidad de un computador o con un dispositivo analógico digital externo, que se puede combinar con un preamplificador de micrófono. No obstante, es más recomendable el sistema externo que el interno. Las especificaciones básicas son: frecuencia de muestreo ≥44,1 kHz; resolución mínima de 16 bits, pero se recomiendan 24 bits para un mayor rango dinámico; nivel de ruido menor a 10 dB en comparación con las fonaciones más débiles; ganancia ajustable para evitar saturación; y un formato de archivo de audio sin compresión o sin pérdidas (el más adecuado es .wav) [22].

El nivel del ruido ambiente debe estar por lo menos 10 dB por debajo del nivel de las emisiones vocales más débiles. Para confirmar la calidad de la señal se le debe solicitar al sujeto que permanezca en silencio durante 5 segundos, momento en el cual se debe registrar este nivel [1].

Respecto a las muestras de participantes en los distintos estudios, en todos se dividió en voces normales y disfónicas, pero existió gran variedad en los procedimientos de selección y en el número de sujetos que las componían. En algunos casos se señalaba de forma explícita que se realizó una evaluación anatomo-funcional de la laringe para determinar la etiología y clasificar los trastornos de voz [10-14,17]; en otros, se informó que las muestras se extrajeron de bases de datos [6,16]. En 2 de los artículos se consideró para fines del estudio a subgrupos de acuerdo con su diagnóstico [7], o con intervenciones quirúrgicas realizadas [8]. En algunas de las investigaciones se determinó el grado de severidad de la disfonía [6,9,16].

Con respecto al número de sujetos en cada muestra, se observó heterogeneidad entre las investigaciones y al comparar los grupos de voces normales con los que presentaban disfonía dentro del mismo estudio. El grupo más pequeño de voces normales estuvo compuesto por 10 sujetos [11,16], lo mismo que el grupo disfónico [11]. La muestra normativa con mayor número de participantes tenía 97 [15], mientras que la de emisiones disfónicas contaba con 99 [12]. En cuanto a los criterios de inclusión y exclusión, 9 de los 12 artículos [6-8,10-14,17] los declararon en su totalidad o en parte.

Si se considera como modelo el utilizado en la versión original de CAPE-V, este supuso inicialmente la identificación de voces disfónicas que incluían una variedad de trastornos, edades y niveles de gravedad, extraídas de una base de datos de 200 ejemplos grabados de acuerdo con el protocolo de CAPE-V. Posteriormente, 2 oyentes los analizaron eliminando 14 por problemas técnicos. Los 186 restantes fueron evaluados por 5 jueces experimentados, utilizando una escala de Likert de 4 puntos (1 = normal, 2 = disfonía leve, 3 = disfonía moderada y 4 = disfonía severa). Finalmente, la muestra quedó compuesta por 37 voces disfónicas que lograron el consenso de los evaluadores (7 masculinas y 30 femeninas). Estas fueron clasificadas en 13 disfonías leves, 11 moderadas y 13 graves [6]. Respecto a su diagnóstico, correspondían a una serie de patologías que se organizaron de acuerdo con el Manual de Clasificación de Trastornos de la Voz-I [23]. La muestra de voces normales estuvo conformada por 22 sujetos voluntarios (6 hombres y 16 mujeres) sin antecedentes de patología vocal. Esta normalidad fue perceptualmente confirmada por el primer autor [6].

En cuanto a la cantidad de jueces evaluadores que participaron en el análisis auditivo perceptual de voces esta era muy diversa, siendo el mínimo 2 [8,10,12] y el máximo 21 [6]. En cuanto a su formación, consideró a logopedas o terapistas de habla y lenguaje, expertos en trastornos de voz [6,7,9-17], otorrinolaringólogos [9,10,15] y estudiantes de posgrado [13]. En un caso se habla de especialistas, sin indicar mayores antecedentes [8].

Respecto a los criterios de inclusión para los jueces, en aquellos estudios en que se consideró el número de años de experiencia el mínimo fue de 5 años [6,7,11,12,15] y el máximo de 7 [14]. En 5 de ellos se indicó el promedio de años: 15,25 años [9], 20 años [13]; mientras en otros se informó el mínimo y máximo (10 y 24 años respectivamente) [16]; 12, 16 y 18 años respectivamente [17] como una característica de los jueces. En 4 ocasiones se consideró como criterio para ser parte del estudio el atender diaria o semanalmente a pacientes portadores de trastornos de voz [6,9,12,17]. Otra condición que se mencionó es la familiarización con CAPE-V y GRABS [6,11,12,14,16]. En este último caso llama la atención de un estudio que se señala la experiencia con GRABS, pero se indica que no existía conocimiento acerca del uso de una escala analógica visual para la evaluación auditiva-perceptual [15].

Nuevamente, si se considera el estudio que validó la versión original de CAPE-V, en él participaron 21 patólogos del lenguaje y habla certificados por la ASHA, con experiencia en evaluación y tratamiento de pacientes con trastornos de la voz. Dentro de los criterios de inclusión se definió que tuvieran más de 5 años de experiencia, atendieran semanalmente un número de pacientes con desórdenes vocales, fueran hablantes nativos de inglés, no presentaran antecedentes de déficit cognitivos, de habla, lenguaje, audición o visión, estuvieran familiarizados con CAPE-V y GRBAS y manifestaran disponibilidad para participar en un periodo de tiempo de 72 horas [6].

Acerca de los procedimientos que se emplearon en la evaluación perceptivo-acústica de las voces normales y disfónicas estos fueron muy variados. En todos los casos las muestras se aleatorizaron y la evaluación se realizó a ciegas y se efectuaron 2 sesiones para calificar los estímulos. Estas estuvieron separadas por intervalos de 48 a 72 horas [6,10,16] o una semana [7,8,11,12,14,15,17]. En un caso se informó que no se definió este periodo, pero sí que las sesiones debían ser secuenciales [9]. De los artículos revisados, 1 no hace mención del espacio de tiempo entre sesiones [13].

De los 12 estudios, 9 informaron la realización de una sesión de entrenamiento o la escucha de estímulos de anclaje de forma previa a la calificación [6,7,9,10,12,14,15-17]. Estas muestras no formaban parte de la investigación.

La escucha, en los casos en que figura en los textos analizados, se realizó en un ambiente exento de ruido, una sala silenciosa o con ruido <50dB [8,9,11,15,17], en ocasiones a campo libre [6,10,14], desde altavoces de un ordenador [8,16], o a través de auriculares [8,9,11,15,17]. Se consideró descansos establecidos cada cierto número de estímulos [6,8,11,12,15,17] o según necesidad [7], pudiendo escuchar las voces más de una vez [6,7,9,10,12,14,16,17], o hasta 3 veces [11].

Respecto al orden y estructura de cada sesión resultan ser muy heterogéneas, siendo complejo relevar aspectos similares. En general, se efectuó como mínimo una sesión en que se evalúo con CAPE-V y otra con GRABS.

A modo de consideración y para comparar, en la versión original para la validación de CAPE-V se entregó un CD con 74 muestras de voz (37 disfónicas, 22 normales), 11 repetidas (7 disfónicas y 4 normales) elegidas al azar para evaluar la fiabilidad intrasujeto, y 4 (2 disfónicas y 2 normales) para familiarizarse con la tarea. No se proporcionó información de ninguna pista. Los evaluadores se asignaron aleatoriamente, de tal manera que en la primera sesión 11 de ellos juzgaron las voces con GRBAS, utilizando la muestra de habla conversacional, y en la segunda lo hicieron con CAPE-V. Por su parte, los otros 10 usaron CAPE-V en la primera y GRABS en la segunda. Las sesiones estuvieron separadas por 48 a 72 horas. Respecto a la escucha, esta se llevó a cabo a campo libre, con un descanso de 5 a 10 minutos luego de la pista 36. Se permitió escuchar una muestra de voz más de una vez [6].

En cuanto al diseño o alcance de los distintos estudios, en 5 de ellos no se hace mención al respecto. En los otros 7 se señala lo siguiente: diseño prospectivo de estudio de casos y controles [10,14], cuasiexperimental [7], prospectivo [8], transversal, observacional, descriptivo y comparativo [11], de casos y controles [13] y transversal observacional de corte transversal [16].

Respecto a los análisis estadísticos realizados en cada investigación, existen algunos en común y otros que se diferencian. Por un lado, para calcular la confiabilidad intrasujeto de CAPE-V, se calculó la r de Pearson [6,9,11,12]; en tanto, para medir la confiablidad intra o intersujeto de esta misma escala, en otros estudios se usó ICC [6-12,14-16]. En un estudio la validez intersujeto se calculó con r de Pearson [13]. Por otro lado, con el fin de medir la confiabilidad intrasujeto para GRABS, se recurrió a la r de Spearman [6,9]. Para la validez concurrente, se usó el coeficiente de correlación multiserial en 1 caso [11] y la r de Spearman en 4 [12,15-17]. La validez de constructo se evaluó con t de Student [11,12] o con la prueba de Mann-Whitney U [17]. Para la validez de criterio se usó también ICC [8]. En el caso del grado de asociación entre los juicios para CAPE-V y GRBAS, se recurrió a una correlación múltiple [5] o a r de Spearman [7,10,14].

Un instrumento es confiable cuando las valoraciones efectuadas con él arrojan resultados similares en distintos momentos, contextos o poblaciones, siempre que se apliquen idénticas condiciones [24]. En la práctica, la confiabilidad se enlaza con otro concepto, que es la validez, y que se relaciona con la medida en que una prueba posee propiedades que le permiten medir de forma consistente y precisa lo que pretende evaluar. En estudios cuyo objetivo es determinar si un instrumento, en este caso CAPE-V, es válido y confiable, debería considerarse al menos la medición de la fiabilidad intra e intersujeto, y la validez de criterio, de constructo y concurrente.

En resumen, esta revisión sistemática demostró que la adaptación y validación de CAPE-V a diversos idiomas consiste en una tarea crítica que busca garantizar la calidad en la medición de las variables de interés en diferentes poblaciones. Se encontró que todos los estudios que se incluyeron en esta investigación fueron exitosos en sus resultados, lo que permite su utilización en las respectivas poblaciones. En general, estos hallazgos enfatizan la importancia de estos procesos para asegurar mediciones precisas y confiables en diferentes contextos. No obstante, es del todo necesario señalar que se encontraron diferencias importantes en la forma en que se implementó la adaptación y validación, que hacen necesario avanzar en establecer un protocolo mínimo que permita efectivamente comparar resultados.

Conclusiones

En este estudio se evidencia que las adaptaciones y validaciones de CAPE-V han sido realizadas de manera heterogénea, debido a la falta de un protocolo estándar para llevar a cabo estos procesos. Ante el aumento de versiones, parece necesario establecer orientaciones específicas para la adaptación cultural, lingüística y fonética de instrumentos como CAPE-V. Establecer criterios de inclusión para la selección de las muestras, así como procedimientos de evaluación perceptual de las voces y medidas mínimas, permitirá realizar comparaciones o generar conclusiones más fidedignas entre las distintas investigaciones. Es fundamental sentar bases sólidas que permitan la adaptación y validación de CAPE-V en diferentes contextos culturales, debido a su gran valor en la práctica clínica. Este enfoque asegurará la calidad y confiabilidad de los resultados y permitirá el uso efectivo de esta herramienta en diversas comunidades.

Referencias

Patel RR, Awan SN, Barkmeier-Kraemer J, Courey M, Deliyski D, Eadie T, et al. Recommended protocols for instrumental assessment of voice: American Speech-Language-hearing association expert panel to develop a protocol for instrumental assessment of vocal function. Am J Speech Lang Pathol [Internet]. 2018;27(3):887-905. doi: http://dx.doi.org/10.1044/2018_AJSLP-17-0009

Kreiman J, Gerratt BR. Perceptual assessment of voice quality: Past, present, and future. Perspect Voice Voice Disord [Internet]. 2010;20(2):62-7. doi: http://dx.doi.org/10.1044/vvd20.2.62

Kempster GB, Gerratt BR, Verdolini Abbott K, Barkmeier-Kraemer J, Hillman RE. Consensus auditory-perceptual evaluation of voice: development of a standardized clinical protocol. Am J Speech Lang Pathol [Internet]. 2009;18(2):124-32. doi: http://dx.doi.org/10.1044/1058-0360(2008/08-0017)

Kempster G. CAPE-V: Development and future direction. Perspect Voice Voice Disord [Internet]. 2007;17(2):11-3. doi: http://dx.doi.org/10.1044/vvd17.2.11

Page MJ, McKenzie JE, Bossuyt PM, Boutron I, Hoffmann TC, Mulrow CD, et al. Declaración PRISMA 2020: una guía actualizada para la publicación de revisiones sistemáticas. Rev Esp Cardiol [Internet]. 2021;74(9):790-9. doi: http://dx.doi.org/10.1016/j.recesp.2021.06.016

Zraick RI, Kempster GB, Connor NP, Thibeault S, Klaben BK, Bursac Z, et al. Establishing validity of the Consensus Auditory-Perceptual Evaluation of voice (CAPE-V). Am J Speech Lang Pathol [Internet]. 2011;20(1):14-22. doi: http://dx.doi.org/10.1044/1058-0360(2010/09-0105)

Mozzanica F, Ginocchio D, Borghi E, Bachmann C, Schindler A. Reliability and validity of the Italian version of the Consensus Auditory-Perceptual Evaluation of Voice (CAPE-V). Folia Phoniatr Logop [Internet]. 2014;65(5):257-65. doi: http://dx.doi.org/10.1159/000356479

Núñez-Batalla F, Morato-Galán M, García-López I, Ávila-Menéndez A. Adaptación fonética y validación del método de valoración perceptual de la voz CAPE-V al español. Acta Otorrinolaringol Esp [Internet]. 2015;66(5):249-57. doi: http://dx.doi.org/10.1016/j.otorri.2014.07.007

Chen Z, Fang R, Zhang Y, Ge P, Zhuang P, Chou A, et al. The Mandarin version of the Consensus Auditory-Perceptual Evaluation of voice (CAPE-V) and its reliability. J Speech Lang Hear Res [Internet]. 2018;61(10):2451-7. doi: http://dx.doi.org/10.1044/2018_JSLHR-S-17-0386

Özcebe E, Aydinli FE, Tiğrak TK, İncebay Ö, Yilmaz T. Reliability and validity of the Turkish version of the Consensus Auditory-Perceptual Evaluation of voice (CAPE-V). J Voice [Internet]. 2019;33(3):382.e1-382.e10. doi: http://dx.doi.org/10.1016/j.jvoice.2017.11.013

de Almeida SC, Mendes AP, Kempster GB. The Consensus Auditory-Perceptual Evaluation of voice (CAPE-V) psychometric characteristics: II European Portuguese version (II EP CAPE-V). J Voice [Internet]. 2019;33(4):582.e5-582.e13. doi: http://dx.doi.org/10.1016/j.jvoice.2018.02.013

Ertan-Schlüter E, Demirhan E, Ünsal EM, Tadıhan-Özkan E. The Turkish version of the Consensus Auditory-Perceptual Evaluation of voice (CAPE-V): A reliability and validity study. J Voice [Internet]. 2020;34(6):965.e13-965.e22. doi: http://dx.doi.org/10.1016/j.jvoice.2019.05.014

Joshi A, Baheti I, Angadi V. Cultural and linguistic adaptation of the Consensus Auditory-Perceptual Evaluation of voice (CAPE-V) into hindi. J Speech Lang Hear Res [Internet]. 2020;63(12):3974-81. doi: http://dx.doi.org/10.1044/2020_JSLHR-20-00348

Gunjawate DR, Ravi R, Bhagavan S. Reliability and validity of the Kannada version of the Consensus Auditory-Perceptual Evaluation of voice. J Speech Lang Hear Res [Internet]. 2020;63(2):385-92. doi: http://dx.doi.org/10.1044/2019_JSLHR-19-00020

Kondo K, Mizuta M, Kawai Y, Sogami T, Fujimura S, Kojima T, et al. Development and validation of the Japanese version of the Consensus Auditory-Perceptual Evaluation of voice. J Speech Lang Hear Res [Internet]. 2021;64(12):4754-61. doi: http://dx.doi.org/10.1044/2021_JSLHR-21-00269

Behlau M, Rocha B, Englert M, Madazio G. Validation of the Brazilian Portuguese CAPE-V instrument-Br CAPE-V for auditory-perceptual analysis. J Voice [Internet]. 2022;36(4):586.e15-586.e20. doi: http://dx.doi.org/10.1016/j.jvoice.2020.07.007

Mohd Mossadeq N, Mohd Khairuddin KA, Zakaria MN. Cross-cultural adaptation of the consensus auditory-perceptual evaluation of voice (CAPE-V) into Malay: A validity study. J Voice [Internet]. 2022. doi: http://dx.doi.org/10.1016/j.jvoice.2022.05.018

Jesús LM, Barney A, Santos R, Caetano J, Couto JJ. Universidade de Aveiro’s voice evaluation protocol. In: INTERSPEECH 2009, 10th Annual Conference of the International Speech Communication Association; 2009 Sep 6-10; Brighton: International Speech Communication Association (ISCA); 2009. p. 971-4. doi: https://doi.org/10.21437/interspeech.2009-289

Behlau M, Oliveira G. Consensus Auditory-Perceptual Evaluation of Voice (CAPE-V), ASHA 2003. Rev Soc Bras Fonoaudiol. 2003;9. Available from: https://www.researchgate.net/publication/285981950_Consensus_Auditory-Perceptual_Evaluation_of_Voice_CAPE-V

Lundy DS, Casiano RR, Sullivan PA, Roy S, Xue JW, Evans J. Incidence of abnormal laryngeal findings in asymptomatic singing students. Otolaryngology-Head and Neck Surgery [Internet]. 1999;121(1):69-77. doi: http://dx.doi.org/10.1016/s0194-5998(99)70128-2

Cardoso Ribeiro C, Gómez-Conesa A, Hidalgo Montesinos MD. Metodología para la adaptación de instrumentos de evaluación. Fisioter (Madr, Ed, Impresa) [Internet]. 2010;32(6):264-70. doi: http://dx.doi.org/10.1016/j.ft.2010.05.001

Švec JG, Granqvist S. Guidelines for Selecting Microphones for Human Voice Production Research. Am J Speech Lang Pathol [Internet]. 2010;19(4):356-68. doi: https://doi.org/10.1044/1058-0360(2010/09-0091)

Verdolini K, Rosen CA, Branski RC. Classification manual for voice disorders-I. Mahwah, NJ, Estados Unidos de América: Lawrence Erlbaum Associates; 2005. 296 p. doi: https://doi.org/10.4324/9781410617293

Manterola C, Grande L, Otzen T, García N, Salazar P, Quiroz G. Confiabilidad, precisión o reproducibilidad de las mediciones. Métodos de valoración, utilidad y aplicaciones en la práctica clínica. Rev Chilena Infectol [Internet]. 2018;35(6):680-8. doi: http://dx.doi.org/10.4067/s0716-10182018000600680

Notas

Citar así: Narea-Veas, María-Soledad; Farías, Patricia Guadalupe; Vázquez Fernández, Patricia. (2023). Consensus Auditory Perceptual Evaluation of Voice (CAPE-V): revisión sistemática de los métodos utilizados para su adaptación y validación. Revista de Investigación e Innovación en Ciencias de la Salud. 5(2), 178-204. https://doi.org/10.46634/riics.206
Editor: Fraidy-Alonso Alzate-Pamplona, MSc. https://orcid.org/0000-0002-6342-3444
Copyright: © 2023. Fundación Universitaria María Cano. La Revista de Investigación e Innovación en Ciencias de la Salud proporciona acceso abierto a todo su contenido bajo los términos de la licencia Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0).
Declaración de intereses: Las autoras han declarado que no hay conflicto de intereses.
Disponibilidad de datos: Todos los datos relevantes se encuentran en el artículo. Para mayor información, comunicarse con el autor de correspondencia.
Financiamiento: Ninguno. Esta investigación no recibió subvenciones específicas de agencias de financiamiento en los sectores público, comercial o sin fines de lucro.
Descargo de responsabilidad: El contenido de este artículo es responsabilidad exclusiva de las autoras y no representa una opinión oficial de sus instituciones ni de la Revista de Investigación e Innovación en Ciencias de la Salud.
Contribución de las autoras
María-Soledad Narea-Veas: Conceptualización, curación de datos, análisis formal, investigación, metodología, validación, visualización, escritura: borrador original, escritura: revisión y edición.
Patricia Guadalupe Farías: Supervisión, validación, visualización, escritura: revisión y edición.
Patricia Vázquez Fernández: Validación, visualización.

Notas de autor

*Correspondencia: María-Soledad Narea-Veas. Email: soledad.narea@uv.cl



Buscar:
Ir a la Página
IR
Visor de artículos científicos generados a partir de XML-JATS4R por