Resumen
Introducción.: La validez del conocimiento derivado de un estudio depende de la ausencia de error. Todo diseño epidemiológico es susceptible de errores, por lo que los investigadores deben planear cuidadosamente cada una de las fases de su estudio para controlarlos.
Métodos.: Revisión narrativa de la literatura, resumiendo los puntos sobresalientes relacionados con error, sesgo y confusión en investigación relacionada con cirugía.
Resultados.: Cuando se formula una pregunta de investigación se puede incurrir en dos tipos de errores que llevan a conclusiones equivocadas: el error tipo 1 (alfa), en el que se observan diferencias cuando en realidad no existen, y el error tipo 2 (beta), en el que no se encuentran diferencias cuando en realidad las hay. La lista de posibles sesgos es larga y pueden estar originados en tres fuentes, unas propias del sujeto de estudio, otras del investigador, y finalmente, unas que dependen del instrumento o sistema de recolección de la información.
Conclusión.: La validez de un estudio depende de la ausencia de errores, sin embargo, no es posible eliminar por completo los sesgos de los estudios epidemiológicos. En investigación en cirugía general, incluso en los diseños más sencillos, como los reporte de caso, puede haber errores y sesgos. Por eso, uno de los objetivos de un investigador debe ser reducir al mínimo los errores, identificar los sesgos que no se pueden evitar, determinar su impacto, tenerlos en mente en la interpretación de los resultados y manifestarlo en la publicación de su artículo.
Palabras clave: Investigación, proyectos de investigación, error científico experimental, sesgo, confusión, cirugía general.
Abstract
Introduction.: The validity of knowledge derived from a study depends on the absence of error. All epidemiological designs are susceptible to errors, so researchers must carefully plan each phase of their study to control them.
Methods.: Narrative review of the literature, summarizing the salient points related to error, bias, and confusion in surgery-related research.
Results.: When formulating a research question, two types of errors can occur that lead to wrong conclusions: type 1 error (alpha), in which differences are observed when in reality there are none, and type 2 error (beta), in which no differences are found when in reality there are. The list of possible biases is long and can originate from three sources, some belonging to the subject of the study, others to the researcher, and finally, others that depend on the instrument or system of information collection.
Conclusion.: The validity of a study depends on the absence of errors; however, it is not possible to completely eliminate biases from epidemiological studies. In general surgical research, even in the simplest designs such as case reports, errors and biases can occur. Therefore, one of the objectives of a researcher should be to reduce errors to a minimum, identify biases that cannot be avoided, determine their impact, keep them in mind when interpreting the results and express this in the publication of the article.
Keywords: Research, research design, scientific experimental error, bias, confusion, general surgery.
INVESTIGACIÓN Y CIRUGÍA
Error, sesgo y confusión: Es necesario tenerlos en mente para controlarlos
Error, bias, and confusion: It is necessary to keep them in mind to control them
Received: 20 July 2024
Accepted: 07 October 2024
Published: 05 November 2024
La validez del conocimiento derivado de un estudio depende de la ausencia de error 1. Se espera que el resultado de un estudio refleje el efecto real de una exposición, sin embargo, se debe tener en mente que los hallazgos pueden tener otra explicación, en parte debida a un error por azar, sesgo o confusión.
Todo diseño epidemiológico es susceptible de errores, por lo que los investigadores deben planear cuidadosamente cada una de las fases de su estudio para controlarlos y evitar llegar a conclusiones equivocadas.
Cuando se formula una pregunta de investigación se puede incurrir en dos tipos de errores que llevan a conclusiones equivocadas: el error tipo 1 (alfa), en el que se observan diferencias cuando en realidad no existen, y el error tipo 2 (beta), en el que no se encuentran diferencias cuando en realidad las hay. Estos errores son producidos por error aleatorio, error sistemático (sesgo) o confusión.
El error aleatorio o no sistemático ocurre cuando las mediciones repetidas varían de forma no predecible. No se puede evitar, pero sí se puede cuantificar su impacto en los resultados mediante el cálculo del valor p y los intervalos de confianza 2. Se puede reducir con herramientas estadísticas, mediante la estimación correcta del tamaño de muestra. Así, el error aleatorio disminuye al aumentar el tamaño de la muestra o la población de estudio, no es constante en cada medida, y no siempre se produce en la misma dirección 3.
El error sistemático o sesgo consiste en un efecto que tiende a producir resultados que se apartan sistemáticamente del valor real; se define como un error diferencial 1. El efecto del sesgo será una estimación, por encima o por debajo del valor real, dependiendo de la dirección del error sistemático, lo que afecta directamente la validez interna del estudio. Su efecto es difícil de evaluar, su magnitud no es fácil de cuantificar y no se afecta por el tamaño de muestra.
Los sesgos pueden ser diferenciales o no diferenciales, que son aquellos que afectan por igual a todos los grupos de comparación, tendiendo a diluir la verdadera asociación existente. Como consecuencia, se asignan los sujetos de estudio a una categoría de resultado incorrecta, lo que lleva a una estimación incorrecta de la asociación entre exposición y resultado. En los estudios epidemiológicos se han identificado más de 50 tipos de sesgos. Para simplificar su conocimiento, se han agrupado en dos grandes categorías, de selección y de información.
Sesgos de selección
El sesgo de selección se refiere a cualquier error derivado de la identificación de la población de estudio y aparece cuando hay una diferencia sistemática entre aquellos que participan en el estudio y aquellos que no (lo que afecta la generalización) o entre aquellos en el grupo de tratamiento de un estudio y aquellos en el grupo de control (lo que afecta la comparabilidad entre grupos).
Se han descrito hasta 35 tipos diferentes de sesgo de selección, que tienen como elemento común que la relación entre la exposición y la enfermedad difiere en los sujetos que participan en el estudio respecto de aquellos sujetos que, siendo elegibles, no son incluidos en el estudio.
Sesgo de prevalencia o incidencia (sesgo de Neyman)
Este tipo de sesgo se produce cuando se evalúa una enfermedad que causa muerte prematura y, a consecuencia, los individuos fallecidos no pueden incluirse en el grupo de casos al inicio del estudio. Cuando la permanencia de los participantes en el estudio es determinada por un evento, que es de diferente magnitud para los grupos expuesto y no expuesto, existirá la posibilidad de que los resultados se vean distorsionados. Por esta razón, se recomienda maximizar las tasas de permanencia y seguimiento.
Sesgo de admisión (sesgo, falacia o paradoja de Berkson)
El sesgo ocurre cuando los casos y controles se reclutan entre pacientes hospitalizados, ya que este grupo no es representativo de la población que posee la enfermedad. Este sesgo puede evitarse seleccionando los controles entre personas ingresadas en el hospital en el mismo período de tiempo, pero por otras causas (en diferentes servicios), para asegurar una gran variedad de enfermedades, y excluyendo diagnósticos relacionados positiva o negativamente con el factor de riesgo en estudio; las enfermedades incluidas como controles deben presentar una probabilidad de ingreso hospitalario similar a la de los casos. Una alternativa para solucionar el problema que plantea este tipo de sesgo es la utilización de dos grupos de control.
Sesgo de muestreo (sampling bias)
El sesgo de muestreo describe el escenario en el que algunos individuos dentro de una población objetivo tienen más probabilidades de ser seleccionados para su inclusión que otros. Se produce cuando los grupos de individuos están sobrerrepresentados o subrepresentados durante el proceso de recolección de datos.
Sesgo de asignación (allocation bias)
El sesgo de asignación se introduce en un estudio cuando los investigadores no asignan adecuadamente de forma aleatoria a los participantes en los diferentes grupos (expuestos y no expuestos o casos y controles, por ejemplo), lo que ocasiona una diferencia sistemática entre los participantes en los grupos de estudio (además de la intervención en estudio).
Pérdida de seguimiento o sesgo de deserción (attrition bias)
La pérdida de participantes durante el seguimiento es un problema particular asociado con los estudios de cohorte. El sesgo de deserción se refiere a las diferencias sistemáticas que existen entre los participantes que permanecen en un programa y los que lo abandonan. Puede introducirse un sesgo si los individuos perdidos durante el seguimiento difieren de las personas que permanecen en el estudio con respecto a la exposición y el resultado. La pérdida diferencial de participantes de los grupos de un ensayo controlado aleatorizado es lo que se conoce como sesgo de deserción.
Sesgo de no respuesta (non-response bias)
La no respuesta en una encuesta se define como la imposibilidad de conseguir la participación de todas las unidades muestrales seleccionadas. El sesgo de no respuesta lleva a una distorsión de los resultados debido a las diferencias entre los encuestados que responden preguntas específicas y los que omiten contestar las preguntas 4.
Las estimaciones poblacionales obtenidas a partir de la muestra de sujetos que responden al cuestionario pueden diferir de las estimaciones que se habrían obtenido si la muestra total hubiera contestado al cuestionario. Esta diferencia se produce cuando los sujetos que no responden difieren sistemáticamente de los que sí responden, en referencia a aquellas características que son de interés en el estudio. Se considera que si hay un porcentaje de no respuesta del 20 % el estudio está sesgado 2.
Su impacto puede atenuarse mediante estrategias correctivas, como la sustitución de la muestra, en la que los no respondedores son reemplazados por individuos seleccionados aleatoriamente de la muestra del estudio o por individuos con características similares a las de los no respondedores (reemplazos emparejados). Otra opción es el análisis por intención de tratar, una de las piedras angulares en la estrategia analítica de los ensayos clínicos, que permite preservar los beneficios de la asignación aleatoria 3.
Sesgos de información
El sesgo de información se introduce por el método utilizado para recoger la información. Se produce por las diferencias sistemáticas que hay en la obtención de los datos en los grupos evaluados; si la recopilación de la información es diferente entre grupos, ocasiona que la conclusión de la asociación sea equivocada.
Existen tres fuentes de sesgo de información, unas propias del sujeto de estudio, observado o que responde, otras del investigador, entrevistador o encuestador, y finalmente, unas que dependen del instrumento o sistema de recolección de la información 5.
Sesgo de memoria o de recuerdo (recall or response bias)
En estudios retrospectivos, la calidad de algunos datos depende de la capacidad de los sujetos para recordar con precisión eventos previos. Cuando la información proporcionada por los pacientes con respecto a la exposición difiere entre los casos y los controles se puede producir un sesgo de memoria. Por lo general, el recuerdo es de mejor claridad o precisión, o hay un mayor esfuerzo por recordar, entre quienes desarrollan la enfermedad, lo que lleva a una sobrerrepresentación de sujetos expuestos entre los enfermos.
Para controlarlo, lo ideal sería hacer un estudio de cohorte prospectiva, pero esto no siempre es posible por razones de costo y tiempo, por eso, queda la opción de medir o recoger correctamente la información proporcionada por ambos grupos, utilizando una herramienta objetiva y validada para asegurar que los sujetos recuerden con mayor precisión. También se puede tratar de buscar la misma información sobre la exposición de dos fuentes diferentes, por ejemplo, el sujeto índice y su cónyuge, sin olvidar las implicaciones que tienen los informantes sustitutos (proxy).
Sesgo del participante (participant bias)
Al contrario de la situación anterior, este sesgo sucede cuando los sujetos “deciden” o se clasifican en un determinado estado derivado de conocer su exposición. Sucede cuando se recolecta información poco objetiva como, por ejemplo, la percepción de dolor. Para prevenirlo, es necesario buscar, siempre que sea posible, comprobar la información reportada por los sujetos de investigación.
En términos generales, se recomienda emplear medidas objetivas, como escalas de medición que ya hayan sido validadas en otros estudios, para mejorar la precisión de nuestra evaluación y poder comparar posteriormente los resultados obtenidos con otros estudios similares. Desde el diseño del estudio y las estrategias de recolección de la información se deben definir las escalas de medición y los umbrales que estén respaldados en la literatura, antes de empezar la captura de los datos, para evitar sesgar los resultados.
Sesgo de deseabilidad social (social desirability bias)
Se refiere a la tendencia de los participantes de un estudio a responder las preguntas de una manera que los hace parecer a ellos o a sus acciones más apropiados o deseables para el evaluador.
Sesgo de atención (efecto Hawthorne)
Este sesgo es causado por la modificación en el comportamiento de los sujetos de estudio al saberse observados 6. Por ejemplo, si un evaluador participa en una sesión particular para analizar cómo se está llevando a cabo una intervención, los facilitadores y los participantes pueden alterar su comportamiento para “impresionar” al evaluador, sin siquiera darse cuenta de que lo están haciendo 4.
Sesgo del observador (observer bias)
El conocimiento previo del observador sobre la hipótesis, la exposición o el estado de la enfermedad puede llevar a un sesgo del observador. Esa información puede afectar la forma como el investigador recopila, mide o interpreta los datos en cada grupo de estudio. Es decir, existe de manera voluntaria o no, una recolección de la información más cercana a la comprobación de la hipótesis de investigación. Los investigadores (que conocen la hipótesis del estudio) deciden clasificar a los participantes en algún grupo de exposición derivado de su conocimiento previo y no de la información que el protocolo de investigación señala.
Sesgo del entrevistador (interviewer bias)
El sesgo del entrevistador ocurre cuando un entrevistador, de forma consciente o inconsciente, hace preguntas dirigidas o capciosas, para obtener información que, de no conocer el estado de enfermedad, no se realizarían. El entrevistador fuerza las respuestas de los participantes, omitiendo preguntas preestablecidas, añadiendo nuevas o saltándose el protocolo estipulado para las entrevistas, lo que finalmente puede influir sistemáticamente en las respuestas dadas por los entrevistados 5.
Hay varias estrategias que se pueden implementar para prevenir estos dos tipos de sesgos. Entre ellas es básico realizar un buen entrenamiento de los entrevistadores para que obtengan los datos de manera estandarizada y evitar que conozcan (o cegar) la hipótesis del estudio, el diagnóstico (o desenlace) de los sujetos de estudio y el estado con respecto a la exposición de los participantes 1. Se deben desarrollar protocolos de recopilación de datos bien estandarizados.
Otra es la evaluación inicial de la concordancia o acuerdo entre las mediciones de los evaluadores, para lo que también se requiere un apropiado entrenamiento previo en el uso correcto de los instrumentos y las determinaciones.
Sesgo de vigilancia
Cuando se vigila de manera más estrecha una población objetivo se incrementa la probabilidad de identificar la enfermedad en fases subclínicas 5. Como consecuencia, la presencia de la enfermedad es reconocida anticipadamente en los expuestos en mayor medida que en los no expuestos; por ello, el número de enfermos en etapas iniciales pueden ser mayor entre los expuestos.
Para prevenir este sesgo se recomienda el cegamiento, incluyendo más de un evaluador para dictaminar la presencia de la enfermedad, que preferentemente desconozcan la exposición de los participantes. Otra opción es la estratificación por gravedad de la enfermedad al momento del diagnóstico.
Sesgo de procedimientos (sesgo de Feinstein)
Se produce cuando el grupo que presenta la variable dependiente resulta ser “más interesante” para el investigador que el grupo control, por lo que durante la medición hay mayor preocupación o interés por conseguir la información del primer grupo, que termina siendo beneficiado con una mayor acuciosidad en la observación 6.
Sesgo de detección
El sesgo de detección se produce cuando la forma como se recolectan o se verifican los resultados es diferente entre los grupos. Ocurre cuando se emplean herramientas diagnósticas distintas a las definidas en el protocolo del estudio, lo que puede llevar a reclasificación, cambios de estadificación o pronóstico.
Sesgo de adaptación (compliance bias)
Se produce cuando los sujetos de estudio asignados inicialmente a un grupo en estudio experimental deciden migrar a otro grupo porque prefieren la otra intervención u opción de tratamiento. Esto se evita mediante el proceso de asignación aleatoria y el doble enmascaramiento en los ensayos clínicos controlados.
Sesgo de medición (measurement error)
Los errores en la medición de la exposición o del resultado (enfermedad) son una fuente importante de sesgo en los estudios epidemiológicos. Por lo tanto, al realizar estudios es necesario evaluar la calidad de las mediciones, determinando validez y precisión.
Cuando se dispone de un “estándar de oro”, se debe comparar contra la herramienta con la cual se van a hacer las mediciones para determinar su confiabilidad. Sin embargo, en la práctica clínica es muy frecuente que no exista un estándar de referencia seguro de acuerdo con lo establecido según la medicina basada en las evidencias 7 y las mediciones tengan que validarse de manera indirecta e incompleta, comparándolas con la mejor evaluación clínica convencional disponible en el medio.
Una estrategia es la repetición de mediciones. La repetibilidad se puede comprobar con un mismo observador que haga varias mediciones en momentos diferentes o con distintos observadores que hacen la medición sobre un mismo sujeto o muestra. Para interpretar los resultados es útil dividir la variabilidad de la siguiente manera:
• Variación intraobservador
• Variación interobservador
• Variación aleatoria de los sujetos
• Variación sesgada (sistemática) de los sujetos
Clasificación errónea (misclassification, wrong classification bias)
La clasificación errónea se refiere a la asignación de un individuo, un atributo o un valor en una categoría diferente a la que realmente le corresponde ser asignado.
El error de clasificación diferencial (no aleatorio) se produce cuando la proporción de sujetos que se clasifican erróneamente difiere entre los grupos del estudio. Es decir, la probabilidad de que se clasifique erróneamente la exposición depende del estado de la enfermedad, o la probabilidad de que se clasifique erróneamente el estado de la enfermedad depende del estado de exposición. Esto lleva a una subestimación o sobreestimación de la verdadera asociación, ocasionando un problema más grave.
Por el contrario, el error de clasificación no diferencial (aleatoria) aumenta las similitudes entre los grupos en estudio, con lo que se subestima (disminuye o diluye) la real fuerza de asociación entre la exposición y la enfermedad.
El uso de informantes sustitutos (proxy), ya sea por alguna incapacidad de los sujetos de estudio o porque ya fallecieron, puede también dar lugar a un sesgo de clasificación diferencial de la exposición 1. Dependiendo de la relación entre el informante sustituto y el individuo incluido en el estudio, sus respuestas sobre la exposición de interés pueden oscilar entre la exageración y la negación.
Sesgo de publicación
El sesgo de publicación es causado por la negativa de las revistas quirúrgicas para publicar resultados negativos 8. En los proyectos de investigación es frecuente que se excluyan los estudios con resultados negativos y se ignoren los datos no publicados, especialmente los estudios publicados en revistas no indexadas.
La confusión se produce cuando una asociación está distorsionada porque existe “otro factor de riesgo” (o una tercera variable) que se correlaciona con la exposición y al mismo tiempo con el resultado, pero independientemente de la exposición investigada. Esa variable también está asociada independientemente con el resultado (es decir, es un factor de riesgo), pero no se encuentra en la vía causal entre la exposición y la enfermedad.
Entonces, existe una distribución desigual o desequilibrada en los grupos de comparación de una tercera variable, que se denomina variable de confusión, y lleva a una distorsión de las estimaciones del estudio. Como la distribución es desigual, se altera la verdadera relación entre la exposición y el efecto o resultado evaluado.
Control de la confusión
Para identificar una variable confusora o confundente, se puede comparar el valor crudo del efecto (mediante la estimación del riesgo relativo o del odds ratio de la variable en estudio) con el valor ajustado (que se obtiene mediante estratificación aplicando modelos de regresión logística). Si se obtiene una diferencia de 10-15 %, se considera que existe confusión 6.
En un número importante de estudios, la edad y el sexo son variables de confusión. Otras variables potencialmente confusoras son el nivel socioeconómico, la raza y el lugar de residencia.
Existen dos formas de controlar la confusión: desde el diseño, mediante aleatorización para la selección de la muestra o pareamiento, hasta el análisis estratificado (por la probable variable que causa confusión) o multivariable.
Efectos de la confusión
Cuando no se interviene la presencia de una variable de confusión se pueden afectar los resultados de cuatro formas 4:
• Asociación espuria, que es una asociación aparente a pesar de que no existe una asociación real.
• Asociación oculta, donde aparentemente no hay asociación a pesar de que existe una asociación real.
• Factor de confusión positivo, que realza (o sobrestima) una asociación verdadera.
• Factor de confusión negativo, que enmascara (o subestima) una asociación verdadera.
Consideraciones finales
El investigador puede tratar de prevenir los errores y los sesgos en la fase de diseño del estudio mediante la asignación aleatoria en los ensayos clínicos, la restricción de acuerdo con la posible variable confusora, o el emparejamiento (matching), utilizado sobre todo en los estudios de casos y controles.
Una vez se ha recopilado la información, se puede intentar controlar los sesgos en la fase de análisis, empleando la estratificación, para analizar subgrupos separados por covariables o estratos, la estandarización, para comparar de acuerdo con las variables confusoras identificadas, o el análisis estadístico multivariado, para evaluar de manera simultánea diversas variables y determinar la existencia de posibles variables de confusión, estimando el efecto de la exposición.
La validez de un estudio depende de la ausencia de errores, sin embargo, no es posible eliminar por completo los sesgos de los estudios epidemiológicos. El sesgo de selección se introduce cuando los sujetos estudiados no son representativos de la población objetivo sobre la que se quieren extraer conclusiones, mientras el sesgo de información surge de errores en la medición de la exposición o la enfermedad.
En investigación en cirugía general, incluso en los diseños más sencillos como los reporte de caso, puede haber errores y sesgos. Por eso, uno de los objetivos de un investigador debe ser reducir al mínimo los errores, identificar los sesgos que no se pueden evitar, determinar su impacto, tenerlos en mente en la interpretación de los resultados y manifestarlo en la publicación de su artículo.
aCorrespondencia: Mónica Bejarano, Carrera 59 # 11B-56, Cali, Colombia. Teléfono: +57 3155574039. Dirección electrónica: monicirugia@gmail.com