Generalidades de los estudios de casos y controles

A. González-Garay; L. Díaz-García; Murata Chiharu; A. Anzo-Osorio; S. García de la Puente

Artículo de revisión

Overview of Case-Control Studies.

A. González-Garay

Instituto Nacional de Pediatría

L. Díaz-García

Instituto Nacional de Pediatría

Murata Chiharu

Instituto Nacional de Pediatría

A. Anzo-Osorio

Instituto Nacional de Pediatría

S. García de la Puente garciadelapuente@hotmail.com

Instituto Nacional de Pediatría

Generalidades de los estudios de casos y controles

Acta pediátrica de México, vol. 39, núm. 1, pp. 72-80, 2018

Instituto Nacional de Pediatría

Recepción: 02 Junio 2017

Aprobación: 02 Octubre 2017

DOI: https://doi.org/10.18233/APM1No1pp72-801542

Resumen:

ANTECEDENTES: los estudios de casos y controles son de utilidad cuando se buscan factores de riesgo para enfermedades poco comunes o que tienen un periodo de latencia prologado.

OBJETIVO: identificar las principales características del estudio de casos y controles (Ca-Co) para favorecer la disminución de sesgos durante su evaluación o conducción.

DESCRIPCIÓN: este diseño se caracteriza por la selección de sujetos con o sin el evento de interés. Éstos se comparan para identificar los factores de riesgo que favorecieron la presencia de este evento. La finalidad de este tipo de estudios es la de inferir una relación causal expresada mediante razón de momios y los intervalos de confianza al 95%.

CONCLUSIONES: el diseño de Ca-CO es relativamente fácil y rápido de realizar. Sin embargo, es susceptible a múltiples fuentes de sesgo, las cuales deben de ser minimizadas para obtener mayor confiabilidad de las inferencias obtenidas.

PALABRAS CLAVE: estudio de casos y controles+ razón de momios+ causalidad.

Abstract:

BACKGROUND: Case-control studies are useful for risk factors research, speacially for rare diseases or diseases with a prolonged latency period.

OBJECTIVE: To identify the main characteristics of the case-control study, in order to reduce bias during the study evaluation and/or conduction.

DESCRIPTION: This design is characterized by the selection of subjects with and without the event of interest and they are compared to identify risk factors in order to infer causal relationship, which is expressed, by odds ratio and 95% confidence intervals.

CONCLUSIONS: Case-controls studies are a relatively easy and quick design to perform. However, it is susceptible to multiple sources of bias, which must be minimized to obtain greater reliability in the obtained inferences.

KEYWORDS: cases-controls studies, odds ratio, causality.

INTRODUCCIÓN

Debido a su baja prevalencia (<5%) o por su latencia prolongada, muchos fenómenos en la naturaleza dificultan la identificación de sus factores de riesgo y su relación causal. Por tal motivo, se requiere de la aplicación de un diseño de estudio que les permita a los investigadores obtener resultados en un tiempo más corto.

Se ha observado que el diseño de casos y controles o también llamado “casos y testigos” o “casos y referentes”, solventa estas dificultades debido a que al ser un estudio epidemiológico, analítico y observacional, facilita la identificación de las causas que desarrollan un evento de interés, poniendo a prueba diferentes hipótesis propuestas por el investigador.¹

Este diseño de estudio inicia con la selección de individuos que presentan la característica o el evento deseado a estudiar; los cuales son denominados como “casos” y son comparados con un grupo de participantes que no poseen dicha característica (controles), con la finalidad de identificar y analizar los factores de riesgo asociados al desarrollo del evento y calcular las probabilidades para que un sujeto presente el desenlace, generando de esta manera información de gran utilidad para la elaboración de estudios posteriores con diseños prospectivos.²^,³

Una de las principales características de este diseño es que permite analizar varios factores al mismo tiempo, ya sean intrínsecos (edad, sexo, predisposición genética, etc.) o extrínsecos a los participantes (medio ambiente, fármacos, hábitos, entre otros), reduciendo el tiempo y costo de la realización del estudio.²

Para llevarse a cabo este diseño es necesario que el investigador identifique y seleccione a los participantes que constituirán el grupo de casos y a los controles, para que, posteriormente, busque en el pasado las características a los que estuvieron expuestos ambos grupos (factores de riesgo); por esta razón, los estudios de casos y controles son considerados como “retrospectivos”.⁴^,⁵

Un ejemplo de este diseño fue el realizado en Alemania en 1962⁶ en el que se identificó que la ingesta de talidomida durante el embarazo era causante de una malformación congénita irreversible llamada focomelia, cuya incidencia se incrementó en la década de los 60s. Para la realización de este estudio, los autores incluyeron a 112 casos de focomelia y los contrastaron con 188 niños sin esta malformación; observaron que del grupo de casos 90 mujeres habían consumido este medicamento, mientras que en el grupo control sólo dos mujeres consumieron dicho fármaco; lo cual permitió analizar su fuerza de asociación con la malformación congénita y generar cambios en las políticas sanitarias, prohibiendo su venta y distribución en las mujeres gestantes por el elevado riesgo para desarrollar malformaciones en sus productos.

Una estrategia empleada por algunos investigadores para facilitar la realización de estos estudios es utilizar la misma fuente de datos de un estudio de cohorte, a lo cual se le denominan estudios “híbridos” o “anidados a una cohorte”.⁷ Un ejemplo es el estudio publicado por Casagrande⁸ en el que en una cohorte de 2907 pacientes pediátricos con primera neoplasia antes de los 15 años, se anidó un estudio de casos y controles, definiendo como casos a 64 pacientes con segunda neoplasia maligna y como controles a 190 pacientes que no la desarrollaron.

En años recientes se han desarrollado algunas otras variantes al diseño de casos y controles, por lo cual, presentamos la siguiente información detallada para facilitar a los investigadores el entendimiento, análisis y correcta ejecución de estos estudios.

MÉTODOS

Selección de casos

Para realizar la selección de los casos es necesario asegurar que todos estos individuos verdaderamente presenten el desenlace de interés.⁹ Inicialmente se definen conceptual y operacionalmente los criterios diagnósticos para etiquetarlos correctamente; sin embargo, en ocasiones estos pueden ser subjetivos o poco claros, lo que facilita la existencia de falsos casos, generando sesgo de selección. Ante dicha problemática, una de las alternativas que utilizan los investigadores es separar a los participantes en dos estratos: aquellos constituidos por los casos comprobados o ciertos y aquellos como casos probables, sin importar el tiempo que tengan con el evento de interés.¹⁰^,¹¹

Selección de controles

Para garantizar una correcta comparación entre los participantes del estudio es necesario realizar una selección adecuada de los controles, mediante un ajuste de las características de los sujetos y su tipo de muestreo.

La forma más apropiada de la selección de los controles es considerarlos como una subpoblación de individuos que está en riesgo de desarrollar el evento, y de los cuales se puede asegurar con cierta certeza que, en caso de que desarrollaran el evento, serían incluidos en el estudio como participantes en el grupo de los casos.¹²

Para obtener una muestra representativa de la población su selección debe cumplir algunas consideraciones:

Los controles deben ser seleccionados de la misma fuente poblacional que los casos.
Todos los posibles controles deben de tener la misma probabilidad de ser elegidos en el estudio; lo cual puede llevarse a cabo mediante diferentes métodos probabilísticos (aleatorio simple, estratificado o por conglomerados).

Los controles deben compartir características con los individuos que conforman los casos con la finalidad de reducir factores confusores que pudieran modificar las comparaciones entre los grupos; para lo cual se utiliza una estrategia llamada pareamiento, que consiste en identificar sujetos que comparten ciertas características específicas: edad, sexo, etc.; con sus respectivos casos.¹³

La forma de medición y registro de información de los controles debe ser igual a la utilizada en los casos, con lo cual se reduce el sesgo de observación y se garantiza la validez interna del estudio.¹⁴

Además de lo anterior, el investigador debe seleccionar una fuente adecuada de la que se obtenga a los sujetos que conformarán el grupo control, para lo cual, existen las siguientes alternativas:

Base poblacional: los controles se obtienen de la misma población y tiempo de los cuales se eligieron los casos; estos son fáciles de identificar cuando se cuenta con registros poblacionales (ejem. registros del censo epidemiológico del país).
Controles vecindarios: los participantes viven en la misma zona residencial que los casos incluidos en el estudio; esta forma de selección no garantiza la correcta comparabilidad entre los grupos.
Controles hospitalarios: los controles son aquellos sujetos que acuden al mismo centro sanitario al que asisten los casos, solo que solicitan atención para eventos diferentes; no obstante, pueden presentar múltiples factores confusores que pueden alterar la comparación.
Controles a partir de números telefónicos: se seleccionan los controles de forma aleatoria a partir de un listado de números telefónicos de un área determinada. Una limitante es su tasa de respuesta durante el estudio.
Controles a partir de amigos o familiares: son sujetos relacionados con los casos, incrementando la probabilidad de que pertenezcan a la misma base poblacional, sin embargo, pueden no compartir las características de los participantes del estudio. Una forma útil que limita este sesgo es la realización de estudios en gemelos, debido a que comparten las mismas características genéticas, facilitando la comparación entre los casos y sus controles.
Controles de registro de mortalidad: los casos son seleccionados de un registro poblacional de muertes de una región; sin embargo, esto no garantiza la comparabilidad entre los grupos.¹⁵

Una forma habitual de conducir estos estudios es la utilización de un sujeto control por cada caso, lo cual reduce los gastos e incrementa la factibilidad para realizar el estudio; no obstante, pueden utilizarse múltiples controles de una misma base poblacional para un mismo caso, con lo cual se incrementa el poder de las comparaciones hasta una relación de 4:1, ya que la inclusión de más controles únicamente incrementa los gastos del estudio sin mejorar significativamente su poder estadístico.¹⁶

Métodos estadísticos empleados para los diseños de casos y controles

Razón de momios

La cuantificación clave del análisis estadístico en un estudio de casos y controles es la razón de momios. La cual se calcula a través de la construcción de la tabla de contingencia de 2 × 2, que se caracteriza por colocar el número de individuos con y sin el evento de interés de acuerdo al factor de riesgo que se desea investigar. La parte más importante de la construcción de esta tabla radica en que la variable dependiente va en las columnas y la independiente en las filas.

Ejemplo: La celda “a” se conforma por aquellos casos que tuvieron el factor de exposición, mientras que la celda “b” se constituye por los controles que también presentaron la exposición; a diferencia de la celda “c”, en la cual se contabilizan los casos que no están expuestos a el factor estudiado, y la celda “d” representada por los controles que no presentan el factor de interés (Cuadro 1).¹⁷

Cuadro 1

Tabla de contingencia de 2x2

La razón de momios (RM) es una medida de asociación expresada en términos de posibilidad de ocurrencia de un evento en los individuos que cuentan con el factor de riesgo y es comparado con aquellos participantes que no lo presentan; en otras palabras, es un cociente de dos probabilidades para la ocurrencia de un evento. Para calcularlo, se requiere obtener la razón de dos momios: a) el constituido por el resultado de la división de las celdas de casos expuestos con los controles expuestos, y b) el momio que se conforma por la división de los casos no expuestos con los controles no expuestos (a/b)/(c/d); esta expresión algebraica también se obtiene mediante la “razón de productos cruzados” (a * d)/(b * c) (Figura 1).¹⁶

Figura 1
Razón de los productos cruzados para el cálculo de la RM.

El primer momio cuantifica “cuántas veces es mayor la probabilidad de presentar el evento de interés dado que se está expuesto”, mientras que el segundo analiza “cuántas veces es mayor la probabilidad de presentar el evento de interés, dado que el sujeto NO está expuesto al factor”. Si la división de estos dos momios es igual a “1”, la probabilidad de presentar el evento de desenlace es el mismo entre los casos y los controles; es decir, no hay asociación entre el factor y el evento estudiado; mientras que si el resultado es mayor de “1”, indica que existe riesgo de presentar el evento de interés por presentar el factor; mientras que un valor menor de “1” significa que los individuos que presentan el factor, están protegidos para desarrollar el desenlace.

Cuando la prevalencia de una enfermedad es baja (menor a 5%), la RM se aproxima al riesgo relativo, la cual es una medida de asociación frecuentemente usada en ensayos clínicos o estudios de cohorte, y que será explicada en próximos artículos de esta serie de documentos.

Tanto en las ciencias biológicas como en las ciencias sociales es frecuente no encontrar una asociación clara entre la variable de desenlace y el factor de riesgo, debido a la presencia de otras variables que pueden confundir o modificar la relación. Las variables confusoras son aquellas que están relacionadas tanto con el factor de exposición como con el desenlace; mientras que una variable modificadora de efecto, es aquella que solo está relacionada con el desenlace, y su presencia puede incrementar o disminuir la relación investigada.

Debido a lo anterior, el investigador requiere tomar en consideración estas variables para llevar a cabo el análisis estadístico; por lo que es habitual que realice las comparaciones divididas en estratos por cada variable confusora, siempre y cuando sean pocos los estratos, en los cuales se calcule la RM y posteriormente analice la RM global; dicho análisis estadístico recibe el nombre de RM ajustada de Mantel-Haenszel¹⁷ (Figura 2).

Figura 2
RM ajustado de Mantel-Haenszel.

En caso contrario, si se requiere tomar en cuenta múltiples factores confusores, el método adecuado para analizar la asociación, es la realización de regresión logística múltiple.¹⁸

Intervalo de confianza al 95% de una razón de momios

Para toda medida de cálculo es necesario expresar su dispersión, en el caso de la RM es mediante el intervalo de confianza (IC). El IC es un rango acotado por dos valores, los límites inferior y superior, en el cual se espera encontrar la RM real, si el estudio se realizará en la población, con un 95% de certeza; por lo tanto, si éste es construido y no incluye el valor de “1”, se puede interpretar que el factor de interés es de riesgo (si es mayor de 1) o protector (si es menor de 1). Para calcularlo es necesario construir la fórmula de la Figura 3.¹⁷ Los parámetros contenidos en el paréntesis constituyen el estimador aproximado del error estándar. La fórmula presentada es la que permite calcular un IC con un 95% de confianza para un estudio de casos y controles sin pareamiento, sin estratificación y sin ajuste por covariables.²^,³ Para más detalles consultar Schlesselman 1982 y Szklo 2007.

Figura 3
Intervalo de confianza al 95%.

Cálculo del tamaño de muestra en estudio de casos y controles

Una fuente de sesgo en los estudios de casos y controles es aquella en la que el número de participantes no fue suficiente para demostrar estadísticamente los hallazgos. Por este motivo es indispensable que el investigador calcule el tamaño muestral para asegurar la validez de sus resultados. Para los estudios sin pareamiento y sin ajuste se requieren los siguientes cuatro datos:²^,³

1. Valor α (probabilidad del error tipo I);
2. Valor β (probabilidad del error tipo II);
3. Proporción de individuos expuestos al factor de riesgo dentro del grupo control.
4. Riesgo relativo hipotetizado del evento de interés en el grupo de casos (R).

Los dos primeros elementos tienen convencionalmente los valores de: α<0.05 y β<0.2 (o también β<0.1), respectivamente, y los valores de Z correspondientes son 1.96 y 0.84 (o 1.28). Para constituir el tercer elemento, se requiere de estimadores de efecto previamente publicados, ya sea a partir de registros o por un estudio piloto. El cuarto elemento requiere del conocimiento del riesgo esperado del factor de exposición³ (Figura 4). Este cálculo, se ilustra con el siguiente ejemplo: con la finalidad de analizar la asociación entre el consumo de un anticonceptivo oral y el desarrollo de cardiopatía congénita se planeó un estudio en que los autores estimaron tener un error α de 0.05, un error β de 0.2, que el 30% de mujeres del grupo control tomaban anticonceptivo oral en el primer trimestre del embarazo y que el riesgo del neonato para tener cardiopatía era de 3. Anotando estos valores en la fórmula de la Figura 5 se obtiene un tamaño muestral de 55 participantes en cada grupo.¹⁹

Figura 4
Tamaño de la muestra.

Figura 5
Ejemplo para el cálculo del tamaño de la muestra.

Aprovechando el ejemplo, el cálculo del intervalo de confianza al 95%, resulta ser de la siguiente manera: las frecuencias de a, b, c y d que satisfacen aproximadamente la condición dada son 43, 17, 12 y 38. Al aplicar la fórmula presentada anteriormente en la Figura 3 tenemos el cálculo representado en la Figura 6 . Por ende, RM [IC 95%] = 8.01 [5.16, 12.43].

Figura 6
Ejemplo del cálculo del intervalo de confianza al 95%.

En general, podemos observar que los estudios de casos y controles son relativamente fáciles de realizar. Presentan ventajas y desventajas que deben ser consideradas por los investigadores para ser llevados a cabo; entre estas encontramos las siguientes:

1. Es un diseño útil para estudiar problemas de salud poco frecuentes (prevalencia < 5%) o que tienen un periodo largo de latencia.
2. Son rápidos de realizar y poco costosos en comparación con otros diseños de estudio.
3. Tiene pocas restricciones éticas, pero existen peculiaridades que se deben cumplir; es necesario mantener la confidencialidad y el resguardo de los datos, cumplir con la reglamentación del cuidado del expediente clínico cuando se tiene una base hospitalaria y si se trata de un estudio prospectivo en que se van a entrevistar a los participantes del estudio, obtener las Cartas de Consentimiento y Asentimiento bajo información, dependiendo de la edad del participante o Consentimiento Verbal bajo amparo del aviso de privacidad de la ley de protección de datos personales.²⁰^,²¹
4. Permite analizar varios factores de riesgo, pero no para analizar varios eventos de forma simultánea.
5. Sin embargo, en ocasiones es difícil establecer la secuencia temporal de la exposición y el evento.
6. Debido a que la gran mayoría de los datos son obtenidos en forma retrospectiva se puede incurrir en diferentes tipos de sesgo (Cuadro 2).¹⁰

Cuadro 2

Fuentes de sesgo de los estudios de casos y controles

CONCLUSIONES

1. El diseño de Ca-CO permite a los investigadores explorar ciertos factores de riesgo cuando sospechan que están asociados con alguna enfermedad; generando evidencia que posteriormente puede ser analizada en otros diseños más robustos que permitan analizar dicha asociación.
2. Es susceptible a diferentes fuentes de sesgo, las cuales aunque sean minimizadas, debilitan la evidencia que podemos obtener de dichos estudios.

REFERENCIAS

1. Schlesselman J, Stolley P. Observational Studies. Design, Conduct, Analysis in Monographs in Epidemiology and Biostatistics. Oxford University Press 1982; pp. 10-20.

2. Schlesselman J, Stolley P. Cohort and Case Control Sampling Schemes. Design, Conduct, Analysis in Monographs in Epidemiology and Biostatistics. Oxford University Press 1982; pp. 34-45.

3. Schlesselman J, Stolley P. Association and Testing for Significance. Design, Conduct, Analysis in Monographs in Epidemiology and Biostatistics. Oxford University Press 1982; pp. 53-56.

4. Bottaro F. Diseño de los estudios de investigación. Debilidades y fortalezas. Hematología. 2014;18(1):74-83.

5. Song J, Chung K. Observational Studies: Cohort and Case-Control Studies. Plast Reconstr Surg. 2010;126(6):2234-42.

6. Lenz W and Knapp K. Thalidomide Embryopathy. Arc Environ Hlth. 1962;5(2):14-19.

7. Delgado-Rodríguez M, Sillero M. Revisión: Diseños Híbridos de Estudios de Cohortes y de Estudios de Casos y Controles. Gaceta Sanitaria. 1995;9(46):42-52.

8. Casagranda L. et al. Second malignant neoplasm following childhood cancer: A nested case-control study of a recent cohort (1987-2004) from the Childhood Cancer Registry of the Rhône-Alpes region in France. Pediatric Hematology and Oncology. 2016;33(6):371-82.

9. Silva G. Selection of subjects in case-controls studies. São Paulo Medical Journal.1995;113(2):24-27.

10. Lazcano-Ponce E, Salazar-Martínez E, Hernández-Avila M. Estudios epidemiológicos de casos y controles. Fundamento teórico, variantes y aplicaciones. Salud Pub Mex. 2001;43(2):135-50.

11. Beaglehole R, Bonita R, Kjellström T. Tipos de estudios en Epidemiología básica. 1ª Edición. Organización Panamericana de la Salud 2003. pp. 31-38.

12. Lazcano-Ponce E, Salazar-Martínez E, Hernández-Ávila M. Estudios epidemiológicos de casos y controles. Fundamento teórico, variantes y aplicaciones. Salud Pub Mex. 2001;43(2):73-83.

13. Wacholerder S, Silvervan D, McLaughlin J, Mandel J. Selection of Controls in Case-Control Studies. III. Design Options. American Journal of Epidemiology. 1992;135(9):1042-50.

14. Silva, G. Selection of subjects in case-controls studies. Sao Paulo Medical Journal. 1995;113(2):41-42.

15. Rothman K, Greenland S, Timothy L. Modern Epidemiology. 2ª edición. Lippincott-Raven 1998.

16. Rada, G. and Merino, T. Epidemiología analítica. Estudios de casos y controles. (http://escuela.med.puc.cl/recursos/recepidem/epiAnal5.htm,2007).

17. Szklo M, Nieto J. Epidemiology: Beyond the Basics. 2º ed. Sudbury, MA: Jones & Bartlett Learning; 2006: pp. 227-44.

18. Berea-Baltierra R, Rivas-Ruiz R, Pérez-Rodríguez M, Palacios-Cruz L, Moreno J, Talavera JO. Clinical research XX. From clinical judgment to multiple logistic regression model. Rev Med Inst Mex Seguro Soc. 2014 ;52(2):192-7.

19. Westoff CF, Bumpass L. The revolution in birth control practices of U.S. Roman Catholics. Science. 1973;179(4068):41-4.

20. Diario Oficial, Reglamento de la ley general de salud en materia de investigación para la salud. 1987-01-06, N. 3, tomo CCCC, p. 98-113.

21. NORMA Oficial Mexicana NOM-012-SSA3-2012, Que establece los criterios para la ejecución de proyectos de investigación para la salud en seres humanos México: 2013. [citado 20 de Junio 2017]. Disponible en: (http://dof.gob.mx/nota_detalle.php?codigo=5284148&fecha=04/01/2013)

Notas

1 Este artículo debe citarse como González-Garay A, Díaz-García L, Chiharu-Murata, Anzo-Osorio A, García de la Puente S. Generalidades de los estudios de casos y controles. Acta Pediatr Mex. 2018;39(1):72-80.

Notas de autor

Correspondencia Silvestre García de la Puente garciadelapuente@hotmail.com