Modelo de decisión bayesiano para el
diagnóstico de cáncer de mama

Segundo U. Quiroz R.; Belzaira Rivas M.

Artículos

Modelo de decisión bayesiano para el diagnóstico de cáncer de mama

Segundo U. Quiroz R. Venezuela.segquiroz@gmail.com

Universidad de Los Andes, Venezuela

Belzaira Rivas M. estudiosestadísticosbelzaira@gmail.com

Empresa Personal dedicada a la asesoría y estudios estadísticos, Venezuela

Modelo de decisión bayesiano para el diagnóstico de cáncer de mama

Actualidad Contable Faces, vol. 21, núm. 36, pp. 116-135, 2018

Universidad de los Andes

Aprobación: 24 Mayo Marzo 2017

Resumen: La presente investigación su objetivo fue, construir un modelo de decisión bayesiano automático para cuantificar el riesgo de cáncer de mama y evaluar las consecuencias de las alternativas del tratamiento, desde el punto de vista de las pérdidas y utilidades de todos los actores en la problemática de la salud del paciente (sistema sanitario, médicos y la propia paciente). El modelo incorpora los resultados de una mamografía, algunas variables históricas y una función de costos para clasificar una paciente en tres categorías mutuamente excluyentes: No Cáncer, Probablemente Cáncer y Si Cáncer. Para cuantificar el riesgo, se desarrolló un modelo de regresión binaria bayesiano con distribuciones a priori de Jeffreys y para la selección del modelo, se usó el Factor de Bayes Medio. El ajuste del modelo se realizó desde el punto de vista de las predicciones y de la clasificación, en vez del método clásico de estimación. La base de datos consta de 328 pacientes con 184 casos positivos, ésta fue suministrada por el Hospital Universitario de Granada, España. Se encontró que el diagnóstico puede cambiar drásticamente según cambie la función de pérdida y además que el modelo de predicción debe ser distinto dependiendo de la edad de la paciente, menor o mayor a 50 años.

Palabras clave: Modelo de decisión bayesiano, regresión binaria, distribución a priori de Jeffreys, cáncer de mama.

Abstract: An automatic Bayesian decision model was constructed to quantify breastcancer risk and evaluate the consequences of the treatment alternatives, fromthe point of view of the losses and utilities of all the actors in the patient'shealth problem (health system , doctors and the patient herself). The modelincorporates the results of a mammogram, some historical variables and a costfunction to classify a patient into three mutually exclusive categories: No Cancer,Probability of Cancer and Yes Cancer. To quantify the risk, a Bayesian binaryregression model was developed with Jeffreys a priori distributions and theBayes Mean Factor was used to select the model. The adjustment of the modelwas made from the point of view of predictions and classification, instead of theclassical method of estimation. The database consists of 328 patients with 184positive cases, this was provided by the University Hospital of Granada, Spain.It was found that the diagnosis can change drastically as the function of losschanges and also that the prediction model must be different depending on theage of the patient, younger or older than 50 years.

Keywords: Bayesian decision model, binary regression, a priori distribution ofJeffreys, breast cancer.

1. Introducción

El cáncer es una de las principales causas de morbilidad y mortalidad en todo el mundo, cada año se diagnostican alrededor de 14 millones de nuevos casos de cáncer y ocurren más de ocho millones de muertes relacionas con el cáncer. Advierte la Organización Mundial de la Salud (OMS), que los casos anuales de cáncer aumentarán a 22 millones en las próximas dos décadas. El cáncer de mama es el más común entre las mujeres y representa 16% de todos los cánceres femeninos. En los países en desarrollo, su incidencia ha aumentado y la mayoría (69%) de las defunciones por esa causa se registran en estos países (OMS, 2015). La bajas tasas de supervivencia observadas en los países poco desarrollados pueden explicarse principalmente por la falta de programas de detección precoz, que conlleva a que un alto porcentaje de mujeres acudan al médico con la enfermedad ya muy avanzada, pero también, por la falta de servicios adecuados de diagnóstico y tratamiento.

Sin duda, el diagnóstico precoz basado en un procedimiento de screening mamográfico, ha sido probado que es un procedimiento efectivo para el control del cáncer de mama, dado que efectivamente lo detecta en pacientes asintomáticos, lo cual, a su vez, puede incrementar la probabilidad de curarlo o aumentar la esperanza y la calidad de vida de los pacientes. Según el National Center Institute (NCI) (2015), este método para detectar el cáncer mama ha demostrado que reduce la mortalidad por esta enfermedad entre mujeres de 39 a 69 años de edad, los exámenes de detección con mamografía se relacionaron con una disminución relativa mayor a 15 % en cuanto a la mortalidad por cáncer de mama (Nelson et al., 2009). Las mujeres con mayor riesgo de cáncer de mama, tienen altas probabilidades para la detección precoz y la prevención y, cuantificar la magnitud del riesgo de cáncer de mama, es un factor crucial en la optimización de beneficios médicos cuando se considera la eficacia de métodos de reducción de riesgo (Jeffrey A. et al., 2008).

Muchos programas de screening basan sus diagnósticos en la mamografía, un con-junto de radiografías de la mama, que sirven para detectar cambios en la mujer cuando aún los síntomas del cáncer de mama no se han producido. Por cada 1.000 mujeres que se examinan cada dos años y siguen un programa preventivo, se estima que se evitan entre siete y nueve muertes por cáncer de mama (Paci et al., 2014). También hay que reconocer que existen cánceres que no son visibles en la mamografía, excepcional- mente porque son invisibles, y con mayor frecuencia, porque se encuentran inmersos en mamas densas, con abundante tejido fibroglandular que dificulta o hace imposible su identificación por este procedimiento radiológico. Otro inconveniente que normalmente se presenta con el examen radiológico, es que puede ocurrir un diagnóstico en exceso. Según Paci et al. (2014), por cada 1.000 mujeres que se examinan cada dos años ocurren cuatro casos de diagnóstico en exceso. A pesar de estos inconvenientes, no sepone en duda la eficacia de la mamografía como procedimientopara detectar un carcinoma de mama clínicamente oculto.

Durante las últimas tres décadas, se han utilizado modelos matemáticos y modelos de asistencia computarizada que cuantifican los riesgos de sufrir cáncer de mama. Los profesionales de la medicina pueden incorporar estos modelos para hacer más eficaz los métodos disponibles para la prevención. Además, sería conveniente que cada paciente pueda conocer una estimación de la magnitud del riego de desarrollar cáncer de mama y que se le brinde la oportunidad de considerar las opciones de minimizar el riesgo.

Las técnicas más usadas en el desarrollo de los modelos matemáticos para cuantificar el riesgo de cáncer de mama son: Análisis discriminante, regresión logística de Girón et al., (1998) y William E. et al. (2006) sistemas expertos, inteligencia artificial, de Wu et al. (1993), redes bayesianas de Burnside and R. (2000) y otros (Jeffrey A. et al., 2008 y Richard J et al., 2007). En la actualidad, ninguno de estos modelos goza de confianza en la comunidad médica que trata el cáncer de mama, aún existe incertidumbre sobre los factores de riesgo y no se han incorporado herramientas para la toma de decisiones, que consideren conjuntamente todos los elementos que en forma natural intervienen en una decisión: Las alternativas, las consecuencias, los actores (médico, paciente, sistema de salud) y los costos-utilidades.

En esta investigación, se construye un modelo de decisión bayesiano automático (objetivo), que utiliza una función de pérdida para incorporar en la decisión final las alternativas, las consecuencias, los actores y los costos-utilidades. La estimación de las probabilidades predictivas (el riesgo), que se usan en el diagnóstico se calculan a través de un modelo de regresión binaria bayesiano automático, con distribuciones a priori de Jeffreys sobre los parámetros del modelo. La base de datos y la información necesaria para construir el modelo, fue suministrada por el departamento de Radiología del Hospital Universitario de Granada, España y está compuesta de 328 pacientes de los cuales 184 son positivos (Quiroz S., 2002).

2. Modelo de regresión binaria

Un modelo bayesiano de respuesta binaria se define como:

(1)

Donde Yi es una variable aleatoria (v.a.) observable, cuya distribución condicional sobre el parámetro es una Bernoulli(pi), es un vector k- dimensional de parámetros desconocidos, es un vector k- dimensional decovariables observables, F(∙) es una función de distribución sobre P y n es el número de observaciones.

Para un conjunto de n v.a.’s observadas la verosimilitud de β viene dada por:

(2)

Donde al conjunto de datos observados se denota por D=(y,X), y=(y1,…,yn)tes una muestra observada sobre la variable dependiente y X=(x1,…,xn)t es una matriz de orden n×k con los correspondientes datos de las covariables.

Bajo ciertas condiciones de regularidad e independencia, se puede definir una distribución a priori de Jeffreys sobre.

(3)

la cual es una distribución de probabilidad propia, véase Quiroz S. (2002), que depende de una matriz Z de valores de las variables explicativas y de la transformación F(∙), pero no depende directamente de los valores observados de las variables aleatorias Yi. La matriz es una submatriz de X, no singular de orden k×k. La función f(∙) es la correspondiente función de densidad de F(∙), la cual define la forma de la transformación.

La distribución a posteriori de β, también es una distribución propia y viene dada por:

(4)

La densidad de una observación futura, yn+1, condicional al vector de observaciones previas y, asumiendo conocido el vector de covariables y que yn+1 es estocásticamente independiente de y, viene dada por:

(5)

Ninguna de las densidades definidas por (4) y (5) pueden obtenerse analíticamente. En su lugar usaremos los métodos MCMC, véase por ejemplo Casella and Robert (1999), para calcular estas probabilidades.

La base de datos, D, que usaremos para calcular el modelo corresponde a información recogida durante el año 1995 por el Departamento de Radiología del Hospital Universitario de Granada, España, y está compuesta de 328 registros: 184 pacientes presentan cáncer de mama y 144 pacientes no presentan cáncer de mama.

La codificación de las variables se hizo de acuerdo a los factores de riesgo considerados por los médicos de este hospital: (i) Nódulos/Masa, (ii) Calcificaciones, (iii) Asimetrías, (iv) Cambios Arquitecturales. Además se consideraron cinco (5) variables históricas: Edad, antecedentes familiares, antecedentes personales, edad de embarazos y la lactancia. El resultado de una biopsia, realizado a cada paciente, es considerado la prueba infalible que valida el diagnóstico. En el modelo estas variables se denotan por:

y: Resultado de la biopsia, x2: Grupo de edad, x3: Antecedentes familiares, x4: Embarazos y lactancia, x5: Antecedentes personales, x6: Nódulos, x7: Micro-Calcificaciones, x8: Cambios arquitecturales, x9: Asimetrías, con lo cual queda definido el vector de variables explicativas como: xi = (x2, x3, x4, x5, x6, x7, x8, x9)t.

3. Selección de modelos

La clase de modelos definida por (1) y (2) permite disponer con facilidad de una gran variedad de modelos alternativos con solo cambiar la forma de la distribución F(·). Para este estudio particular del cáncer de mama hemos considerado seis funciones link: Logística (L), Probit (P), Cauchy (C), log-log complementario (O), t-Student con 2 g.l. (S2) y t-Student con 4 g.l. (S4). Denotemos por a este grupo de modelos formado por las seis subclases de modelos.

En una primera fase, corresponde seleccionar la función link que mejor ajusta a los datos y en la segunda fase, se trabaja el problema de selección de las variables del modelo. En ambos casos, usamos el factor de Bayes para comparar los modelos, asumiendo que todos los modelos son igualmente probables a priori.

La selección de la función link requiere de una distribución a priori sobre los parámetros de cada subclase de modelos. Tal y como sugiere Quiroz S. (2002)[sección 3.7] usaremos una misma matriz Z para definir los modelos a comparar. Concretamente se usará en este caso particular la matriz

de orden k + 1 = 9 y det[Z] = 72.9, la cual fue elegida en forma aleatoria de un conjunto de 5.000 matrices Z formadas a partir de los datos D.

(6)

Las marginales de los datos necesarias para el cálculo de las probabilidades a posteriori de los modelos, fueron estimadas por el método de Laplace, véase por ejemplo Tierney and Kadane (1986).

El cuadro 1, muestra las probabilidades a posteriori para las seis funciones link. Las funciones link: Cauchy y log-log complementario reciben muy poco soporte de los datos y está claro que podemos descartarlas. El resto de las funciones link: Logística, Probit, t-Student con 2 g.l y t-Student con 4 g.l, reciben el mismo soporte y pudiéramos elegir cualquiera de ellas. Sin embargo, el link logístico, ofrece grandes ventajas para el cálculo y la interpretación de sus coeficientes de regresión. Esto justifica la elección del link logístico para construir el modelo de predicción.

Para la selección de las variables a incluir en el modelo de predicción, se usará el Factor de Bayes Medio, una versión del Factor de Bayes intrínseco de Berger and Pericchi (1996), y el algoritmo para seleccionar variables, ambos propuestos por Quiroz S. (2002)[sección 3.9.2.].

Cuadro 1

Probabilidad posteriori de MF

Elaboración propia.

Las matrices Z necesarias para calcular los Factores de Bayes Medio se escogieron en forma aleatoria de un total de 25.370.626.424.000 que resulta de combinar las filas distintas de la matriz X en k formas distintas.

El espacio de modelos de la clase logística está formado por 2k = 256 modelos, los cuales se asume son igualmente probables a priori. Para i=1,…25 y l=1,…,60, la marginal:

fue estimada por el método de Laplace, con lo cual resultó un conjunto de 8 modelos potencialmente aceptables, véase el cuadro 2. Debido a que M2 está anidado en cualquiera de los modelos restantes y Pr(M2 |D) >Pr(Mj |D)), para todo j=3,…,8, es natural reducir la búsqueda del modelo final sobre el conjunto de modelos .

Con las probabilidades a posteriori de los modelos en actualizadas, resulta que Pr(M₁|D)=0.66 y Pr(M₂|D)=0.34. Esta A: evidencia aconseja considerar ambos modelos para hacer las predicciones. Naturalmente, usaremos la mixtura de M₁ y M₂ponderados por Pr(M₁|D) y Pr(M₂|D), respectivamente.

El cuadro 3 muestra las probabilidades a posteriori de que un coeficiente de regresión no sea igual 0, Pr(βj ≠ 0|D), j = 2,..,k, obtenidas al sumar las probabilidades de los modelos seleccionados que incluyen a ese coeficiente.

Cuadro 2

Modelos potencialmente aceptables (Conjunto B )

Elaboración propia

Cuadro 3

Pr (βj≠0|D)

Elaboración propia

Bajo este criterio, está claro que la evidencia de las variables x₃y x₄, antecedentes familiares y embarazos y lactancia, para diagnosticar el cáncer de mama, es nula. Mientras que la evidencia es muy fuerte cuando relacionamos el cáncer de mama con el resto de las variables: x₂,x₅,x₆,x_7,x₈,x₉.

La conclusión es clara. Sin embargo, hay que recordar que estos cálculos se refieren a una muestra particular de pacientes. Por consiguiente, decir que la evidencia mostrada por estos datos sobre x₃ y x₄ para explicar el cáncer de mama es nula, no quiere decir que en otra muestra (por ejemplo, con equipos radiológicos de nueva generación, o en otro lugar, o en otro tiempo), estas variables van a tener el mismo comportamiento. Lo que si podemos afirmar es: Primero, para el caso particular considerado aquí se pueden ignorar esas dos variables y segundo, en futuras investigaciones no debe ignorarse este resultado.

4. Bondad de ajuste del modelo

Todos los cálculos para medir el ajuste del modelo fueron hechos mediante el método de Markov Chain Monte Carlo (MCMC). Concretamente, en el cálculo de las probabilidades predictivas se usaron muestras de , generadas mediante el algoritmo híbrido Gibbs- Metropolis-Hastings. En todos los casos, el tamaño de la muestra es de 300 (U = 300). Véase por ejemplo, Casella and Robert (1999).

Los datos para ajustar el modelo se obtuvieron de la manera tradicional, i.e. se dividió aleatoriamente la base de datos, D, en dos subconjuntos: un subconjunto de entrenamiento, De, formado por 75% de los datos y un subconjunto de datos futuros . El cuadro 4 muestra varias medidas comúnmente usadas para cuantificar el ajuste del un modelo a los datos. Veáse por ejemplo Raftery et al. (1997), Hosmer and Lemeshow (2000) y Quiroz S. (2002)[capítulo 4].

El valor de c* es el punto de corte donde se minimiza la pérdida esperada con . Con estos datos resultó que 0.69 < c* < 0.72 , con lo cual el área bajo la curva , área de la curva de calibración , la media del logaritmo de la probabilidad predictiva a posteriori (LPPM) y el porcentaje de aciertos, muestran la mixtura M es ligeramente superior a ambos M₁ y M₂. Además, siguiendo las indicaciones de Hosmer and Lemeshow (2000, p.163), estos valores indican que éste es un excelente ajuste y el modelo está bien calibrado

Cuadro 4

Ajuste con

Elaboración propia

5. Diagnóstico

La fase final del proceso de diagnóstico consiste en tomar una decisión que clasifique a una paciente en alguna de las tres siguientes categorías mutuamente excluyentes: Cáncer, No Cáncer, y Probablemente Cáncer. Estas tres categorías constituyen el resultado de nuestro test de diagnóstico automático, los cuales denotamos por T+,T- y T×; respectivamente. El verdadero estado de la paciente: Cáncer o No Cáncer, los denotamos por C+ y C-; respectivamente. Las clasificaciones pueden variar, pero el objetivo de éstas es establecer el diagnóstico final de Cáncer o No Cáncer.

Las consecuencias de cada decisión dependen del verdadero estado de la paciente. En total existen seis situaciones distintas que pueden ser evaluadas en términos de pérdidas-utilidades y calidad de vida. Para una paciente cualquiera, se puede obtener una función de pérdida como que se muestra en el cuadro 5.

Cuadro 5

Función de pérdida

Elaboración propia

Sin pérdida de generalidad se supone que , las cuales representan las pérdidas correspondientes al cruce de las categorías del test de diagnóstico y el verdadero estado de la paciente.

En este caso, los actores en la decisión final son tres: La paciente, los médicos tratantes y el sistema integral de salud. Es posible que las preferencias de unos y otros difieran un poco, con lo cual se obtienen distintas funciones de utilidad. Se puede contrastar las decisiones que se producen ante distintas preferencias o combinarlas y obtener una sola ponderando los tres puntos de vista.

Supongamos una nueva paciente con La probabilidad condicional de que una nueva paciente tenga cáncer de mama, dada la información D, está dada por:

Y la regla de clasificación es la siguiente:

(7)

Donde , son los umbrales de clasificación inferior y superior, respectivamente.

Para las n observaciones en D y el par , podemos asociar la tabla de contingencia que muestra el cuadro 6.

Cuadro 6

Clasificación del modelo en C = (C_i, C_s)

Elaboración propia

Donde ; son los correspondientes números de observaciones que resultan del cruce de las categorías del test de diagnóstico con las categorías del verdadero estado de la paciente.

Denotemos por al vector , y por , al vector , , los parámetros de las dos multinomiales asociadas a esta tabla de contingencia. Supongamos una distribución a priori de Jeffreys sobre , una distribución Dirichlet . Entonces, la distribucióna posteriori sobre _Yiviene dada por:

De la pérdida total en , resulta que la pérdida esperada a posteriori viene dada por:

(8)

El punto que minimice (8), será el par de puntos de corte que definen el test de diagnóstico (7) óptimo.

Cualquier centro de salud dispone de la información necesaria para determinar una función de costos-utilidades que permita implementar este modelo. La base para definir dicha función son los costos asociados a los exámenes clínicos, medicamentos, hospitalización, atención médica, entre otros.

Y los beneficios están asociados a la calidad de vida de las pacientes, valoradas por los actores del problema, i.e. las pacientes, los médicos, los directores de los centros de salud y el personal paramédico. Lógicamente que no es fácil medir la calidad de vida para los distintos escenarios; no obstante, existen trabajos donde se estudian estos aspectos y que podemos tomar como referencia, véase por ejemplo, Parmigiani (1999), Paci et al. (2014), Arrospide et al. (2015).

6. Ejemplo de función de pérdida

Una función de pérdida particular puede ser construida basándose en entrevistas hechas a las pacientes, a los médicos, a los directores y administradores de los centros de salud, véase Arrospide et al. (2015). Es natural que en cada caso las pérdidas varíen, pero en la práctica, la mayor variación ocurre entre los pacientes. A manera de ejemplo, hemos construido tres funciones de pérdida basadas en las siguientes consideraciones:

Asumimos que no existen costos asociados a las clasificaciones hechas correcta-mente. Es decir, las pérdidas por clasificar un verdadero negativo y un verdadero positivo son cero. Por lo tanto, l00 = 0 y l10 = 0, respectivamente
Los costos asociados a una clasificación de falso positivo, se deben al costo de la biopsia y al costo de la calidad de vida de la paciente sometida a un severo examen extra
Una clasificación de Probablemente Cáncer con resultado negativo, requiere de exámenes clínicos y revisiones médicas que resultan ser menos severas, en todos los sentidos, que el de una biopsia. Excepcionalmente, se recurre a la biopsia para confirmar el diagnóstico.
Los costos asociados a una clasificación falso negativo,se deben a tener que tratar a la paciente con un cáncerde mama en un estado avanzado, en vez de hacerlo enestados tempranos del desarrollo, cuando se suponeexiste un ahorro importante en el tratamiento. El tratamiento en estado avanzado del cáncer de mama,como en cualquier otra enfermedad incurable, conllevaentre otros costos los siguientes: Hospitalización,exámenes clínicos, medicamentos, pérdida de la calidadde vida, e incluso la misma muerte.
Una clasificación Probablemente Cáncer con resultadopositivo, comienza con exámenes clínicos y revisionesmédicas no muy severas y siempre finaliza con unabiopsia confirmatoria. La diferencia con una clasificaciónverdadero positivo son los exámenes y revisiones previas.
Por (ii) y (iii) asumimos que l10 ≥ l02.
Por (iv) asumimos que la mayor pérdida ocurre cuandose clasifica un falso negativo. Es decir l10 = 1.
Por (i) y (v) asumimos que 0 ≤ l12 < l02.

En cualquier caso, una función de pérdida construida sobre estas consideraciones generales, verifica que:

(i)

(ii)

(iii)

en otro caso,

Donde

El cuadro 7 muestra la clasificación hecha por el modelo con tres funciones de pérdida construidas a manera de ejemplo. Allí puede verse que el diagnóstico depende, de forma crítica, del punto de vista de los costos, además del examen radiológico. La primera función de pérdida (costos), corresponde a un punto de vista que juzga como muy importante el gasto de los exámenes médicos. La segunda función de pérdida, muestra el efecto en la clasificación cuando el peso relativo de los exámenes médicos es menor que el del primer caso. La tercera función de pérdida, considera que el costo promedio para confirmar un diagnóstico negativo, es similar si se hace con una biopsia directamente o se hace con procedimientos menos agresivos.

Cuadro 7

Clasificación con diversas pérdidas (n=328, n_o.=144, n₁=184)

Clasificación con diversas pérdidas (n=328, no.=144, n1=184)

Elaboración propia

7. Análisis por grupos de edad

Está probado, que el diagnóstico precoz del cáncer de mama basado en un procedimiento de screening mamográfico es efectivo, sin embargo, existe controversia sobre la efectividad de este procedimiento para mujeres menores de 50 años, véase, por ejemplo, Parmigiani (1999), Lee et al. (2010). Sin duda, la prevalencia de la enfermedad, junto con la sensibilidad y especificidad del test de diagnóstico, tienen mucho que ver con los beneficios que dejan los programas de screening. A menor prevalencia del cáncer de mama se necesitan pruebas de diagnóstico con mayor sensibilidad y especificidad que hagan eficiente el programa.

De algún modo, la controversia sugiere investigar la posibilidad de construir distintas pruebas para cada grupo de edad. Con esta idea, se repitió el cálculo y se construyó un modelo de respuesta binario, en forma separada, para dos grupos de edad. El Grupo 1, formado por 145 mujeres menores de 50 años de edad y que denotamos por D01 y el grupo 2, formado por las 183 mujeres restantes de un total de 328 mujeres. Así que D2=D \ D01.

Un resumen de los resultados se muestra en los cuadros 8 y 9. La última columna de cada cuadro, muestra las probabilidades a posteriori de los modelos aceptados. Basándose en esta evidencia, podemos ver con claridad que las variables x3, antecedentes familiares, x4, embarazos y lactancia, y x9, asimetrías, no son importantes para explicar la presencia de cáncer de mama en mujeres menores de 50 años. El comportamiento es distinto para el grupo de mujeres con 50 años o más, la evidencia muestra que las variables x3, antecedentes familiares, x4, embarazos y lactancia y x5, antecedentes personales, no son importantes para explicar presencia de cáncer de mama en este caso.

Desafortunadamente la cantidad de datos y la composición en las submuestras (D y D01), no son suficientes para poder obtener pruebas de diagnóstico fiables. No obstante, estos resultados coinciden con otros estudios que evalúan la utilidad de los programas de screening en mujeres menores a 50 años, véase por ejemplo, Lee et al. (2010). Pero lo más importante, es que estos resultados sugieren que las variables regresoras son distintas según el grupo de edad y por lo tanto, indican la necesidad de desarrollar modelos distintos para cada grupo de edad, lo cual posiblemente incremente la precisión en el diagnóstico.

Cuadro 8

Edad < 50 años: Modelos potencialmente aceptables y modelos aceptados*

Elaboración propia

Cuadro 9

Edad ≥ 50 años: Modelos potencialmente aceptables y modelos aceptados*

Elaboración propia

8. Discusión final

La dificultad del problema de la selección de modelos es bien conocida y más aún, cuando se trata de la construcción de un modelo de decisión que utiliza únicamente los métodos bayesianos automáticos (objetivos). Este trabajo muestra los métodos que permiten construir un modelo de decisión con estas características, usando distribuciones a priori de Jeffreys y una versión del Factor de Bayes Intrínseco llamado Factor de Bayes Medio.

En particular, el modelo regresión binaria que se construyó consideró inicialmente seis funciones link (Logístico, Probit, Cauchy, log-log complementario, t-Student con 2 g.l. y t-Student con 4 g.l.) y ocho variables explicativas, lo cual indica trabajar con 1.536 posibles modelos. A través del Factor de Bayes Medio, se determinó que el modelo que mejor ajusta a los datos está conformado por una mixtura de dos modelos logísticos con seis variables explicativas solamente. Tomando en consideración varias medidas de la bondad del modelo, por ejemplo ROC = 0.832 y % de aciertos = 80.0, estas indican que la mixtura tiene un excelente ajuste y calibración.

También se encontró, que el diagnóstico puede cambiar drásticamente según cambie la función de pérdida y además se confirmó, que el modelo de predicción debe ser distinto si la paciente es menor o mayor a 50 años.

El modelo teórico desarrollado aquí es de carácter general y puede ser aplicado a otras enfermedades e infinidad de problemas de decisión que tiene esta misma estructura, varios potenciales factores de riesgo y varias alternativas de acción.

Una característica importante del modelo de decisión desarrollado, es que permite la posibilidad de clasificar a una paciente en tres categorías, en vez de dos que es la forma clásica: Cáncer o Nocáncer. La tercera categoría, Probablemente Cáncer, indica que es necesario encontrar nuevas evidencias para poder establecer el diagnóstico final. Es fácil adaptar el modelo para que considere otras clasificaciones distintas, que permitan ahorrar recursos y molestias innecesarias a las pacientes al momento del diagnóstico, pero siempre con el objetivo de determinar del verdadero estado de la paciente.

Las funciones de pérdida que necesita el modelo parecen fáciles de construir, pero el escepticismo de los administradores de los centros de salud y del cuerpo médico tratante, dificulta la tarea de evaluar la verdadera utilidad de estos modelos. Es fundamental lograr la participación de la comunidad médica para poder desarrollar esta clase de modelos, una tarea no exenta de dificultades.

Referencias

Arrospide A., Soto M., Acaiturri T., López G., Abecita L., and Mar J. (2015). Cost of breast cancer treatment by clinical stage in the Basque contry, Spain. Revista Española Salud Publica, 89(1):93–97.

Berger J. and Pericchi L. (1996). The intrinsic bayes factor for model selection and prediction. Journal of the American Statistical Association, 91:109–122.

Burnside D., Rubin E. and Shachter R. (2000). A bayesian network for mammography. Management Science and Engineering. Stanford University. USA.

Casella G. and Robert C. (1999). Monte Carlo Statistical Methods. Springer-Verlag, New York.

Girón F., Martínez M., and Moreno E. (1998). Automatic diagnostic of breast cancer: A case study. Applied Decision Analysis, Edited by F. Javier Girón. (Kluwer Academic Publishers), pages 101–113.

Hosmer W. and Lemeshow S. (2000). Applied Logistic Regression. New York: John Wiley and Sons Ltd.

Jeffrey T., Steven R., Smith-Bindman R., Ichikawa, Barlow William E. and Kerlikowske K. (2008). Using clinical factors and mammographic breast density to estimate breast cancer risk: Development and validation of a new predictive model. Annals of Internal Medicine, 148(5):337–347.

Lee C, Dershaw D, Kopans D, Evans P, Monsees B, Monticciolo D, Brenner R, Bassett L, Berg W, Feig S, Hendrick E, Mendelson E, D’Orsiç C, Sickles E, and Burhenne L. (2010). Breast cancer screening with imaging: recommendations from the society of breast imaging and the acr on the use of mammography, breast mri, breast ultrasound, and other technologies for the detection of clinically occult breast cancer. Journal of the American College of Radiologiy, 7(1):18–27.

NCI. (2015) Screening tests that have been show to reduce cancer deaths. Technical report, National Cancer Institute, USA.

Nelson H, Tyne K, Naik A, Bougatsos C, Chan B, and Humphrey L. (2009). Screening for breast cancer: an update for the u.s. preventive services task force. Annals of Internal Medicine, 151(10):727–737.

Organización Mundial de la Salud. (2015). Carga mundial de morbilidad. Technical report, Organización Mundial de la Salud.

Paci E, Broeders M, Hofvind S, Puliti D, Duffy S and EUROSCREEN Working Group. (2014). European breast cancer service screening outcomes: a first balance sheet of the benefits and harms. Cancer Epidemiol Biomarkers Prev., 23(7):1159–1163.

Parmigiani G. (1999). Decision models in screening for breast cancer. Bayesian Statistics 6, Edited by Bernardo, J., Berger, J., Dawid A.and Smith, A. (Clarendon Press Oxford), 6:525–546.

Quiroz S. (2002). Modelos de Respuesta Binaria Bayesianas. Tesis Doctoral, Universidad de Granada, Facultad de Ciencias, Departamentode Estadísticae Investigaciónde Operaciones, Granada.

Raftery A, Madigan D, and Hoeting. (1997). Bayesian model averaging for linear regres-sion models. Journal of the American Statistical Association, 92:179–191.

Richard S, Norman B, Rowan R, Cummings S, Cuzick J, Dowsett M, Easton D, Forbes J, Key T, Han-kinson S, Howell A, and Ingle J. (2007). Critical assessment of new risk factors for breast cancer: considerations for development of an improved risk prediction model. Endocrine-Related Canc, 14:169–187.

Tierney L and Kadane J. (1986). Accurate approximations for posterior moments and marginal densities. Journal of the American Statistical Association, 81:82–86.

William B, White E, Ballard-Barbash R, Vacek P, Titus-Ernstoff, Carney P, Jeffrey T, Buist D, Geller B, Rosenberg R, Bonnie Y, and Kerlikowske K. (2006). Prospective breast cancer risk prediction model for women undergoing screening mammography. Journal of the National Cancer Institute, 98(17):1204–1214.

Wu Y, Giger M, Doi K, Vyborny C, and Schmidt R. (1993). Artificial neural networks in mammography: application to decision making in the diagnosis of breast cancer. Radiology, 187:81–87.