Resumen: Hoy en día, las redes neuronales artificiales y el deep learning, son dos de las herramientas más poderosas del aprendizaje de máquina, que tienen por objetivo desarrollar sistemas que aprenden automáticamente, reconocen patrones, predicen comportamientos y generalizan información a partir de conjuntos de datos. Estas dos herramientas se han convertido en un potencial campo de investigación con aplicaciones a la ingeniería, no siendo la ingeniería biomédica la excepción. En este artículo se presenta una revisión actualizada de las principales aplicaciones de las redes neuronales y el deep learning a la ingeniería biomédica en las ramas de la ómica, la imagenología, las interfaces cerebro-máquina y hombre-máquina, y la gestión y administración de la salud pública; ramas que se extienden desde el estudio de procesos a nivel molecular, hasta procesos que involucran grandes poblaciones.
Palabras clave:aprendizaje de máquinaaprendizaje de máquina,inteligencia artificialinteligencia artificial,reconocimiento de patronesreconocimiento de patrones,ómicaómica,bioinformáticabioinformática,biomedicinabiomedicina,imagenologíaimagenología,interfaces cerebro-máquinainterfaces cerebro-máquina,interfaces hombre-máquinainterfaces hombre-máquina,salud públicasalud pública.
Abstract: Nowadays, artificial neural networks and deep learning, are two of the most powerful machine learning tools, which aim to develop systems that learn automatically, recognize patterns, predict behaviors and generalize information from data sets. These two tools have become a potential field of research with applications to engineering, with biomedical engineering not being the exception. This article presents an updated review of the main applications of neural networks and deep learning in the areas of omics, imaging, brain-machine and body-machine interfaces, and the management and administration of public health; these areas extend from the study of processes at molecular level, to processes that involve large populations.
Keywords: machine learning, artificial intelligence, pattern recognition, omics, bioinformatics, biomedicine, brain- machine interfase, man-machine interfase, public health.
Artículos
Aplicaciones de las redes neuronales y el deep learning a la ingeniería biomédica
Applications of neural networks and deep learning to biomedical engineering

Recepción: 18 Noviembre 2019
Corregido: 27 Abril 2020
Aprobación: 30 Junio 2020
El machine learning (ML), conocido en español como aprendizaje de máquina, es una disciplina de la ciencia de la computación y una rama de la inteligencia artificial que tiene por objetivo desarrollar sistemas que aprenden automaticamente, reconocen patrones y predicen comportamientos, a partir de conjuntos de datos [1]
Dentro de las herramientas más importantes del ML se encuentran las redes neuronales artificiales, conocidas en inglés como artificial neural networks (ANNs), y el aprendizaje profundo, conocido en inglés como deep learning (DL). Las ANNs son un modelo de un algoritmo computacional inspirado en las redes neuronales biológicas [2]. Son una poderosa herramienta que tiene la habilidad para aprender y generalizar, permitiendo reconocer patrones, predecir comportamientos y tomar decisiones. El DL toma los fundamentos teóricos de las redes neuronales clásicas, pero emplea una gran cantidad de neuronas y capas escondidas, junto con nuevos modelos y paradigmas de entrenamiento [3].
La ingeniería biomédica es un campo interdisciplinar donde confluyen áreas como la ingeniería electrónica, la ingeniería mecánica, la medicina, la biología, la física, la fisiología, entre otros [4]. Tiene como objetivo la aplicación de tecnología de punta para la creación de dispositivos médicos y metodologías que permitan contribuir al bienestar humano y mejorar la comprensión de los procesos biológicos que ocurren en los humanos.
Las ANNs y el DL representan una enorme oportunidad para la ingeniería biomédica ya que permiten apoyar a los profesionales de la salud con: (1) análisis más rápidos de grandes conjuntos de datos e información médica de hospitales e institucionales de salud, (2) mejoras en los protocolos de diagnóstico y pronóstico de enfermedades, aumentando la velocidad y reduciendo los errores médicos, (3) diseño de terapias personalizadas más eficientes y (4) mejoras en el bienestar humano.
Las aplicaciones de las ANNs y el DL a la ingeniería biomédica se dividen en cuatro campos: (1) la ómica, (2) la imagenología, (3) las interfaces cerebro-máquina y hombre-máquina, y (4) la gestión y administración de la salud pública, como se ilustra en la figura 1. Estos campos de aplicación abarcan toda la biomédica, extendiéndose desde el ADN, ARN y las estructuras proteínicas, hasta los conjuntos de población humana en general.
Este trabajo de revisión se estructura de la siguiente forma: en la sección 2 se introduce el tema de las ANNs, haciendo un recorrido desde las arquitecturas convencionales hasta las más avanzadas contempladas en el DL. En la sección 3 se describen cada uno de los campos de aplicación de las ANNs y el DL a la ingeniería biomédica (ómica, imagenología, interfaces cerebro- máquina y hombre máquina, y gestión y administración de la salud pública) y se presentan los más recientes trabajos publicados. Finalmente, en la sección 4 se establecen las conclusiones pertinentes a partir de la literatura investigada, resaltando las limitaciones y los desafíos en la aplicación de ANNs y DL a la ingeniería biomédica.

Las ANNs son un modelo de un algoritmo computacional inspirado en las redes neuronales biológicas [2]. Se constituyen como una herramienta que tiene la capacidad para aprender, generalizar y procesar automáticamente datos, con aplicación a tareas de clasificación y regresión. En la clasificación se busca organizar los datos de entrada en diferentes clases, y en la regresión, o aproximación de función, predecir un parámetro de salida desconocido [2]. Es a partir de estas aplicaciones, que se concluye que el potencial de las ANNs se encuentra en el reconocimiento de patrones y la predicción de comportamientos.
Una neurona artificial se compone de una o múltiples entradas, un peso, un bias, un sumador y una función de transferencia (o de activación), como se muestra en la figura 2. Normalmente una neurona, aún con múltiples entradas, no es suficiente, por lo tanto, las ANNs usan varias neuronas ubicadas en paralelo formando lo que se conoce como una capa. Una ANN puede ser poseer una capa o múltiples capas, como se ilustra en la figura 3.
El primer modelo de red neuronal desarrollado fue el perceptron, constaba de una única capa de neuronas, y su principal funcionalidad era la clasificación de patrones a partir de entradas escalares binarias (0 y 1) o vectores bipolares [5]. El algoritmo de aprendizaje usado para entrenar al perceptron era la regla de Hebb [2] [5], en el cual un conjunto de datos de entrenamiento (ejemplos de entradas y salidas) era usado para obtener los pesos de la red a través de un proceso iterativo que comenzaba con valores aleatorios. La principal desventaja del perceptron era que se restringía únicamente a la clasificación de problemas linealmente separables, no siendo posible su aplicación a problemas del mundo real [2].

Esta limitación fue superada con la introducción de las ANNs de múltiples capas, las cuales poseían capas intermedias de neuronas, denominadas capas ocultas, entre las neuronas de entrada y salida.


El ejemplo más importante y con mayor aplicación de este tipo de ANNs es el multilayer perceptron.
Es una ANN compuesta por múltiples capas de neuronas ubicadas entre la entrada y la salida, conocidas como capas ocultas. La adición estas capas permite incrementar el potencial de la red para solucionar problemas de clasificación y regresión con conjuntos de datos complejos (no lineales y discontinuos). El algoritmo de entrenamiento más extendido para esta red se conoce como backpropagation (BP), que consta de dos etapas: (1) la red es estimulada con una entrada, esta se propaga a través de la ANN desde la primera capa hasta la última, produciendo una salida; (2) la diferencia entre la salida deseada y salida obtenida es usada para ajustar los parámetros de la red empezando desde la última capa, avanzando hacia atrás, hasta la primera capa [2].
ANN introducida por J. Hopfield que funciona como memoria asociativa, en donde cada neurona se encuentra conectada a las demás neuronas. Durante su entrenamiento, se suministran todos los ejemplos de entrada, y se espera que la red almacene y memorice estos patrones. Una vez entrenada, su capacidad de memoria asociativa es usada para recordar y reconocer los patrones almacenados, aún en presencia de ruido [6].
Los mapas auto-organizados son un tipo de ANN introducido por Kohonen que funciona como método de agrupamiento. Estas redes toman los datos de entrada y los agrupan de acuerdo a su similitud en patrones. Son diseñadas de forma que las neuronas de salida con patrones similares son vecinas [7].
El DL toma los fundamentos teóricos de las ANNs clásicas, pero emplea una gran cantidad de neuronas y capas ocultas, junto con nuevos modelos y paradigmas de entrenamiento ofreciendo una capacidad mucho mayor para aprender a adaptarse y extraer características de datos de entrada de alta complejidad [3]. Las ANNs usadas en el DL son conocidas como redes neuronales profundas, en inglés deep neural networks (DNNs).
La red neuronal profunda multicapa perceptron toma la arquitectura de la red MLP, pero emplea un mayor número de neuronas y capas ocultas para solucionar problemas donde los datos de entrada son de alta complejidad. El desarrollo de este tipo de redes se debe a los recientes avances en métodos heurísticos para entrenamiento de grandes arquitecturas y herramientas computacionales (hardware y software) [3].
Las redes DAE son un caso especial de DMLP que poseen dos características principales: (1) emplean el mismo número de neuronas en la entrada y salida, y (2) emplean un menor número de neuronas en las capas ocultas respecto a las usadas en la entrada y salida. Esta arquitectura permite que sus principales aplicaciones sean la extracción y reducción de características, y el pre- entrenamiento de parámetros de DNNs más complejas [8].
Las redes neuronales recurrentes poseen una arquitectura donde las conexiones entre neuronas forman un gráfico dirigido a lo largo de una secuencia temporal, lo que les permite ser útiles para analizar datos en series de tiempo, exhibir un comportamiento dinámico, tener una memoria interna y mantener información sobre lo que sucedió en pasos de tiempos anteriores [3]. Estas características hacen que las RNNs sean usadas principalmente en aplicaciones de análisis de texto y de habla. Dentro de este tipo de arquitectura se encuentran las unidades de memoria a largo plazo (long-short term memory units, LSTM) que son especialmente diseñadas para aplicaciones donde se pueden presentar retrasos muy largos y desconocidos entre eventos importantes en la serie de tiempo [9].
La máquina restringida de Boltzmann es una ANN estocástica que puede aprender una distribución probabilística a partir del conjunto de datos de entrada. Su arquitectura consiste en una capa de neuronas visibles y una capa de neuronas ocultas que se conectan entre sí, sin permitir conexiones entre neuronas del mismo tipo de capa. Sus principales aplicaciones son el modelado de relaciones probabilísticas y el pre-entrenamiento de parámetros de DNNs más complejas [10]. Dentro de esta arquitectura se encuentran las redes neuronales de creencias profundas (deep belief networks, DBNs) que se caracterizan porque cada capa oculta sirve de capa visible para la siguiente capa [11].
Las redes neuronales convolucionales son inspiradas en la corteza visual, la cual consiste en mapas de campos receptivos locales que responden a los estímulos únicamente en una región del campo visual, y disminuyen a medida que la corteza se mueve hacia adelante; los campos receptivos se superponen de modo que cubren todo el campo visual. Las CNNs toman la arquitectura de la DMLP, pero su principal diferencia es que cada neurona solo se encuentra conectada a un parche local de neuronas de la siguiente capa [12]. Esta arquitectura aprovecha el patrón jerárquico de los datos para ensamblar patrones más complejos usando unos patrones más pequeños y simples. Su nombre indica que la red usa el operador matemático conocido como convolución, que permite realizar operaciones complejas de forma más sencilla. En esta red, los datos de entrada son convolucionados por diferentes filtros convolucionales durante el desplazamiento a través de las neuronas. Los filtros convolucionales comparten los mismos parámetros en cada pequeña porción la red, reduciendo los parámetros del algoritmo. Su principal aplicación son las tareas de visión artificial, como la clasificación y segmentación de imágenes [13].
La ómica, también conocida como bioinformática [14] o biomedicina [15], tiene como objetivo estudiar e investigar los procesos biológicos a nivel molecular con el fin de diagnosticar, predecir y prevenir enfermedades, e involucrar a los pacientes en terapias y tratamientos más eficientes y personalizados. Es un campo de la biomédica de gran extensión, que se divide en diferentes ramas como la genómica, interactómica, metabolómica, metagenómica, proteómica, farmacogenómica, epigenómica, multiómica, lipiodómica, alimentómica, secretómica, glicomica y transcriptómica.
Debido a la gran extensión de la ómica, en la tabla 1 se resumen los más recientes artículos de revisión sobre aplicaciones de ANNs y DL en diferentes ramas de la ómica, resaltando las áreas de revisión documentadas por los autores. A partir de estos artículos de revisión y de la literatura revisada se evidencia que las aplicaciones se concentran principalmente en la genómica, la proteómica, la epigenómica y la farmacogenómica.
La genómica estudia el conjunto completo del ADN y la interacción de los genes entre sí y con el entorno, con el objetivo de identificar alelos genéticos y factores ambientales que constribuyen al desarrollo de enfermedades, como por ejemplo el cáncer. La proteómica y la epigenómica estudian las interacciones proteínicas, y los efectos de los factores ambientales y de los medicamentos en la formación de proteínas. Y la farmacogenómica estudia la respuesta farmacológica de los genes a los medicamentos, con el objetivo de diseñar medicamentos más eficientes para tratamientos personalizados que reduzcan la aparición de efectos secundarios.

En la genómica, las ANNs y el DL se han aplicado al diagnóstico de cáncer, la expresión de genes y la secuenciación genómica. Dentro del diagnóstico de cáncer se han desarrollado sistemas para la identificación y extracción de características genéticas presentes en el cáncer [21-22], y sistemas para la detección y clasificación de distintos tipos de cáncer a partir de la expresión genética [23-24] y de la mutación puntual somática en secuencias de ADN [25]. En la expresión de genes, que se refiere al proceso de producción de una proteína a partir de la información codificada en el ADN, se han aplicado a la predicción de la expresión de genes [26, 27, 28] y a la creación de modelos que predicen el resultado del empalme alternativo a partir de la información del ADN en diferentes contextos celulares [29-30]. Dentro de la secuenciación genómica, que es el proceso de determinar el orden preciso de nucleótidos dentro del ADN, las aplicaciones se dividen en la secuenciación del ADN [31, 32, 33] y la metilación del ADN [34-35], que el proceso mediante el cual se agregan grupos de metilo a la mólecula del ADN
La predicción de la estructura de una proteína es crucial para determinar su función y aplicación, por lo tanto, dentro de la proteómica y la epigenómica, se ha investigado en aplicaciones que permiten la predicción de los ángulos de la columna vertebral de la proteína (que permite obtener información sobre la estructura de la proteína) [36, 37, 38], la predicción de la estructura secundaria y terciaria de la proteína [39, 40, 41, 42, 43, 44, 45, 46, 47] la evaluación de la calidad de la proteína [48, 49, 50], y la predicción de las regiones de desórdenes (trastornos) en la estructura de la proteína [51-52].
Las interacciones entre las proteínas y el ADN o ARN juegan un papel importante en diferentes procesos celulares como la transcripción, la replicación, la traducción y la reparación, que tienen objeto de estudio dentro de la farmacogenómica, ya que permiten investigar en el diseño y descubrimiento de medicamentos. Por lo tanto, dentro de la proteómica, la epigenómica y la farmacogenómica, se ha investigado en el uso de redes neuronales y deep learning para la predicción de unión de proteínas al ADN y ARN [53-54], la predicción de la interacción proteína-proteína [55, 56, 57], la predicción de la interacción compuesto-proteína [58- 59], y la predicción de las interacciones farmacológicas, medicamento-objetivo [60, 61, 62].
En tabla 2 se resumen las más recientes aplicaciones a la ómica, donde se especifica la arquitectura de la ANN implementada junto con su respectiva referencia.
La imagenología es el conjunto de técnicas y procedimientos que permiten obtener imágenes biológicas o médicas del cuerpo humano con el propósito de examinar y diagnosticar enfermedades. La imagenología biológica, o bioimaging en inglés, tiene como objetivo la detección de enfermedades infecciosas, cáncer y condiciones inflamatorias a partir del estudio de las células (citología) y del tejido (histopatología). La imagenología médica tiene como objetivo el estudio de los órganos humanos a partir de imágenes obtenidas por diferentes métodos, como la resonancia magnética (magnetic resonance imaging, MRI), la tomografía computarizada (computed tomography, CT), el ultrasonido, la tomografía por emisión de positrones (positron emission tomography, PET), los rayos X 2D y 3D, entre otros.

En la imagenología, la precisión del diagnóstico depende de: (1) la adquisición y resolución de la imagen y (2) de su interpretación. Los recientes avances en la tecnología han permitido el desarrollo de una amplia gama de equipos y sistemas de adquisición de imágenes de alta resolución. La interpretación, hecha por médicos, está sujeta al error humano y a las diferencias de diagnóstico entre intérpretes. Es por esto que la interpretación de imágenes biológicas y médicas se constituye como un área de investigación potencial donde nuevas metodologías como las ANNs y el DL tienen cabida, permitiendo asistir el dictamen médico y contribuir a un diagnóstico más objetivo y preciso. Esta área de invetigación es conocida como diagnóstico asistido por computador (computer-aided diagnosis, CAD). La principal arquitectura de ANN usada en aplicaciones de CAD son las CNNs debido a su excelente desempeño en tareas de visión computarizada, y reconocimiento y clasificacion de patrones en imágenes [63].
Dentro de la imagenología biológica, las principales aplicaciones de las ANNs y el DL se concentran en el análisis y extracción de características en imágenes histopatológicas para la detección de cáncer, como en el trabajo de P. Khosravi et al [64] donde se demuestra la utilidad de una red convolucional para la clasificación de dos subtipos de cáncer de pulmón, cuatro bio-marcadores de cáncer de vejiga y cinco bio-marcadores de cáncer de mama; y el trabajo de K. Sirinukunwattana et al [65] donde se implementa una CNN para la detección y clasificación de núcleos celulares de adenocarcinomas colorrectales en cuatro clases: epitelial, inflamatorio, fibroplástico y misceláneo, con el objetivo de facilitar el diagnóstico de cáncer de colon. A pesar de estos casos exitosos de aplicación, la literatura consultada refleja un interés particular en el análisis computacional de imágenes histopatológicas para la detección de cáncer de mama, que podría dar lugar en un futuro cercano a nuevas aplicaciones de ANNs [66, 67, 68].
En cuanto a la imagenología médica, las aplicaciones se han encaminado en dos enfoques: (1) la identificación de órganos y partes del cuerpo para asistencia en diferentes procedimientos médicos, y (2) el diagnóstico de distintos tipos de enfermedades. Respecto al primer enfoque, H. Roth et al [69] implementan una red convolucional para el reconocimiento de órganos y partes del cuerpo humano a partir de imágenes de tomografía computarizada con el fin de aplicarlo a la clasificación automática de la anatomía humana, importante pre-requisito de los sistemas de diagnóstico asistido por computador. M. R. Avendi, A. Kheradvar y H. Jafarkhani [70] proponen un sistema compuesto por una CNN y auto-encoders para la detección automática del ventrículo izquierdo del corazón y el reconocimiento de su forma a partir de imágenes de resonancia magnética, con el fin de aplicarlo al cálculo de índices clínicos como el volumen ventricular y la fracción de eyección. J. Yu et al [71] desarrollan una CNN con extreme learning machine (ELM) para la clasificación de los órganos digestivos aplicado a procedimientos de endoscopia por cápsula inalámbrica (wireless capsule endoscopy, WCE), una tecnología no invasiva para la examinación de enfermedades gastrointestinales, donde el principal objetivo de la aplicación es reducir el tiempo de revisión por parte de los médicos. H. Chen et al [72] proponen una CNN para la localización del plano estándar fetal abdominal (fetal abdominal standard plane, FASP) a partir de vídeos de ultrasonido. La localización del FASP es un paso crucial durante las rutinas de ultrasonido para la revisión del feto, y esta aplicación apunta a reducir el tiempo y mejorar la eficiencia de este proceso.
Por otro ldo, algunos ejemplos de aplicaciones de redes neuronles y deep learning para el diagnóstico de enfermedades a partir de imágines médicas se encuentran en los trabajos de : M. Anthimopoulos et al [73] donde se propone una CNN para la clasificación de enfermedades intersticiales de pulmón a partir de imágenes de tomografía computarizada. La red permite la clasificación de imágenes en siete tipos: sano, opacidad de vidrio esmerilado (ground glass opacity, CGO), micro-nódulos, consolidación, reticulación, panal (honeycombing), y una combinación entre CGO y reticulación. J. Shan y L. Li [74] desarrollan un sistema basado en DAE para la detección de micro-aneurismas a partir de fotos a color de la retina (retinografía). Q. Dou et al [75] desarrollan una CNN para la detección automática de micro-hemorragias cerebrales a partir de imágenes de resonancia magnética. D. Nie et al [76] desarrollan un sistema basado en CNNs para extraer características de imágenes cerebrales obtenidas por resonancia magnética para contribuir al diagnóstico de gliomas de alto grado, uno de los tumores cerebrales más agresivos y severos. H. Suk et al [77] proponen un método basado en una RBM para el diagnóstico de Alzheimer a partir de imágenes de la materia gris obtenidas por resonancia magnética y tomografía por emisión de positrones. Y. Cao et al [78] implementan una CNN para la clasificación de diferentes manifestaciones de tuberculosis a partir de imágenes de rayos X. M. van Grinsven et al [79] desarrollan una CNN para la detección de hemorragias en imágenes de fondo de color y propusieron un método de entrenamiento basado en una clasificación dinámica de muestras negativas mal clasificadas para mejorar y acelerar el entrenamiento con aplicaciones al análisis de distintos tipos de imágenes médicas.
Las interfaces cerebro-máquina y hombre-máquina son una combinación de hardware y software que, a través de las señales eléctricas de la actividad cerebral y muscular, permiten controlar dispositivos externos o diagnosticar enfermedades. Estas interfaces se componen de un sensor, normalmente un electrodo encargado de adquirir las señales de la actividad cerebral o muscular, una etapa de amplificación y filtrado, y un sistema de control [80].
Para el control de dispositivos externos, las ANNs y el DL han sido aplicados al reconocimiento de patrones de movimiento de las manos a partir de señales superficiales de electromiografía (electromyography, EMG) del antebrazo, con el fin de mejorar el control y funcionalidad de las manos protésicas. Distintos tipos de arquitecturas han sido implementadas para esta aplicación, como CNNs en los trabajos de M. Atzori, M. Cognolato y H. Müller [81] y W. Geng et al [82], DNNs en el trabajo de C. Li et al [83] y MLPs en los trabajos de K. Vonsevych et al [84], C. Calderon-Cordova et al [85] y M. R. Pambudi, R. Sigit and T. Harnoso [86].
Sin embargo, el control de dispositivos externos y de interfaces hombre-máquina no se ha restringido al uso de señales de electromiografía, sino que se han desarrollado aplicaciones que involucran distintos tipos de entradas y arquitecturas de ANNs. Algunos ejemplos se encuentran en los trabajos de: M. Poggi y S. Mattocia [87] donde se desarrolla un dispositivo compuesto por una CNN, una cámara RGBD y una placa CPU, para guiar personas con discapacidades visuales, permitiendo detectar obstáculos en tiempo real y obtener información acerca del entorno a través de mensajes de audio. J. Huang et al [88] proponen un sistema para mejorar la comunicación de personas sordomudas basado en DNNs para el reconocimiento e interpretación del lenguaje de señas usando el método real-sense, que toma las coordenadas en 3D de las articulaciones de los dedos y detecta el movimiento de manera más natural que otros métodos, como el Kinect o el uso de guantes con sensores. P. Pouladzadeh et al [89] y P. Kuhad, A. Yassine Y S. Shimohammadi [90] proponen un sistema para la medición de calorías con el objetivo de ayudar a pacientes y médicos en la prevención de enfermedades relaciones con la dieta, como la obesidad. El sistema usa una cámara para detectar la comida, reconocerla y clasificarla de acuerdo a una base de datos previamente cargada. Para determinar las calorías usa dos aproximaciones: (1) basado en la comparación del alimento con el tamaño del dedo, y (2) usando una estimación de distancia entre el móvil y la comida. Sri- ngernyuang, C., et al [91] desarrollan un sistema de monitoreo y alarma para prevenir la caída de pacientes en camilla a través de una ANN que reconocía 5 diferentes patrones del paciente en la camilla: sentado dentro de la camilla, supino, lateral derecha, lateral izquierda, sentado a los lados, y en las esquinas.
En cuanto a las aplicaciones para el diagnóstico de enfermedades usando señales eléctricas de la actividad cerebral o muscular, T. J. Hong et al [92] trabajan en un sistema basado en una CNN y una red recurrente LSTM para el diagnóstico automático de la enfermedad de arteria coronaria por medio de señales de electrocardiograma (ECG). U. Rajendra et al [93] implementan una CNN para la detección automática del infarto de miocardio a partir de señales ECG. J. T. Turner et al [94] proponen diferentes algoritmos de ML basados en DNNs para la detección de trastornos convulsivos por medio de señales de electroencefalografía (EEG). Y. Zhao and L. He [95] proponen un sistema basado en una RBM, máquinas de soporte vectorial y un método de aprendizaje incremental para el diagnóstico de las etapas tempranas de Alzheimer por medio de señales EEG. U. Rajendra et al [96] proponen un método basado en una CNN para la detección de depresión usando señales EEG con miras a extender la investigación al diagnóstico de las diferentes etapas de la depresión y el desarrollo del índice de severidad de la depresión (depression severity index, DSI). L. Fraiwan y K. Lweesy [97] implementan en un sistema basado en DAE y señales EEG en el dominio del tiempo y la frecuencia, para la identificación del estado del sueño de los neonatos, el cual permite el diagnóstico de posibles desórdenes fisiológicos en los recién nacidos. Y. I. Al Mashhdany and M. K. Awsaj [98] trabajan en la aplicación de RNNs para el diagnóstico de enfermedades musculares a partir de señales de EMG como el síndrome de túnel carpiano.
La gestión y administración de la salud pública tiene como objetivo prolongar la vida humana y promover el cuidado de la salud por medio del análisis de la propagación de enfermedades y su relación con factores ambientales y sociales. Su campo de aplicación se extiende desde pequeñas poblaciones localizadas o conjuntos de personas pertenecientes a una determinada institución médica, hasta largas poblaciones que abarcan varios continentes.
Este campo de la ingeniería biomédica maneja grandes conjuntos de datos y modelos altamente complejos que involucran conocimientos derivados de la física, la química y la biología. El potencial de las ANNs y DL dentro de esta rama se establece en el manejo rápido y eficiente de la información para fines de clasificación, predicción, reconocimiento de patrones y modelado de interacciones. Las principales aplicaciones del ML a la gestión y administración de la salud pública se concentran en la vigilancia de enfermedades, epidemias y pandemias, el modelado y análisis de enfermedades asociadas a hábitos, estilos de vida, factores sociales y ambientales, el monitoreo y predicción de la calidad del aire, la vigilancia en la seguridad de los medicamentos, entre otros.
Los sistemas de información médica en hospitales modernos e instituciones médicas crecen exponencialmente, generando dificultad en la extracción de información útil. Los medios manuales y convencionales de revisión han quedado obsoletos por su ineficiencia y se han visto reemplazados por métodos de análisis computacionales. Las ANNs y el DL son métodos potenciales a usar en este campo para incrementar la precisión de diagnósticos, reducir costos y recursos humanos. N. S. El Jerjawi y S. S. Abu-Naser [99], S. Srivastava et al [100] y P. Rahimloo y A. Jafarian [101] proponen sistemas basados en MLP con diferentes algoritmos de aprendizaje, como Levenberg-Marquadt, backpropagation y métodos de regresión, para el diagnóstico de diabetes mellitus tipo II (DMT2) a partir de datos suministrados por instituciones de salud como: número de embarazos, concentración de glucosa en plasma, presión arterial, grosor del pliegue de la piel del tríceps, insulina sérica, índice de masa corporal, función pedigrí de diabetes y edad. Estos sistemas permiten la clasificación de los pacientes en tres categorías: sano, pre-diabetes y diabetes.
Dentro del modelado de enfermedades asociadas a hábitos y estilos de vida se han desarrollado metodologías basadas en ML para el análisis de la información contenida en redes sociales. L. Zhao et al [102] proponen un método de epidemiología computacional basado en DNNs y aprendizaje semi- supervisado para hacer seguimiento a enfermedades infecciosas, como influenza y Ebola, a partir de las redes sociales, específicamente de Twitter. B. Zou et al [103] investigan el uso del contenido de las redes sociales, específicamente de Twitter, para detectar y cuantificar enfermedades intestinales contagiosas, como campilobacteriosis, norovirus e intoxicación por ingesta de comida, usando una aproximación de DL. Los resultados mostraron que la información de Twitter puede servir de complemento para los métodos convencionales de vigilancia de enfermedades intestinales. V. R. K. Garimella, A. Alfayad y I. Weber [104] investigan el uso de imágenes publicadas por usuarios de redes sociales, como Twitter e Instagram, para detectar estilos de vida y hábitos que contribuyen al desarrollado de enfermedades como la obesidad, el alcoholismo y el tabaquismo. Para ello usaron un algoritmo de DL para analizar y categorizar las imágenes publicadas y detectar comportamientos como el consumo excesivo de alcohol, el consumo de sustancias nocivas, y la ingesta de comida no saludable. N. Phan et al [105] proponen un método basado en RBM con algoritmos de aprendizaje de BP y divergencia contrastante, para predecir el nivel de actividad física de los usuarios de una red social a partir de factores como la auto-motivación, las influencias sociales y los eventos ambientales, que permitiera prevenir la obesidad y contribuir al bienestar.
Una de las áreas de la salud pública donde las ANNs y el DL han sido exitosos es en el monitoreo de la calidad del aire y la predicción de los contaminantes presentes en este. La mala calidad del aire es una de las principales causas de enfermedades crónicas pulmonares, y responsable de una gran cantidad de muertes prematuras a nivel mundial [106]. M. R. Delavar et al [107] proponen varios métodos de ML para determinar los modelos de predicción de la contaminación del aire de la ciudad de Teherán atribuida al material particulado PM10 y PM2.5 basados en máquinas de soporte vectorial, ANNs y DL.
El método que permite alcanzar una mayor confiabilidad en los resultados fue el DL, por medio de una red neuronal no lineal auto-regresiva (auto-regressive non-linear neural network, ARNNN). M. Blagojevic et al [108] proponen una MLP con un algoritmo de aprendizaje basado en BP para la clasificación del nivel de contaminación del aire en el distrito Moravica en Serbia, a través de datos como: municipio, sitio, año, niveles de hollín, dióxido de sulfuro (SO2), dióxido de nitrógeno (NO2) y material particulado. X. Feng et al [109] proponen un modelo híbrido que combina el análisis de la trayectoria de la masa de aire y la transformada wavelet para mejorar la precisión de una red MLP para el pronóstico de las concentraciones de material particulado (PM2.5).
El modelo propuesto se implementa en 13 estaciones de monitoreo en Bejing, Tianjin y la provincia de Hebei, y los resultados exhiben una mejora en el pronóstico que permite que este modelo tenga potencial de aplicación en otras estaciones de monitoreo en diferentes países. B. T. Ong, K. Sugiura y K. Zettsu [106] desarrollan un sistema basado en una RNN junto con un método de entrenamiento en series de tiempo con auto-encoders para predecir la concentración del material particulado (PM2.5) del aire de Japón a partir de mediciones capturadas en cerca de 52 ciudades. El sistema implementado se contrasta con el sistema de predicción VENUS (Visual Atmospheric Environment Utility System) del Instituto Nacional de Estudios Ambientales de Japón, donde los resultados experimentales muestran que el sistema propuesto logra mejorar el nivel de precisión de las predicciones de la concentración de PM2.5 informadas en Japón.
En este trabajo se realizó la revisión de un total de 96 artículos de aplicación de las ANNs y el DL a la ingeniería biomédica, distribuidos así: 49 artículos en el campo de la ómica, 17 en imagenología, 19 en interfaces cerebro-máquina y hombre-máquina, y 11 en gestión y administración de la salud pública. Teniendo en cuenta esta división por campos de aplicación, en la figura 5 se muestra la distribucion porcentual de las arquitecturas de ANN y DL en la literatura revisada.
La figura 5 permite evidenciar que las redes neuronales convolucionales (CNN) son la arquitectura preferida en las aplicaciones a la ingeniería biomédica, especialmente en la rama de la imagenología. Esta preferencia se debe a la gran capacidad de este tipo de arquitectura para realizar tareas de visión artificial, como el reconocimiento de patrones y la extracción de características en imágenes, lo cual les permite servir como una metodología potencial para el apoyo al personal médico en el diagnóstico de enfermedades. Sin embargo, su potencial no se encuentra restringido únicamente a la visión artificial, sino que se extiende a todas las aplicaciones donde se deben realizar segmentaciones en los conjuntos de datos de entrada. Las CNNs requieren de cierto nivel de experticia en el diseño y manejo de ANNs ya que pueden resultar difícil de configurar debido al vasto número de parámetros, como: los filtros de convolución, el número de capas y el número de neuronas de convolución, de clasificación y de reducción de muestreo.
A pesar de los resultados satisfactorios y del éxito de las ANNs y el DL en las aplicaciones a la ingeniería biomédica, existen limitaciones y dificultades entre las que se pueden destacar:
Normalmente las ANNs y el DL requieren grandes conjuntos de datos e información para su entrenamiento. La información clínica de instituciones y largas poblaciones, datos de pacientes, señales de la actividad cerebral y muscular, imágenes médicas y biológicas, entre otros datos médicos, pueden resultar costosos y difíciles de obtener. Este requerimiento se está volviendo cada vez más crítico ya que se están alzando barreras en la adquisición de datos por cuestiones de privacidad, y únicamente en la medida en que la información se vuelva más accesible los algoritmos podrán evolucionar.
Un problema común que surge durante el entrenamiento de las ANNs es el sobreajuste (overfitting). El sobreajuste ocurre cuando el error de la red para el conjunto de entrenamiento es muy bajo, pero al presentársele nueva información (conjuntos de prueba) el error es muy alto. Esto quiere decir que la red memorizó los datos de entrenamiento, pero fue incapaz de aprender a generalizar en nuevas situaciones. Para lidiar con el riesgo de sobreajuste es necesario tener un buen conjunto de datos (entrenamiento, prueba y validación), realizar una correcta selección del número de parámetros de la red, y en algunas ocasiones recurrir a métodos de regularización, especialmente cuando se trabaja con DNNs [110]; todo esto implica experticia en ciencias computacionales y desarrollo de ANNs.

La selección de la arquitectura de la ANN más apropiada para una determinada aplicación no es una tarea sencilla, así como la elección del número de capas ocultas y de neuronas en cada capa. Adicionalmente, cada vez son más las arquitecturas son propuestas, ampliando el panorama de selección. Todo esto ha llevado a que algunos investigadores usen las ANNs como cajas negras, sin saber por qué pueden proporcionar buenos resultados en una determinada aplicación o cómo modificarlas en caso de que el resultado no sea satisfactorio. Por lo tanto, al igual que en el numeral anterior, se requiere de experticia en ciencias computaciones y diseño de ANNs.
En algunas ramas de la ingeniería biomédica se requieren de fuertes conocimientos teóricos en biología, medicina, e incluso química, especialmente en las ramas de la ómica y la imagenología. Por lo tanto, el diseño e implementación de ANNs y DL en este tipo ramas requiere de grupos interdisciplinares que permitan contribuir a la correcta interpretabilidad de los resultados obtenidos.
En los últimos años las ANNs y el DL han sido aplicados a la resolución de diversos problemas de ingeniería, no siendo la ingeniería biomédica una excepción. Estos potentes modelos de algoritmos computacionales poseen aplicaciones en todas las ramas de la ingeniería biomédica, desde aquellas que se dedican a la investigación y estudio de las estructuras de ADN y los procesos moleculares, como la ómica, hasta aquellas que se extienden a conjuntos de personas y largas poblaciones, como la gestión y administración de la salud pública. El potencial de las ANNs y DL en la ingeniería biomédica se encuentra en la capacidad para manejar grandes conjuntos de datos, reconocer patrones, extraer características, clasificar y predecir comportamientos.
En este trabajo de investigación se mostraron las más recientes e importantes aplicaciones de las ANNs y el DL a la ingeniería biomédica en las áreas de la ómica, la imagenología, las interfaces cerebro-máquina y hombre- máquina, y la gestión y administración de la salud pública. Dentro de la ómica las principales aplicaciones se concentran en la predicción de la expresión genética y el modelado y predicción de las estructuras proteínicas, con el fin de diagnosticar enfermedades como el cáncer, descubrir factores que contribuyen al desarrollo de ciertas enfermedades, y desarrollar medicamentos más eficientes. En la imagenología, los trabajos se han concentran en el diagnóstico asistido por computador, donde los sistemas compuestos por ANNs se encargan de reconocer y clasificar patrones de distintos tipos de imágenes biológicas y médicas para contribuir al personal médico en diagnósticos más rápidos, objetivos, precisos y eficientes. En las interfaces cerebro-máquina y hombre-máquina las principales aplicaciones tienen como fin el control de dispositivos externos, como prótesis o dispositivos de asistencia para personas discapacitadas, y el diagnóstico de enfermedades, usando señales eléctricas de la actividad cerebral y muscular. Y en la gestión y administración de la salud pública, las principales aplicaciones han sido dirigidas hacia el desarrollo de sistemas para el seguimiento y modelado de enfermedades asociadas a hábitos y estilos de visa usando información contenida en redes sociales, y el monitoreo y predicción de la calidad del aire.
Las aplicaciones y literatura revisadas en este trabajo evidencian una tendencia que se mueve del uso de arquitecturas de ANNs convencionales hacia arquitecturas de DNNs, siendo de preferencia las redes convolucionales (CNNs). La gran capacidad para la visión artificial de las CNNs ha permitido su aplicación a la ingeniería biomédica, ya que gran parte del ejercicio de esta se centra en el análisis de diferentes tipos de imágenes médicas.
Como citar: J. L. Sarmiento-Ramos, “Aplicaciones de las redes neuronales y el deep learning a la ingeniería biomédica,” Rev. UIS Ing., vol. 19, no. 4, pp. 1-18, 2020,                                                                        doi: https://doi.org/10.18273/revuin.v19n4-2020001






