Aplicaciones de las redes neuronales y el deep learning a la ingeniería biomédica

José Luis Sarmiento-Ramos

resúmenes

secciones

referencias

imágenes

Resumen: Hoy en día, las redes neuronales artificiales y el deep learning, son dos de las herramientas más poderosas del aprendizaje de máquina, que tienen por objetivo desarrollar sistemas que aprenden automáticamente, reconocen patrones, predicen comportamientos y generalizan información a partir de conjuntos de datos. Estas dos herramientas se han convertido en un potencial campo de investigación con aplicaciones a la ingeniería, no siendo la ingeniería biomédica la excepción. En este artículo se presenta una revisión actualizada de las principales aplicaciones de las redes neuronales y el deep learning a la ingeniería biomédica en las ramas de la ómica, la imagenología, las interfaces cerebro-máquina y hombre-máquina, y la gestión y administración de la salud pública; ramas que se extienden desde el estudio de procesos a nivel molecular, hasta procesos que involucran grandes poblaciones.

Palabras clave:aprendizaje de máquinaaprendizaje de máquina,inteligencia artificialinteligencia artificial,reconocimiento de patronesreconocimiento de patrones,ómicaómica,bioinformáticabioinformática,biomedicinabiomedicina,imagenologíaimagenología,interfaces cerebro-máquinainterfaces cerebro-máquina,interfaces hombre-máquinainterfaces hombre-máquina,salud públicasalud pública.

Abstract: Nowadays, artificial neural networks and deep learning, are two of the most powerful machine learning tools, which aim to develop systems that learn automatically, recognize patterns, predict behaviors and generalize information from data sets. These two tools have become a potential field of research with applications to engineering, with biomedical engineering not being the exception. This article presents an updated review of the main applications of neural networks and deep learning in the areas of omics, imaging, brain-machine and body-machine interfaces, and the management and administration of public health; these areas extend from the study of processes at molecular level, to processes that involve large populations.

Keywords: machine learning, artificial intelligence, pattern recognition, omics, bioinformatics, biomedicine, brain- machine interfase, man-machine interfase, public health.

Carátula del artículo

Artículos

Aplicaciones de las redes neuronales y el deep learning a la ingeniería biomédica

Applications of neural networks and deep learning to biomedical engineering

José Luis Sarmiento-Ramos jose.sarmiento@docentes.umb.edu.co

Universidad Manuela Beltrán, Colombia

Revista UIS Ingenierías, vol. 19, núm. 4, pp. 1-18, 2020
Universidad Industrial de Santander

Esta obra está bajo una Licencia Creative Commons Atribución-SinDerivar 4.0 Internacional.

Recepción: 18 Noviembre 2019

Corregido: 27 Abril 2020

Aprobación: 30 Junio 2020

DOI: https://doi.org/10.18273/revuin.v19n4-2020001

1. Introducción

El machine learning (ML), conocido en español como aprendizaje de máquina, es una disciplina de la ciencia de la computación y una rama de la inteligencia artificial que tiene por objetivo desarrollar sistemas que aprenden automaticamente, reconocen patrones y predicen comportamientos, a partir de conjuntos de datos [1]

Dentro de las herramientas más importantes del ML se encuentran las redes neuronales artificiales, conocidas en inglés como artificial neural networks (ANNs), y el aprendizaje profundo, conocido en inglés como deep learning (DL). Las ANNs son un modelo de un algoritmo computacional inspirado en las redes neuronales biológicas [2]. Son una poderosa herramienta que tiene la habilidad para aprender y generalizar, permitiendo reconocer patrones, predecir comportamientos y tomar decisiones. El DL toma los fundamentos teóricos de las redes neuronales clásicas, pero emplea una gran cantidad de neuronas y capas escondidas, junto con nuevos modelos y paradigmas de entrenamiento [3].

La ingeniería biomédica es un campo interdisciplinar donde confluyen áreas como la ingeniería electrónica, la ingeniería mecánica, la medicina, la biología, la física, la fisiología, entre otros [4]. Tiene como objetivo la aplicación de tecnología de punta para la creación de dispositivos médicos y metodologías que permitan contribuir al bienestar humano y mejorar la comprensión de los procesos biológicos que ocurren en los humanos.

Las ANNs y el DL representan una enorme oportunidad para la ingeniería biomédica ya que permiten apoyar a los profesionales de la salud con: (1) análisis más rápidos de grandes conjuntos de datos e información médica de hospitales e institucionales de salud, (2) mejoras en los protocolos de diagnóstico y pronóstico de enfermedades, aumentando la velocidad y reduciendo los errores médicos, (3) diseño de terapias personalizadas más eficientes y (4) mejoras en el bienestar humano.

Las aplicaciones de las ANNs y el DL a la ingeniería biomédica se dividen en cuatro campos: (1) la ómica, (2) la imagenología, (3) las interfaces cerebro-máquina y hombre-máquina, y (4) la gestión y administración de la salud pública, como se ilustra en la figura 1. Estos campos de aplicación abarcan toda la biomédica, extendiéndose desde el ADN, ARN y las estructuras proteínicas, hasta los conjuntos de población humana en general.

Este trabajo de revisión se estructura de la siguiente forma: en la sección 2 se introduce el tema de las ANNs, haciendo un recorrido desde las arquitecturas convencionales hasta las más avanzadas contempladas en el DL. En la sección 3 se describen cada uno de los campos de aplicación de las ANNs y el DL a la ingeniería biomédica (ómica, imagenología, interfaces cerebro- máquina y hombre máquina, y gestión y administración de la salud pública) y se presentan los más recientes trabajos publicados. Finalmente, en la sección 4 se establecen las conclusiones pertinentes a partir de la literatura investigada, resaltando las limitaciones y los desafíos en la aplicación de ANNs y DL a la ingeniería biomédica.

Figura 1.
Figuras o tablas a dos columnas insertadas en cuadro de texto
Fuente: elaboración propia.

2. Desde ANNs hasta DL

2.1. Redes neuronales artificiales (ANNs)

Las ANNs son un modelo de un algoritmo computacional inspirado en las redes neuronales biológicas [2]. Se constituyen como una herramienta que tiene la capacidad para aprender, generalizar y procesar automáticamente datos, con aplicación a tareas de clasificación y regresión. En la clasificación se busca organizar los datos de entrada en diferentes clases, y en la regresión, o aproximación de función, predecir un parámetro de salida desconocido [2]. Es a partir de estas aplicaciones, que se concluye que el potencial de las ANNs se encuentra en el reconocimiento de patrones y la predicción de comportamientos.

Una neurona artificial se compone de una o múltiples entradas, un peso, un bias, un sumador y una función de transferencia (o de activación), como se muestra en la figura 2. Normalmente una neurona, aún con múltiples entradas, no es suficiente, por lo tanto, las ANNs usan varias neuronas ubicadas en paralelo formando lo que se conoce como una capa. Una ANN puede ser poseer una capa o múltiples capas, como se ilustra en la figura 3.

El primer modelo de red neuronal desarrollado fue el perceptron, constaba de una única capa de neuronas, y su principal funcionalidad era la clasificación de patrones a partir de entradas escalares binarias (0 y 1) o vectores bipolares [5]. El algoritmo de aprendizaje usado para entrenar al perceptron era la regla de Hebb [2] [5], en el cual un conjunto de datos de entrenamiento (ejemplos de entradas y salidas) era usado para obtener los pesos de la red a través de un proceso iterativo que comenzaba con valores aleatorios. La principal desventaja del perceptron era que se restringía únicamente a la clasificación de problemas linealmente separables, no siendo posible su aplicación a problemas del mundo real [2].

Figura 2.
Representación de neuronas artificiales: (a) de una entrada y (b) de múltiples entradas
Fuente: M. T. Hagan [2].

Esta limitación fue superada con la introducción de las ANNs de múltiples capas, las cuales poseían capas intermedias de neuronas, denominadas capas ocultas, entre las neuronas de entrada y salida.

Figura 3.
Redes neuronales artificiales: (a) de una capa oculta y (b) de múltiples capas
Fuente: M. T. Hagan [2].

Figura 4.
Arquitecturas de los principales tipos de ANNs usadas en aplicaciones a la ingeniería biomédica: (a) multilayer perceptron (MLP), (b) red neuronal de Hopfield, (b) self-organizing map (SOM), (d) red neuronal profunda (DNN), (e) deep auto-encoder (DAE), (f) red neuronal recurrente (RNN), (g) máquina restringida de Boltzmann (RBM), (h) red neuronal de creencias profundas (DBN) e (i) red neuronal convolucional (CNN).
Fuente: S. Shalev-Schwartz [1], M. T. Hagan [2] y J. Schmidhuber [3].

El ejemplo más importante y con mayor aplicación de este tipo de ANNs es el multilayer perceptron.

2.1.1. Multilayer perceptron (MLP)

Es una ANN compuesta por múltiples capas de neuronas ubicadas entre la entrada y la salida, conocidas como capas ocultas. La adición estas capas permite incrementar el potencial de la red para solucionar problemas de clasificación y regresión con conjuntos de datos complejos (no lineales y discontinuos). El algoritmo de entrenamiento más extendido para esta red se conoce como backpropagation (BP), que consta de dos etapas: (1) la red es estimulada con una entrada, esta se propaga a través de la ANN desde la primera capa hasta la última, produciendo una salida; (2) la diferencia entre la salida deseada y salida obtenida es usada para ajustar los parámetros de la red empezando desde la última capa, avanzando hacia atrás, hasta la primera capa [2].

2.1.2. Red neuronal de Hopfield

ANN introducida por J. Hopfield que funciona como memoria asociativa, en donde cada neurona se encuentra conectada a las demás neuronas. Durante su entrenamiento, se suministran todos los ejemplos de entrada, y se espera que la red almacene y memorice estos patrones. Una vez entrenada, su capacidad de memoria asociativa es usada para recordar y reconocer los patrones almacenados, aún en presencia de ruido [6].

2.1.3. Self-organizing maps (SOMs)

Los mapas auto-organizados son un tipo de ANN introducido por Kohonen que funciona como método de agrupamiento. Estas redes toman los datos de entrada y los agrupan de acuerdo a su similitud en patrones. Son diseñadas de forma que las neuronas de salida con patrones similares son vecinas [7].

2.2. Deep learning (DL)

El DL toma los fundamentos teóricos de las ANNs clásicas, pero emplea una gran cantidad de neuronas y capas ocultas, junto con nuevos modelos y paradigmas de entrenamiento ofreciendo una capacidad mucho mayor para aprender a adaptarse y extraer características de datos de entrada de alta complejidad [3]. Las ANNs usadas en el DL son conocidas como redes neuronales profundas, en inglés deep neural networks (DNNs).

2.2.1. Deep multilayer perceptron (DMLP)

La red neuronal profunda multicapa perceptron toma la arquitectura de la red MLP, pero emplea un mayor número de neuronas y capas ocultas para solucionar problemas donde los datos de entrada son de alta complejidad. El desarrollo de este tipo de redes se debe a los recientes avances en métodos heurísticos para entrenamiento de grandes arquitecturas y herramientas computacionales (hardware y software) [3].

2.2.2. Deep auto-encoder (DAE)

Las redes DAE son un caso especial de DMLP que poseen dos características principales: (1) emplean el mismo número de neuronas en la entrada y salida, y (2) emplean un menor número de neuronas en las capas ocultas respecto a las usadas en la entrada y salida. Esta arquitectura permite que sus principales aplicaciones sean la extracción y reducción de características, y el pre- entrenamiento de parámetros de DNNs más complejas [8].

2.2.3. Recurrent neural network (RNN)

Las redes neuronales recurrentes poseen una arquitectura donde las conexiones entre neuronas forman un gráfico dirigido a lo largo de una secuencia temporal, lo que les permite ser útiles para analizar datos en series de tiempo, exhibir un comportamiento dinámico, tener una memoria interna y mantener información sobre lo que sucedió en pasos de tiempos anteriores [3]. Estas características hacen que las RNNs sean usadas principalmente en aplicaciones de análisis de texto y de habla. Dentro de este tipo de arquitectura se encuentran las unidades de memoria a largo plazo (long-short term memory units, LSTM) que son especialmente diseñadas para aplicaciones donde se pueden presentar retrasos muy largos y desconocidos entre eventos importantes en la serie de tiempo [9].

2.2.4. Restricted Boltzmann machine (RBM)

La máquina restringida de Boltzmann es una ANN estocástica que puede aprender una distribución probabilística a partir del conjunto de datos de entrada. Su arquitectura consiste en una capa de neuronas visibles y una capa de neuronas ocultas que se conectan entre sí, sin permitir conexiones entre neuronas del mismo tipo de capa. Sus principales aplicaciones son el modelado de relaciones probabilísticas y el pre-entrenamiento de parámetros de DNNs más complejas [10]. Dentro de esta arquitectura se encuentran las redes neuronales de creencias profundas (deep belief networks, DBNs) que se caracterizan porque cada capa oculta sirve de capa visible para la siguiente capa [11].

2.2.5. Convolutional neural network (CNN)

Las redes neuronales convolucionales son inspiradas en la corteza visual, la cual consiste en mapas de campos receptivos locales que responden a los estímulos únicamente en una región del campo visual, y disminuyen a medida que la corteza se mueve hacia adelante; los campos receptivos se superponen de modo que cubren todo el campo visual. Las CNNs toman la arquitectura de la DMLP, pero su principal diferencia es que cada neurona solo se encuentra conectada a un parche local de neuronas de la siguiente capa [12]. Esta arquitectura aprovecha el patrón jerárquico de los datos para ensamblar patrones más complejos usando unos patrones más pequeños y simples. Su nombre indica que la red usa el operador matemático conocido como convolución, que permite realizar operaciones complejas de forma más sencilla. En esta red, los datos de entrada son convolucionados por diferentes filtros convolucionales durante el desplazamiento a través de las neuronas. Los filtros convolucionales comparten los mismos parámetros en cada pequeña porción la red, reduciendo los parámetros del algoritmo. Su principal aplicación son las tareas de visión artificial, como la clasificación y segmentación de imágenes [13].

3. Aplicaciones a la ingeniería biomédica

3.1. Ómica

La ómica, también conocida como bioinformática [14] o biomedicina [15], tiene como objetivo estudiar e investigar los procesos biológicos a nivel molecular con el fin de diagnosticar, predecir y prevenir enfermedades, e involucrar a los pacientes en terapias y tratamientos más eficientes y personalizados. Es un campo de la biomédica de gran extensión, que se divide en diferentes ramas como la genómica, interactómica, metabolómica, metagenómica, proteómica, farmacogenómica, epigenómica, multiómica, lipiodómica, alimentómica, secretómica, glicomica y transcriptómica.

Debido a la gran extensión de la ómica, en la tabla 1 se resumen los más recientes artículos de revisión sobre aplicaciones de ANNs y DL en diferentes ramas de la ómica, resaltando las áreas de revisión documentadas por los autores. A partir de estos artículos de revisión y de la literatura revisada se evidencia que las aplicaciones se concentran principalmente en la genómica, la proteómica, la epigenómica y la farmacogenómica.

La genómica estudia el conjunto completo del ADN y la interacción de los genes entre sí y con el entorno, con el objetivo de identificar alelos genéticos y factores ambientales que constribuyen al desarrollo de enfermedades, como por ejemplo el cáncer. La proteómica y la epigenómica estudian las interacciones proteínicas, y los efectos de los factores ambientales y de los medicamentos en la formación de proteínas. Y la farmacogenómica estudia la respuesta farmacológica de los genes a los medicamentos, con el objetivo de diseñar medicamentos más eficientes para tratamientos personalizados que reduzcan la aparición de efectos secundarios.

Tabla 1.
Artículos de revisión sobre aplicaciones de ANNs y DL en las ramas de la ómica

Fuente: elaboración propia

En la genómica, las ANNs y el DL se han aplicado al diagnóstico de cáncer, la expresión de genes y la secuenciación genómica. Dentro del diagnóstico de cáncer se han desarrollado sistemas para la identificación y extracción de características genéticas presentes en el cáncer [21-22], y sistemas para la detección y clasificación de distintos tipos de cáncer a partir de la expresión genética [23-24] y de la mutación puntual somática en secuencias de ADN [25]. En la expresión de genes, que se refiere al proceso de producción de una proteína a partir de la información codificada en el ADN, se han aplicado a la predicción de la expresión de genes [26, 27, 28] y a la creación de modelos que predicen el resultado del empalme alternativo a partir de la información del ADN en diferentes contextos celulares [29-30]. Dentro de la secuenciación genómica, que es el proceso de determinar el orden preciso de nucleótidos dentro del ADN, las aplicaciones se dividen en la secuenciación del ADN [31, 32, 33] y la metilación del ADN [34-35], que el proceso mediante el cual se agregan grupos de metilo a la mólecula del ADN

La predicción de la estructura de una proteína es crucial para determinar su función y aplicación, por lo tanto, dentro de la proteómica y la epigenómica, se ha investigado en aplicaciones que permiten la predicción de los ángulos de la columna vertebral de la proteína (que permite obtener información sobre la estructura de la proteína) [36, 37, 38], la predicción de la estructura secundaria y terciaria de la proteína [39, 40, 41, 42, 43, 44, 45, 46, 47] la evaluación de la calidad de la proteína [48, 49, 50], y la predicción de las regiones de desórdenes (trastornos) en la estructura de la proteína [51-52].

Las interacciones entre las proteínas y el ADN o ARN juegan un papel importante en diferentes procesos celulares como la transcripción, la replicación, la traducción y la reparación, que tienen objeto de estudio dentro de la farmacogenómica, ya que permiten investigar en el diseño y descubrimiento de medicamentos. Por lo tanto, dentro de la proteómica, la epigenómica y la farmacogenómica, se ha investigado en el uso de redes neuronales y deep learning para la predicción de unión de proteínas al ADN y ARN [53-54], la predicción de la interacción proteína-proteína [55, 56, 57], la predicción de la interacción compuesto-proteína [58- 59], y la predicción de las interacciones farmacológicas, medicamento-objetivo [60, 61, 62].

En tabla 2 se resumen las más recientes aplicaciones a la ómica, donde se especifica la arquitectura de la ANN implementada junto con su respectiva referencia.

3.2. Imagenología

La imagenología es el conjunto de técnicas y procedimientos que permiten obtener imágenes biológicas o médicas del cuerpo humano con el propósito de examinar y diagnosticar enfermedades. La imagenología biológica, o bioimaging en inglés, tiene como objetivo la detección de enfermedades infecciosas, cáncer y condiciones inflamatorias a partir del estudio de las células (citología) y del tejido (histopatología). La imagenología médica tiene como objetivo el estudio de los órganos humanos a partir de imágenes obtenidas por diferentes métodos, como la resonancia magnética (magnetic resonance imaging, MRI), la tomografía computarizada (computed tomography, CT), el ultrasonido, la tomografía por emisión de positrones (positron emission tomography, PET), los rayos X 2D y 3D, entre otros.

Tabla 2.
Aplicaciones a la ómica

En la imagenología, la precisión del diagnóstico depende de: (1) la adquisición y resolución de la imagen y (2) de su interpretación. Los recientes avances en la tecnología han permitido el desarrollo de una amplia gama de equipos y sistemas de adquisición de imágenes de alta resolución. La interpretación, hecha por médicos, está sujeta al error humano y a las diferencias de diagnóstico entre intérpretes. Es por esto que la interpretación de imágenes biológicas y médicas se constituye como un área de investigación potencial donde nuevas metodologías como las ANNs y el DL tienen cabida, permitiendo asistir el dictamen médico y contribuir a un diagnóstico más objetivo y preciso. Esta área de invetigación es conocida como diagnóstico asistido por computador (computer-aided diagnosis, CAD). La principal arquitectura de ANN usada en aplicaciones de CAD son las CNNs debido a su excelente desempeño en tareas de visión computarizada, y reconocimiento y clasificacion de patrones en imágenes [63].

Dentro de la imagenología biológica, las principales aplicaciones de las ANNs y el DL se concentran en el análisis y extracción de características en imágenes histopatológicas para la detección de cáncer, como en el trabajo de P. Khosravi et al [64] donde se demuestra la utilidad de una red convolucional para la clasificación de dos subtipos de cáncer de pulmón, cuatro bio-marcadores de cáncer de vejiga y cinco bio-marcadores de cáncer de mama; y el trabajo de K. Sirinukunwattana et al [65] donde se implementa una CNN para la detección y clasificación de núcleos celulares de adenocarcinomas colorrectales en cuatro clases: epitelial, inflamatorio, fibroplástico y misceláneo, con el objetivo de facilitar el diagnóstico de cáncer de colon. A pesar de estos casos exitosos de aplicación, la literatura consultada refleja un interés particular en el análisis computacional de imágenes histopatológicas para la detección de cáncer de mama, que podría dar lugar en un futuro cercano a nuevas aplicaciones de ANNs [66, 67, 68].

En cuanto a la imagenología médica, las aplicaciones se han encaminado en dos enfoques: (1) la identificación de órganos y partes del cuerpo para asistencia en diferentes procedimientos médicos, y (2) el diagnóstico de distintos tipos de enfermedades. Respecto al primer enfoque, H. Roth et al [69] implementan una red convolucional para el reconocimiento de órganos y partes del cuerpo humano a partir de imágenes de tomografía computarizada con el fin de aplicarlo a la clasificación automática de la anatomía humana, importante pre-requisito de los sistemas de diagnóstico asistido por computador. M. R. Avendi, A. Kheradvar y H. Jafarkhani [70] proponen un sistema compuesto por una CNN y auto-encoders para la detección automática del ventrículo izquierdo del corazón y el reconocimiento de su forma a partir de imágenes de resonancia magnética, con el fin de aplicarlo al cálculo de índices clínicos como el volumen ventricular y la fracción de eyección. J. Yu et al [71] desarrollan una CNN con extreme learning machine (ELM) para la clasificación de los órganos digestivos aplicado a procedimientos de endoscopia por cápsula inalámbrica (wireless capsule endoscopy, WCE), una tecnología no invasiva para la examinación de enfermedades gastrointestinales, donde el principal objetivo de la aplicación es reducir el tiempo de revisión por parte de los médicos. H. Chen et al [72] proponen una CNN para la localización del plano estándar fetal abdominal (fetal abdominal standard plane, FASP) a partir de vídeos de ultrasonido. La localización del FASP es un paso crucial durante las rutinas de ultrasonido para la revisión del feto, y esta aplicación apunta a reducir el tiempo y mejorar la eficiencia de este proceso.

Por otro ldo, algunos ejemplos de aplicaciones de redes neuronles y deep learning para el diagnóstico de enfermedades a partir de imágines médicas se encuentran en los trabajos de : M. Anthimopoulos et al [73] donde se propone una CNN para la clasificación de enfermedades intersticiales de pulmón a partir de imágenes de tomografía computarizada. La red permite la clasificación de imágenes en siete tipos: sano, opacidad de vidrio esmerilado (ground glass opacity, CGO), micro-nódulos, consolidación, reticulación, panal (honeycombing), y una combinación entre CGO y reticulación. J. Shan y L. Li [74] desarrollan un sistema basado en DAE para la detección de micro-aneurismas a partir de fotos a color de la retina (retinografía). Q. Dou et al [75] desarrollan una CNN para la detección automática de micro-hemorragias cerebrales a partir de imágenes de resonancia magnética. D. Nie et al [76] desarrollan un sistema basado en CNNs para extraer características de imágenes cerebrales obtenidas por resonancia magnética para contribuir al diagnóstico de gliomas de alto grado, uno de los tumores cerebrales más agresivos y severos. H. Suk et al [77] proponen un método basado en una RBM para el diagnóstico de Alzheimer a partir de imágenes de la materia gris obtenidas por resonancia magnética y tomografía por emisión de positrones. Y. Cao et al [78] implementan una CNN para la clasificación de diferentes manifestaciones de tuberculosis a partir de imágenes de rayos X. M. van Grinsven et al [79] desarrollan una CNN para la detección de hemorragias en imágenes de fondo de color y propusieron un método de entrenamiento basado en una clasificación dinámica de muestras negativas mal clasificadas para mejorar y acelerar el entrenamiento con aplicaciones al análisis de distintos tipos de imágenes médicas.

3.2.1. Interfaces cerebro-máquina y hombre- máquina

Las interfaces cerebro-máquina y hombre-máquina son una combinación de hardware y software que, a través de las señales eléctricas de la actividad cerebral y muscular, permiten controlar dispositivos externos o diagnosticar enfermedades. Estas interfaces se componen de un sensor, normalmente un electrodo encargado de adquirir las señales de la actividad cerebral o muscular, una etapa de amplificación y filtrado, y un sistema de control [80].

Para el control de dispositivos externos, las ANNs y el DL han sido aplicados al reconocimiento de patrones de movimiento de las manos a partir de señales superficiales de electromiografía (electromyography, EMG) del antebrazo, con el fin de mejorar el control y funcionalidad de las manos protésicas. Distintos tipos de arquitecturas han sido implementadas para esta aplicación, como CNNs en los trabajos de M. Atzori, M. Cognolato y H. Müller [81] y W. Geng et al [82], DNNs en el trabajo de C. Li et al [83] y MLPs en los trabajos de K. Vonsevych et al [84], C. Calderon-Cordova et al [85] y M. R. Pambudi, R. Sigit and T. Harnoso [86].

Sin embargo, el control de dispositivos externos y de interfaces hombre-máquina no se ha restringido al uso de señales de electromiografía, sino que se han desarrollado aplicaciones que involucran distintos tipos de entradas y arquitecturas de ANNs. Algunos ejemplos se encuentran en los trabajos de: M. Poggi y S. Mattocia [87] donde se desarrolla un dispositivo compuesto por una CNN, una cámara RGBD y una placa CPU, para guiar personas con discapacidades visuales, permitiendo detectar obstáculos en tiempo real y obtener información acerca del entorno a través de mensajes de audio. J. Huang et al [88] proponen un sistema para mejorar la comunicación de personas sordomudas basado en DNNs para el reconocimiento e interpretación del lenguaje de señas usando el método real-sense, que toma las coordenadas en 3D de las articulaciones de los dedos y detecta el movimiento de manera más natural que otros métodos, como el Kinect o el uso de guantes con sensores. P. Pouladzadeh et al [89] y P. Kuhad, A. Yassine Y S. Shimohammadi [90] proponen un sistema para la medición de calorías con el objetivo de ayudar a pacientes y médicos en la prevención de enfermedades relaciones con la dieta, como la obesidad. El sistema usa una cámara para detectar la comida, reconocerla y clasificarla de acuerdo a una base de datos previamente cargada. Para determinar las calorías usa dos aproximaciones: (1) basado en la comparación del alimento con el tamaño del dedo, y (2) usando una estimación de distancia entre el móvil y la comida. Sri- ngernyuang, C., et al [91] desarrollan un sistema de monitoreo y alarma para prevenir la caída de pacientes en camilla a través de una ANN que reconocía 5 diferentes patrones del paciente en la camilla: sentado dentro de la camilla, supino, lateral derecha, lateral izquierda, sentado a los lados, y en las esquinas.

En cuanto a las aplicaciones para el diagnóstico de enfermedades usando señales eléctricas de la actividad cerebral o muscular, T. J. Hong et al [92] trabajan en un sistema basado en una CNN y una red recurrente LSTM para el diagnóstico automático de la enfermedad de arteria coronaria por medio de señales de electrocardiograma (ECG). U. Rajendra et al [93] implementan una CNN para la detección automática del infarto de miocardio a partir de señales ECG. J. T. Turner et al [94] proponen diferentes algoritmos de ML basados en DNNs para la detección de trastornos convulsivos por medio de señales de electroencefalografía (EEG). Y. Zhao and L. He [95] proponen un sistema basado en una RBM, máquinas de soporte vectorial y un método de aprendizaje incremental para el diagnóstico de las etapas tempranas de Alzheimer por medio de señales EEG. U. Rajendra et al [96] proponen un método basado en una CNN para la detección de depresión usando señales EEG con miras a extender la investigación al diagnóstico de las diferentes etapas de la depresión y el desarrollo del índice de severidad de la depresión (depression severity index, DSI). L. Fraiwan y K. Lweesy [97] implementan en un sistema basado en DAE y señales EEG en el dominio del tiempo y la frecuencia, para la identificación del estado del sueño de los neonatos, el cual permite el diagnóstico de posibles desórdenes fisiológicos en los recién nacidos. Y. I. Al Mashhdany and M. K. Awsaj [98] trabajan en la aplicación de RNNs para el diagnóstico de enfermedades musculares a partir de señales de EMG como el síndrome de túnel carpiano.

3.2.2. Gestión y administración de la salud pública

La gestión y administración de la salud pública tiene como objetivo prolongar la vida humana y promover el cuidado de la salud por medio del análisis de la propagación de enfermedades y su relación con factores ambientales y sociales. Su campo de aplicación se extiende desde pequeñas poblaciones localizadas o conjuntos de personas pertenecientes a una determinada institución médica, hasta largas poblaciones que abarcan varios continentes.

Este campo de la ingeniería biomédica maneja grandes conjuntos de datos y modelos altamente complejos que involucran conocimientos derivados de la física, la química y la biología. El potencial de las ANNs y DL dentro de esta rama se establece en el manejo rápido y eficiente de la información para fines de clasificación, predicción, reconocimiento de patrones y modelado de interacciones. Las principales aplicaciones del ML a la gestión y administración de la salud pública se concentran en la vigilancia de enfermedades, epidemias y pandemias, el modelado y análisis de enfermedades asociadas a hábitos, estilos de vida, factores sociales y ambientales, el monitoreo y predicción de la calidad del aire, la vigilancia en la seguridad de los medicamentos, entre otros.

Los sistemas de información médica en hospitales modernos e instituciones médicas crecen exponencialmente, generando dificultad en la extracción de información útil. Los medios manuales y convencionales de revisión han quedado obsoletos por su ineficiencia y se han visto reemplazados por métodos de análisis computacionales. Las ANNs y el DL son métodos potenciales a usar en este campo para incrementar la precisión de diagnósticos, reducir costos y recursos humanos. N. S. El Jerjawi y S. S. Abu-Naser [99], S. Srivastava et al [100] y P. Rahimloo y A. Jafarian [101] proponen sistemas basados en MLP con diferentes algoritmos de aprendizaje, como Levenberg-Marquadt, backpropagation y métodos de regresión, para el diagnóstico de diabetes mellitus tipo II (DMT2) a partir de datos suministrados por instituciones de salud como: número de embarazos, concentración de glucosa en plasma, presión arterial, grosor del pliegue de la piel del tríceps, insulina sérica, índice de masa corporal, función pedigrí de diabetes y edad. Estos sistemas permiten la clasificación de los pacientes en tres categorías: sano, pre-diabetes y diabetes.

Dentro del modelado de enfermedades asociadas a hábitos y estilos de vida se han desarrollado metodologías basadas en ML para el análisis de la información contenida en redes sociales. L. Zhao et al [102] proponen un método de epidemiología computacional basado en DNNs y aprendizaje semi- supervisado para hacer seguimiento a enfermedades infecciosas, como influenza y Ebola, a partir de las redes sociales, específicamente de Twitter. B. Zou et al [103] investigan el uso del contenido de las redes sociales, específicamente de Twitter, para detectar y cuantificar enfermedades intestinales contagiosas, como campilobacteriosis, norovirus e intoxicación por ingesta de comida, usando una aproximación de DL. Los resultados mostraron que la información de Twitter puede servir de complemento para los métodos convencionales de vigilancia de enfermedades intestinales. V. R. K. Garimella, A. Alfayad y I. Weber [104] investigan el uso de imágenes publicadas por usuarios de redes sociales, como Twitter e Instagram, para detectar estilos de vida y hábitos que contribuyen al desarrollado de enfermedades como la obesidad, el alcoholismo y el tabaquismo. Para ello usaron un algoritmo de DL para analizar y categorizar las imágenes publicadas y detectar comportamientos como el consumo excesivo de alcohol, el consumo de sustancias nocivas, y la ingesta de comida no saludable. N. Phan et al [105] proponen un método basado en RBM con algoritmos de aprendizaje de BP y divergencia contrastante, para predecir el nivel de actividad física de los usuarios de una red social a partir de factores como la auto-motivación, las influencias sociales y los eventos ambientales, que permitiera prevenir la obesidad y contribuir al bienestar.

Una de las áreas de la salud pública donde las ANNs y el DL han sido exitosos es en el monitoreo de la calidad del aire y la predicción de los contaminantes presentes en este. La mala calidad del aire es una de las principales causas de enfermedades crónicas pulmonares, y responsable de una gran cantidad de muertes prematuras a nivel mundial [106]. M. R. Delavar et al [107] proponen varios métodos de ML para determinar los modelos de predicción de la contaminación del aire de la ciudad de Teherán atribuida al material particulado PM10 y PM2.5 basados en máquinas de soporte vectorial, ANNs y DL.

El método que permite alcanzar una mayor confiabilidad en los resultados fue el DL, por medio de una red neuronal no lineal auto-regresiva (auto-regressive non-linear neural network, ARNNN). M. Blagojevic et al [108] proponen una MLP con un algoritmo de aprendizaje basado en BP para la clasificación del nivel de contaminación del aire en el distrito Moravica en Serbia, a través de datos como: municipio, sitio, año, niveles de hollín, dióxido de sulfuro (SO2), dióxido de nitrógeno (NO2) y material particulado. X. Feng et al [109] proponen un modelo híbrido que combina el análisis de la trayectoria de la masa de aire y la transformada wavelet para mejorar la precisión de una red MLP para el pronóstico de las concentraciones de material particulado (PM2.5).

El modelo propuesto se implementa en 13 estaciones de monitoreo en Bejing, Tianjin y la provincia de Hebei, y los resultados exhiben una mejora en el pronóstico que permite que este modelo tenga potencial de aplicación en otras estaciones de monitoreo en diferentes países. B. T. Ong, K. Sugiura y K. Zettsu [106] desarrollan un sistema basado en una RNN junto con un método de entrenamiento en series de tiempo con auto-encoders para predecir la concentración del material particulado (PM2.5) del aire de Japón a partir de mediciones capturadas en cerca de 52 ciudades. El sistema implementado se contrasta con el sistema de predicción VENUS (Visual Atmospheric Environment Utility System) del Instituto Nacional de Estudios Ambientales de Japón, donde los resultados experimentales muestran que el sistema propuesto logra mejorar el nivel de precisión de las predicciones de la concentración de PM2.5 informadas en Japón.

4. Discusiones

En este trabajo se realizó la revisión de un total de 96 artículos de aplicación de las ANNs y el DL a la ingeniería biomédica, distribuidos así: 49 artículos en el campo de la ómica, 17 en imagenología, 19 en interfaces cerebro-máquina y hombre-máquina, y 11 en gestión y administración de la salud pública. Teniendo en cuenta esta división por campos de aplicación, en la figura 5 se muestra la distribucion porcentual de las arquitecturas de ANN y DL en la literatura revisada.

La figura 5 permite evidenciar que las redes neuronales convolucionales (CNN) son la arquitectura preferida en las aplicaciones a la ingeniería biomédica, especialmente en la rama de la imagenología. Esta preferencia se debe a la gran capacidad de este tipo de arquitectura para realizar tareas de visión artificial, como el reconocimiento de patrones y la extracción de características en imágenes, lo cual les permite servir como una metodología potencial para el apoyo al personal médico en el diagnóstico de enfermedades. Sin embargo, su potencial no se encuentra restringido únicamente a la visión artificial, sino que se extiende a todas las aplicaciones donde se deben realizar segmentaciones en los conjuntos de datos de entrada. Las CNNs requieren de cierto nivel de experticia en el diseño y manejo de ANNs ya que pueden resultar difícil de configurar debido al vasto número de parámetros, como: los filtros de convolución, el número de capas y el número de neuronas de convolución, de clasificación y de reducción de muestreo.

A pesar de los resultados satisfactorios y del éxito de las ANNs y el DL en las aplicaciones a la ingeniería biomédica, existen limitaciones y dificultades entre las que se pueden destacar:

Normalmente las ANNs y el DL requieren grandes conjuntos de datos e información para su entrenamiento. La información clínica de instituciones y largas poblaciones, datos de pacientes, señales de la actividad cerebral y muscular, imágenes médicas y biológicas, entre otros datos médicos, pueden resultar costosos y difíciles de obtener. Este requerimiento se está volviendo cada vez más crítico ya que se están alzando barreras en la adquisición de datos por cuestiones de privacidad, y únicamente en la medida en que la información se vuelva más accesible los algoritmos podrán evolucionar.
Un problema común que surge durante el entrenamiento de las ANNs es el sobreajuste (overfitting). El sobreajuste ocurre cuando el error de la red para el conjunto de entrenamiento es muy bajo, pero al presentársele nueva información (conjuntos de prueba) el error es muy alto. Esto quiere decir que la red memorizó los datos de entrenamiento, pero fue incapaz de aprender a generalizar en nuevas situaciones. Para lidiar con el riesgo de sobreajuste es necesario tener un buen conjunto de datos (entrenamiento, prueba y validación), realizar una correcta selección del número de parámetros de la red, y en algunas ocasiones recurrir a métodos de regularización, especialmente cuando se trabaja con DNNs [110]; todo esto implica experticia en ciencias computacionales y desarrollo de ANNs.

Figura 5.
Distribución porcentual de las arquitecturas de redes usadas en la literatura revisada.

La selección de la arquitectura de la ANN más apropiada para una determinada aplicación no es una tarea sencilla, así como la elección del número de capas ocultas y de neuronas en cada capa. Adicionalmente, cada vez son más las arquitecturas son propuestas, ampliando el panorama de selección. Todo esto ha llevado a que algunos investigadores usen las ANNs como cajas negras, sin saber por qué pueden proporcionar buenos resultados en una determinada aplicación o cómo modificarlas en caso de que el resultado no sea satisfactorio. Por lo tanto, al igual que en el numeral anterior, se requiere de experticia en ciencias computaciones y diseño de ANNs.
En algunas ramas de la ingeniería biomédica se requieren de fuertes conocimientos teóricos en biología, medicina, e incluso química, especialmente en las ramas de la ómica y la imagenología. Por lo tanto, el diseño e implementación de ANNs y DL en este tipo ramas requiere de grupos interdisciplinares que permitan contribuir a la correcta interpretabilidad de los resultados obtenidos.

5. Conclusiones

En los últimos años las ANNs y el DL han sido aplicados a la resolución de diversos problemas de ingeniería, no siendo la ingeniería biomédica una excepción. Estos potentes modelos de algoritmos computacionales poseen aplicaciones en todas las ramas de la ingeniería biomédica, desde aquellas que se dedican a la investigación y estudio de las estructuras de ADN y los procesos moleculares, como la ómica, hasta aquellas que se extienden a conjuntos de personas y largas poblaciones, como la gestión y administración de la salud pública. El potencial de las ANNs y DL en la ingeniería biomédica se encuentra en la capacidad para manejar grandes conjuntos de datos, reconocer patrones, extraer características, clasificar y predecir comportamientos.

En este trabajo de investigación se mostraron las más recientes e importantes aplicaciones de las ANNs y el DL a la ingeniería biomédica en las áreas de la ómica, la imagenología, las interfaces cerebro-máquina y hombre- máquina, y la gestión y administración de la salud pública. Dentro de la ómica las principales aplicaciones se concentran en la predicción de la expresión genética y el modelado y predicción de las estructuras proteínicas, con el fin de diagnosticar enfermedades como el cáncer, descubrir factores que contribuyen al desarrollo de ciertas enfermedades, y desarrollar medicamentos más eficientes. En la imagenología, los trabajos se han concentran en el diagnóstico asistido por computador, donde los sistemas compuestos por ANNs se encargan de reconocer y clasificar patrones de distintos tipos de imágenes biológicas y médicas para contribuir al personal médico en diagnósticos más rápidos, objetivos, precisos y eficientes. En las interfaces cerebro-máquina y hombre-máquina las principales aplicaciones tienen como fin el control de dispositivos externos, como prótesis o dispositivos de asistencia para personas discapacitadas, y el diagnóstico de enfermedades, usando señales eléctricas de la actividad cerebral y muscular. Y en la gestión y administración de la salud pública, las principales aplicaciones han sido dirigidas hacia el desarrollo de sistemas para el seguimiento y modelado de enfermedades asociadas a hábitos y estilos de visa usando información contenida en redes sociales, y el monitoreo y predicción de la calidad del aire.

Las aplicaciones y literatura revisadas en este trabajo evidencian una tendencia que se mueve del uso de arquitecturas de ANNs convencionales hacia arquitecturas de DNNs, siendo de preferencia las redes convolucionales (CNNs). La gran capacidad para la visión artificial de las CNNs ha permitido su aplicación a la ingeniería biomédica, ya que gran parte del ejercicio de esta se centra en el análisis de diferentes tipos de imágenes médicas.

Material suplementario

Información adicional

Como citar: J. L. Sarmiento-Ramos, “Aplicaciones de las redes neuronales y el deep learning a la ingeniería biomédica,” Rev. UIS Ing., vol. 19, no. 4, pp. 1-18, 2020, doi: https://doi.org/10.18273/revuin.v19n4-2020001

Referencias

[1] S. Shalev-Schwartz, S. Ben-David.K.C, Understanding Machine Learning: From Theory to Algorithms. NY, USA: Cambridge University Press, 2014.

[2] M. T. Hagan et al, Neural Network Design (2^nd Edition). USA: Oklahoma State University, 2014.

[3] J. Schmidhuber, “Deep learning in neural networks: An overview”, Neural Networks, vol. 61, pp. 85-117, 2015, doi:10.1016/j.neunet.2014.09.003

[4] H. S. Wolff, Biomedical Engineering. NY, USA: McGraw-Hill, 1970.

[5] F. Rosenblatt, “The Perceptron: A probabilistic model for information storage and organization in the brain”, Psychological Review, vol. 65, no. 6, pp. 386-408, 1958, doi:10.1037/h0042519

[6] J. J. Hopfield, “Neural networks and physical systems with emergent collective computational abilities”, en Proceedings of the National Academy of Sciences, 1982, pp. 2254-2558, doi:10.1073/pnas.79.8.2554

[7] T. Kohonen, Self-Organizing Maps. Berlin, Germany: Springer Series in Informatic Sciences, 1991.

[8] G. E. Hinton y R. R. Salakhutdinov, “Reducing the Dimensionality of Data with Neural Networks”, Science, vol. 313, no. 5786, pp. 504-507, 2006, doi:10.1126/science.1127647

[9] S. Hochreiter y J. Schmidhuber, “Long Short-Term Memory”, Neural Computation, vol. 9, no. 8 pp. 1735- 1780, 1997, doi: 10.1162/neco.1997.9.8.1735

[10] N. Zhang et al, “An overview on Restricted Boltzmann Machines”, Neurocomputing, vol. 275, pp. 1186-1199, 2018, doi: 10.1016/j.neucom.2017.09.065

[11] G. E. Hinton, S. Osindero, Y. W. Teh, “A fast learning algorithm for deep belief nets”, Neural Computing, vol. 18, no. 7 pp. 1527-1554, 2008, doi: 10.1162/neco.2006.18.7.1527

[12] M. D. Zeiler y R. Fergus, “Visualizing and Understanding Convolutional Networks”, en European Conference on Computer Vision, 2014, pp. 818-833, doi: 10.1007/978-3-319-10590-1_53

[13] A. Krizhevsky, I. Sutskever, y G. E. Hinton, “ImageNet Classification with Deep Convolutional Neural Networks”, en Proceedings of the 25^th International Conference on Neural Information Processing Systems, Lake Tahoe, Nevada, 2012, pp. 1097-1105, doi: 10.1145/3065386

[14] D. Ravi et al, “Deep Learning in Health Informatics”, IEEE Journal of Biomedical and Health Informatics, vol. 21, no. 1, pp. 4-21, 2017, doi: 10.1109/JBHI.2016.2636665

[15] P. Mamoshina et al, “Applications of Deep Learning in Biomedicine”, Mol. Pharmaceutics, vol. 13, no. 5, pp. 1445-1454, 2016, doi: 10.1021/acs.molpharmaceut.5b00982

[16] A. Nath, P. Kumari, y R. Chaube, “Prediction of Human Drug Targets and Their Interactions Using Machine Learning Methods: Current and Future Perspectives”, Methods in molecular biology, vol. 1762, pp. 21-30, 2018, doi: 10.1007/978-1-4939-7756-7_2

[17] Y. Xiong et al, “Survey of Computational Approaches for Prediction of DNA-Binding Residues on Protein Surfaces”, Methods in molecular biology, vol. 1754, pp. 223-234, 2018, doi: 10.1007/978-1-4939- 7717-8_13

[18] A. Shehu, D. Barbará, K. Molloy, “A Survey of Computational Methods for Protein Function Prediction”, en Dig Data Analytics in Genomics, Springer, 2016, pp. 225-298, doi: 10.1007/978-3-319- 41279-5_7

[19] M. K. K. Leung et al, “Machine Learning in Genomic Medicine: A Review of Computational Problems and Data Sets”, en Proceedings of the IEEE, 2016, pp. 176-197, doi: 10.1109/JPROC.2015.2494198

[20] M. W. Libbrecht y W. S. Noble, “Machine learning applications in genetics and genomics”, Nature Reviews Genetics, vol. 16, no. 6, pp. 321-332, 2015, doi: 10.1038/nrg3920

[21] Y. Yuan et al, “DeepGene: an advanced cancer type classifier based on deep learning and somatic point mutations”, BMC Bioinformatics, vol. 17, no. 17, pp. 243-256, 2016, doi: 10.1186/s12859-016-1334-9

22] M. Khademi y N. S. Nedialko, “Probabilistic Graphical Models and Deep Belief Networks for Prognosis of Breast Cancer”, en 2015 IEEE 14th International Conference on Machine Learning and Applications, Miami, FL, 2015, pp. 727-732, doi: 10.1109/ICMLA.2015.196

[23] R. Fakoor et al, “Using deep learning to enhance cancer diagnosis and classification”, en The 30th International Conference on Machine Learning, Atlanta, GA, 2013.

[24] R. Ibrahim et al, “Multi-level gene/MiRNA feature selection using deep belief nets and active learning”, en 36th Annual International Conference of the IEEE Engineering in Medicine and Biology Society, 2014, pp. 3957-3960, doi: 10.1109/EMBC.2014.6944490

[25] P. Danaee, R. Ghaeini, y D. A. Hendrix, “A deep learning approach for cancer detection and relevent gene identification”, en Proceedings of the Pacific Symposium on Biocomputing, 2017, pp. 219-229, doi: 10.1142/9789813207813_0022

26] M. Frasca y G. Pavesi, “A Neural Network Based Algorithm for Gene Expression Prediction from Chromatin Structure”, en The 2013 Itnernational Joint Conference on Neural Networks, Dallas, TX, 2013, doi: 10.1109/IJCNN.2013.6706954

[27] R. Singh et al, “DeepChrome: deep-learning for predicting gene expression from histone modifications”, Bioinformatics, vol. 32, no. 17, pp. i639-i648, 2016, doi: 10.1093/bioinformatics/btw427

[28] R. Xie et al, “A deep auto-encoder model for gene expression prediction”, BMC Genomics, vol. 18, no. 9, pp. 39-49, 2017, doi: 10.1186/s12864-017-4226-0

[29] T. Lee y S. Yoon, “Boosted Categorical Restricted Boltzmann Machine for Computational Prediction of Splice Junctions”, en Proceedings of the 32nd Inernational Conference on Machine Learning, Lille, 2015, pp. 2483-2492.

[30] M. K. K. Leung et al, “Deep learning of the tissue- regulated splicing code”, Bioinformatics, vol. 30, no. 12, pp. i121-i129, 2014, doi: 10.1093/bioinformatics/btu277

[31] D. R. Kelley, J. Snoek, y J. L. Rinn, “Basset: learning the regulatory code of the accessible genome with deep convolutional neural networks”, Genome Research, vol. 26, no. 7, pp. 900-999, 2016, doi: 10.1101/gr.200535.115

[32] J. Zhou y O. G. Trovanskava, “Predicting effects of noncoding variants with deep learning-based sequence model”, Nature Methods, vol. 12, no. 10, pp. 931-934, 2015, doi: 10.1038/nmeth.3547

[33] D. Quang y X. Xie, “DanQ: a hybrid convolutional and recurrent deep neural network for quantifying the function of DNA sequences”, Nucleic Acids Research, vol. 44, no. 11, pp. e107-e112, 2016, doi: 10.1093/nar/gkw226

[34] H. Zeng y D. K. Gifford, “Predicting the impact of non-coding variants on DNA methylation”, Nucleic Acids Research, vol. 45, no. 11, pp. e99-e109, 2017, doi: 10.1093/nar/gkx177

[35] C. Angemueller et al, “DeepCpG: accurate prediction of single-cell DNA methylation states using deep learning”, Genome Biology, vol. 18, no. 1, 2017, doi: 10.1186/s13059-017-1189-z

[36] C. Fang, Y. Shang, y D. Xu, “Prediction of Protein Backbone Torsion Angles Using Deep Residual Inception Neural Networks”, IEEE/AC, Transactions on Computational Biology and Bioinformatics, vol. 16, no. 3, pp. 1020-1028, 2018, doi: 10.1109/TCBB.2018.2814586

[37] Y. Gao et al, “RaptorX-Angle: real-value prediction of protein backbone dihedral angles through a hybrid method of clustering and deep learning”, BMC Bioinformatics, vol. 19, no. 100, 2018, doi: 10.1186/s12859-018-2065-x

[38] H. Li et al, “Deep learning methods for protein torsion angles prediction”, BMC Bioinformatics, vol. 18, no. 1, 2017, doi: 10.1186/s12859-017-1834-2

[39] L. T. Hattori, C. M. Vargas Benítez, y H. Silvéiro Lopes, “A Deep Bidirectional Long Short-Term Memory Approach Applied to the Protein Secondary Structure Prediction Problem”, en 2017 IEEE Latin American Conference on Computational Intelligence, Arequipa, 2017, pp. 66-71, doi: 10.1109/la-cci.2017.8285678

[40] C. Fang, Y. Shang, y D. Xu, “A New Deep Neighbor Residual Network For Protein Secondary Structure Prediction”, en 2017 International Conference on Tools with Artificial Intelligence, Boston, MA, 2017, pp. 66-71, doi: 10.1109/ictai.2017.00022

[41] Y. Hu et al, “Sequence Translating Model Using Deep Neural Block Cascade Network: Taking Protein Secondary Structure Prediction as An Example”, en 2018 IEEE International Conference on Big Data and Smart Computing, Shangai, 2018, pp. 58-65, doi: 10.1109/BigComp.2018.00018

[42] Y. Liu, “Protein Secondary Structure Prediction Based on Two Dimensional Deep Convolutional Neural Networks”, en 2017 3rd IEEE Internationl Conference on Computer and Communications, Chengdu, 2017, pp. 1995-1999, doi: 10.1109/CompComm.2017.8322886

[43] Y. Chen, “Long sequence feature extraction based on deep learning neural network for protein secondary structure prediction”, en 2017 IEEE 3rd Information Technology and Mechatronics Engineering Conference, Chongqing, 2017, pp. 843-847, doi: 10.1109/ITOEC.2017.8122472

44] W. Ibrahim y M. S. Abadeh, “Protein fold recognition using Deep Kernelized Extreme Learning Machine and linear discriminant analysis”, Neural Computing and Applications, vol. 31, no. 8, pp. 4201- 4214, 2018, doi: 10.1007/s00521-018-3346-z

[45] L. Bai y L. Yang, “A Unified Deep Learning Model for Protein Structure Prediction”, en 2017 3rd IEEE International Conference on Cybernetics, Exeter, 2017, pp. 1-6, doi: 10.1109/cybconf.2017.7985752

[46] L. Deng, C. Fan, y Z. Zeng, “A sparse autoencoder- based deep neural network for protein solvent accessibility and contact number prediction”, BMC Bioinformatics, vol. 18, no. S6, pp. 211-220, 2017, doi: 10.1186/s12859-017-1971-7

47] H. Li, Q. Lyu y J. Cheng, “A Template-Based Protein Structure Reconstruction Method Uswing Deep Autoencoder Learning”, Journal of Proteomics and Bioinformatics, vol. 9, no. 12, pp. 306-313, 2016, doi: 10.4172/jpb.1000419

[48]S. P. Nguyen, Z. Li, y Y. Shang, “Deep Networks and Continuous Distributed Representation of Protein Sequences for Protein Quality Assessment”, en 2017 International Conference on Tools with Artificial Intelligence, 2017, pp. 527-534, doi: 10.1109/ICTAI.2017.00086

[49] S. P. Nguyen, Y. Shang, y D. Xu, “DL-PRO: A Novel Deep Learning Method for Protein Model Quality Assessment”, en 2014 International Joint Conference on Neural Networks, Beijing, 2014, pp. 2071-2078, doi: 10.1109/IJCNN.2014.6889891

[50] J. Wang, Z. Li y Y. Shang, “New Deep Neural Networks for Protein Model Evaluation”, en 2017 IEEE 29th International Conference on Tools with Artificial Intelligence, Boston, MA, 2017, pp. 309-313, doi: 10.1109/ICTAI.2017.00056

[51] S. P. Nguyen et al, “New Deep Learning Methods for Protein Loop Modeling”, IEEE/ACM Transactions on Computational Biology and Bioinformatics, vol. 16, no. 2, pp. 596-606, 2019, doi: 10.1109/TCBB.2017.2784434

[52] J. Eickholt y J. Cheng, “DNdisorder: predicting protein disorder using boosting and deep networks”, BMC Bioinformatics, vol. 14, no. 1, pp. 88-98, 2013, doi: 10.1186/1471-2105-14-88

[53] H. Zeng et al, “Convolutional Neural Network Architectures for Predicting DNA-Protein Binding”, Bioinformatics, vol. 32, pp. i121-i127, 2016, doi: 10.1093/bioinformatics/btw255

[54] I. Haberal y H. Ogul, “DeepMBS: Prediction of Protein Metal Binding-Site Using Deep Learning Methods”, en 2017 Fourth International Conference on Mathematics and Computers in Sciences and in Industry, Corfu, 2017, pp. 21-25, doi: 10.1109/MCSI.2017.13

[55] L. Huang et al, “Protein-Protein Interactions Prediction via Multimodal Deep Polynomial Network and Regularized Extreme Learning Machine”, IEEE Journal of Biomedical and Health Informatics, vol. 23, no. 3, pp. 1290-1303, 2019, doi: 10.1109/JBHI.2018.2845866

[56] L. Huang, L. Liao, y C. H. Wu, “Completing sparse and disconnected protein-protein network by deep learning”, BMC Bioinformatics, vol. 19, no.1, pp. 103- 115, 2018, doi: 10.1186/s12859-018-2112-7

[57] Z. Zhao y X. Gong, “Protein-Protein Interaction Interface Residue Pair Prediction Based on Deep Learning Architecture”, IEEE/ACM Transactions on Computational Biology and Bioinformatics, vol. 16, no. 5, pp. 1753-1759, 2017, doi: 10.1109/TCBB.2017.2706682

[58] M. Hamanaka et al, “CGBVS-DNN: Prediction of Compund-protein Interactions Based on Deep Learning”, Molecular Informatics, vol. 36, no. 1, 2016, doi: 10.1002/minf.201600045

[59] K. Tian et al, “Boosting compound- protein interaction prediction by deep learning”, Methods, vol. 110, pp. 64-72, 2016, doi: 10.1016/j.ymeth.2016.06.024

[60] L. Wang et al, “A Computational-Based Method for Predicting Drug-Target Interactions by Using Stacked Autoencoder Deep Neural Network”, Journal of Computational Biology, vol. 25, no. 3, pp. 361-373, 2018, doi: 10.1089/cmb.2017.0135

[61] P. Wei, K. C. C. Chan, y Z. You, “Large-scale prediction of drug-target interactions from deep representations”, en 2016 International Joint Conference on Neural Networks, Vancouver, 2016, pp. 1236-1243, doi: 10.1109/ijcnn.2016.7727339

[62] M. Bahi y M. Batouche, “Drug-Target Interaction Prediction in Drug Repositioning Based on Deep Semi- Supervised Learning”, en IFIP Advances in Information and Communication Technology , 2018, pp. 302-313, doi: 10.1007/978-3-319-89743-1_27

[63] H. Greenspan, B. van Ginneken, y R. M. Summers, “Guest Editorial Deep Learning in Medical Imaging: Overview and Future Promise of an Exciting New Technique”, IEEE Transactions on Medical Imagig, vol. 35, no. 5, pp. 1153-1159, 2016, doi: 10.1109/TMI.2016.2553401

[64] P. Khosravi et al, “Deep Convolutional Neural Networks Enable Discrimination of Heterogeneous Digital Pathology Images”, EBioMedice, vol. 27, pp. 317-328, 2018, doi: 10.1016/j.ebiom.2017.12.026

[65] K. Sirinukunwattana et al, “Locality Sensitive Deep Learning for Detection and Classification of Nuclei in Routine Colon Cancer Histology Images”, IEEE Transactions on Medical Imaging, vol. 35, no. 5, pp. 1196-1206, 2016, doi: 10.1109/TMI.2016.2525803

[66] J. Chen et al, “Computer-aided prognosis on breast cancer with hematoxylin and eosin histopathology images: A review”, Tumor Biology, vol. 39, no. 3, pp. 1- 12, 2017, doi: 10.1177/1010428317694550

[67] M. A. Aswathy y M. Jagannath, “Detection of breast cancer on digital histopathology images: Present status and future possibilities”, Informatics in Medicine Unlockes, vol. 8, pp. 74-79, 2017, doi: 10.1016/j.imu.2016.11.001

[68] Z. Gandomkar, P. Brennan, y C. Mello-Thoms, “Computer-based image analysis in breast pathology”, Journal of Pathology Informatics, vol. 7, no. 43, 2016, doi: 10.4103/2153-3539.192814.

[69] H. R. Roth et al, “Anatomy-specific classification of medical images using deep convolutional nets”, en 2015 IEEE 12th International Symposium on Biomedical Imaging, 2015, pp. 101-104, doi: 10.1109/ISBI.2015.7163826

[70] M. R. Avendi, A. Kheradvar, y H. Jafarkhani, “A combined deep-learning and deformable-model approach to fully automatic segmentation of the left ventricle in cardia MRI”, Medical Image Analysis, vol. 30, pp. 108-119, 2016, doi: 10.1016/j.media.2016.01.005

[71] J. Yu et al, “A hybrid convolutional neural networks with extreme learning machine for WCE image classification”, en 2015 IEEE International Conference on Robotics and Biomimetics, Zhuhai, 2015, pp. 1822- 1827, doi: 10.1109/ROBIO.2015.7419037

[72] H. Chen et al, “Standard Plane Localization in Fetal Ultrasound via Domain Transferred Deep Neural Networks”, IEEE Journal of Biomedical and Health Informatics, vol. 19, no. 5, pp. 1627-1636, 2015, doi: 10.1109/JBHI.2015.2425041

[73] M. Anthimopoulus et al, “Lung Pattern Classification for Interstitial Lung Diseases Using a Deep Convolutional Neural Network”, IEEE Transactions on Medical Imaging, vol. 35, no. 5, pp. 1207-1216, 2016, doi: 10.1109/TMI.2016.2535865

[74] J. Shan y L. Li, “A Deep Learning Method for Microaneurysm Detection in Fundus Images”, en 2016 IEEE First International Conference on Connected Health: Applications, Systems and Engineering Technologies, Washington, DC, 2016, pp. 357-358, doi: 10.1109/chase.2016.12.

[75] Q. Dou et al, “Automatic Detection of Cerebral Microbleeds From MR Images via 3D Convolutional Neural Networks”, IEEE Transactions on Medical Imaging, vol. 35, no. 5, pp. 1182-1195, 2016, doi: 10.1109/TMI.2016.2528129

[76] D. Nie et al, “3D Deep Learning for Multi-modal Imaging-Guided Survival Time Prediction of Brain Tumor Patients”, Med. Image Comput. Comput. Assist. Interv., vol. 9901, pp. 212-220, 2016, doi: 10.1007/978- 3-319-46723-8_25

[77] H. Suet et al, “Hiearchical feature representation and multimodal fusion with deep learning for AD/MCI diagnosis”, NeuroImage, vol. 101, pp. 569-582, 2014, doi: 10.1016/j.neuroimage.2014.06.077

[78] Y. Cao et al, “Improving Tuberculosis Diagnostics Using Deep Learning and Mobile Health Technologies among Resource-Poor and Marginalized Communities”, en 2016 IEEE First International Conference on Connected Health: Applications, Systems and Engineering Technologies, Washington, DC, 2016, pp. 274-281, doi: 10.1109/CHASE.2016.18

[79] M. J. J. P. van Grinsven et al, “Fast Convolutional Neural Network Training Using Selective Data Sampling: Application to Hemorrhage Detection in Color Fundus Images”, IEEE Transactions on Medical Imaging, vol. 35, no. 5, pp. 1273-1284, 2016, doi: 10.1109/TMI.2016.2526689

[80] T. C. Major y J. M. Conrad, “A survey of brain computer interfaces and their applications”, en IEEE SOUTHEASTCON 2014, Lexington, KY, 2014, pp. 1-8, doi: 10.1109/SECON.2014.6950751

[81] M. Atzori, M. Cognolato, y H. Müller, “Deep Learning with Convolutional Neural Networks Applied to Electromyography Data: A Resource for the Classifications of Movements for Prosthetics Hands”, Frontiers in Neurorobotics, vol. 10, no. 9, 2016, doi: 10.3389/fnbot.2016.00009

[82] W. Geng et al, “Gesture recognition by instantaneous surface EMG images”, Scientific Reports, vol. 6, no. 1, 2016, doi: 10.1038/srep36571

[83] C. Li et al, “PCA and deep learning based myoelectric grasping control of a prosthetic hand”, BioMedical Engineering OnLine, vol. 17, no. 1, 2018, doi: 10.1186/s12938-018-0539-8

[84] K. Vonsevych et al, “Fingers Movements Control System Based on Artificial Neural Network Model”, Radioelectronics and Communications Systems, vol. 62, no. 1, pp. 23-33, 2019, doi: 10.3103/S0735272719010047

[85] C. Calderón-Cordová et al, “EMG signal patterns recognition based on feedforward Artificial Neural Network applied to robotic prosthesis myoelectric control”, en 2016 Future Technologies Conference, San Francisco, CA, 2017, pp. 868-875, doi: 10.1109/FTC.2016.7821705

[86] M. R. Pambudi, R. Sigit, y T. Harnoso, “The bionic hand movement using myo sensor and neural networks”, en 2016 International Conference on Knowledge Creation and Intelligent Computing, Manado, 2016, pp. 259-264, doi: 10.1109/KCIC.2016.7883656

[87] M. Poggi y S. Mattoccia, “A wearable mobility aid for the visually impaired based on embedded 3D vision and deep learning”, en 2016 IEEE Symposium on Computers and Communication, Messina, 2016, pp. 208- 213, doi: 10.1109/ISCC.2016.7543741

[88] J. Huang et al, “Sign language recognition using real-sense”, en 2015 IEEE China Summit and International Conference on Signal and Information Processing, Chengdu, 2015, pp. 166-170, doi: 10.1109/ChinaSIP.2015.7230384

[89] P. Pouladzadeh et al, “Food calorie measurement using deep learning neural network”, en 2016 IEEE International Instrumentation and Measurement Technology Conference Proceeding, Taipei, 2016, pp. 1- 6, doi: 10.1109/I2MTC.2016.7520547

[90] P. Kuhad, A. Yassine y S. Shimohammadi, “Using distance estimation and deep learning to simplify calibration in food calorie measurement”, en 2015 IEEE International Conference on Computational Intelligence and Virtual Environments for Measurement Systems and Applications, Shenzhen, 2015, pp. 1-6, doi: 10.1109/CIVEMSA.2015.7158594

[91] C. Sri-ngernyuang et al, “Neural Network for On- bed Movement Pattern Recognition”, en The 2018 Biomedical Engineering International Conference, 2018, pp. 1-4, doi: 10.1109/BMEiCON.2018.8609998

[92] J. H. Tan et al, “Application of Stacked Convolutional and Long Short-Term Memory Network for Accurate Identification of CAD ECG Signals”, Computers in Biology and Medicine, vol. 94, pp. 19-26, 2018, doi: 10.1016/j.compbiomed.2017.12.023

[93] U. R. Acharya et al, “Application of deep convolutional neural network for automated detection of myocardial infarction using ECG signals”, Information Sciences, vol. 415, pp. 190-198, 2017, doi: 10.1016/j.ins.2017.06.027

[94] J. T. Turner et al, “Deep Belief Networks used on High Resolution Multichannel Electroencephalography Data for Seizure Detection”, en AAAI Spring Symposium, 2014, pp. 75-81

[95] Y. Zhao y L. He, “Deep Learning in the EEG Diagnosis of Alzheimer’s Disease”, en ACCV Workshops 2014, 2014, pp. 340-353, doi: 10.1007/978-3-319- 16628-5_25

[96] U. R. Acharya et al, “Automated EEG-based Screening of Depression Using Deep Convolutional Neural Network”, Computer Methods and Programs in Biomedicine, vol. 161, pp. 103-113, 2018, doi: 10.1016/j.cmpb.2018.04.012

[97] L. Fraiwan y K. Lweesy, “Neonatal sleep state identification using deep learning autoencoders”, en 2017 IEEE 13th International Colloquium on Signal Processing & its Applications, Batu Ferringhi, 2017, pp. 228-231, doi: 10.1109/CSPA.2017.8064956

[98] Y. I. Al Mashhdany y M. K. Awsaj, “Detection of muscles diseases based on EMG signal by using locally recurrent neural networks (LRNNs) techniques”, International Journal of Engineering & Technology, vol. 7, no. 4, pp. 4850-4855, 2016, doi: 10.14419/ijet.v7i4.25747

[99] N. S. El Jerjawi y S. S. Abu-Naser, “Diabetes Prediction Using Artificial Neural Network”, International Journal of Advanced Science and Technology, vol. 124, pp. 1-10, 2018, doi: 10. 14257/ijast.2018.124.01

[100] S. Srivastava et al, “Precition of Diabetes Using Artificial Neural Network Approach”, Engineering Vibration, Communcication and Information, pp. 679- 687, 2018, doi: 10.1007/978-981-13-1642-5_59

[101] P. Rahimloo y A. Jafarian, “Prediction of Diabetes by Using Artificial Neural Network, Logistic Regression Statistical Model and Combination of Them”, Bulletin de la Société Royale des Sciences de Liége, vol. 85, pp. 1148-1164, 2016.

[102] L. Zhao et al, “SimNest: Social Media Nested Epidemic Simulation via Online Semi-Supervised Deep Learning”, en 2015 IEEE International Conference on Data Mining, Atlantic City, NJ, 2015, pp. 639-648, doi: 10.1109/ICDM.2015.39

[103] B. Zou et al, “On Infectious Intestinal Disease Surveillance using Social Media Content”, en Proceedings of the 6th International Conference on Digital Health, Montreal, 2016, pp. 157-161, doi: 10.1145/2896338.2896372

[104] V. R. K. Garimella, A. Alfayad, y I. Weber, “Social Media Image Analysis for Public Health”, en Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems, San Jose, CA, 2016, pp. 5543-5547, doi: 10.1145/2858036.2858234

[105] N. Phan et al, “Social restricted Boltzmann Machine: Human behavior prediction in health social networks”, en 2015 IEEE/ACM International Conference on Advances in Social Networks and Mining, Paris, 2015, pp. 424-431, doi: 10.1145/2808797.2809307

[106] B. T. Ong, K. Sugiura, y K. Zettsu, “Dynamically pre-trained deep recurrent neural networks using environmental monitoring data for predicting PM2.5”, Neural Computing and Applications, vol. 27, no. 6, pp. 1553-1566, 2015, doi: 10.1007/s00521-015-1955-3

[107] M. R. Delavar et al, “A Novel Method for Improving Air Pollution Prediction Based on Machine Learning Approaches: A Case Study Applied to the Capital City of Theran”, International Journal of Geo- Information, vol. 8, no. 2, pp. 99-119, 2019, doi: 10.3390/ijgi8020099

[108] M. Blagojevic et al, “Artificial neural network model for predicting air pollution. Case study of the Moravica district, Serbia”, Environment Protection Engineering, vol. 44, no. 1, pp. 129-139, 2018, doi: 10.5277/epel80110

[109] X. Feng et al, “Artificial neural networks forecastng of PM2.5 pollution using air mass trajectory based geographic model and wavelet transformation”, Atmospheric Environment, vol. 107, pp. 118-128, 2015, doi: 10.1016/j.atmosenv.2015.02.030

[110] N. Srivastava et al, “Dropout: A Simple Way to Prevent Neural Networks from Overfitting”, Journal of Machine Learning Research, vol. 15, pp. 1929-1958, 2014.

Notas