Machine Learning Aplicado al Diagnóstico Médico

Ximena Bolaños | 30 de abril, 2020

Apoyado por nuestro experto en innovación Vivek Rastogi

Introducción 

Actualmente el mundo se encuentra en una crisis sanitaria y económica debido a la aparición del virus COVID-19. El estilo de vida de las personas ha cambiado completamente. Ya no se puede visitar a los familiares o amigos, ir a la oficina con regularidad, ir de compras o realizar otras actividades de carácter social. Es por esto que los especialista a lo largo del mundo están investigando una forma de atacar la enfermedad para regresar a la normalidad. Gracias al desarrollo de la tecnología, poder de procesamiento, la matemática y la gran cantidad de información disponible, se han diseñado algoritmos y modelos que permiten predecir la probabilidad de contraer una enfermedad.

Machine Learning y las Enfermedades

La aplicación de machine learning en la predicción de enfermedades no es algo reciente o novedoso, dado que antes de la aparición del COVID-19 ya se utilizaba en el estudio de otras enfermedades. Por ejemplo, se puede utilizar machine learning, para predecir si una persona tiene cáncer de mama o no basado en imágenes de ultrasonido o rayos X, como las que se muestran en la Figura 1. Este tipo de problema se podría abordar con aprendizaje supervisado de clasificación ya que se quiere saber si existe cáncer o no (una etiqueta discreta binaria). En el aprendizaje supervisado, el algoritmo de machine learning busca un conjunto de reglas que le permitan deducir características generales de los elementos del grupo con el objetivo de aplicar una misma etiqueta a elementos similares. De esta forma, cuando se le presente al computador una imagen completamente nueva, éste tendrá la capacidad de predecir la etiqueta correcta (por ejemplo, la presencia o no de cáncer) basándose en la “experiencia pasada adquirida”. Como valor agregado, es posible que el algoritmo indique por qué se clasificó la imagen de la forma que se hizo, generando así conocimiento valioso para el experto en la salud. Los modelos de machine learning también podrían mostrar al médico la ubicación de los posibles puntos en donde se encuentra el cáncer de mama en caso de que exista.

 

Screen Shot 2020-04-30 at 10.27.04 AM

Figura 1. Conner, A., Gordon, S. and Gordon, R., 2019. Using AI To Predict Breast Cancer And Personalize Care. MIT News. Recuperada de: http://news.mit.edu/2019/using-ai-predict-breast-cancer-and-personalize-care-0507

Otro ejemplo muy estudiado del área de la salud donde se utiliza machine learning es en la predicción de Alzheimer. En este caso, sobre un conjunto de audios, un modelo de machine learning busca patrones en la manera de hablar de las personas que tienen esta enfermedad. El análisis se basa en las pausas entre palabras, la pronunciación, la frecuencia y amplitud de los sonidos. De esta forma el modelo ayuda al experto en medicina geriátrica a identificar de manera temprana síntomas de Alzheimer por medio de la forma como se expresa o habla una persona.

Aplicaciones Actuales de Machine Learning en el COVID-19

De momento, no existen datos suficientes, confiables, ni que puedan ser considerados de calidad para realizar predicciones sobre conjuntos de datos relacionados al COVID-19. Y si existen, éstos son de carácter privado debido a que corresponden a información personal sobre la salud de las personas. Es importante destacar que cuando se desea aplicar machine learning a un problema, se necesita una gran cantidad de datos; si no se cumple con esto, ni siquiera el mejor algoritmo del mundo producirá predicciones confiables. En casos tan delicados como lo es la salud humana no se puede tomar este tipo riesgo.

Kaggle ha puesto a disposición datos etiquetados para predecir la probabilidad de ser contagiado de COVID-19. Kaggle es una página que provee diferentes conjuntos de datos para experimentar con machine learning. 

En la Tabla 1 se puede observar parte de un conjunto de datos, con algunas columnas predictoras o descriptivas. Se pueden ver características como la edad, género, fecha en que presentó síntomas, fecha de confirmación de los síntomas, los síntomas, días entre síntomas e historial de viajes (fechas y lugares). Estas características son consideradas por los especialistas de la salud como potenciales predictores para determinar si una persona está infectada o no de COVID-19.

Screen Shot 2020-04-30 at 10.30.04 AMTabla 1. Bhopalwala, B., 2020. COVID-19 & Machine Learning. [jpeg] Medium. Recuperada de: https://towardsdatascience.com/covid-19-machine-learning-4f064df53c43

En China, los habitantes son monitoreados por el gobierno mediante la aplicación WeChat. En las primeras semanas desde que apareció el COVID-19 en Wuhan, el país comienza a recolectar información similar a la presentada en la tabla anterior para cada persona y se inicia el mejoramiento de la aplicación llamada Health Code. Health Code a través de un modelo de machine learning, predice la probabilidad de poder contraer COVID-19. Por lo cual, si una persona con alta probabilidad de contagiarse o de ser portador de COVID sale de su hogar, la aplicación le indicará que debe quedarse en aislamiento. Si hace caso omiso a la advertencia, inmediatamente se le comunica a las autoridades correspondientes y se aplica una infracción a la persona por incumplir órdenes sanitarias.

Mitos 

A la hora de utilizar machine learning para resolver un problema del área de la salud existen al menos tres mitos:

  • Machine learning puede reemplazar a un médico: es cierto que machine learning ayuda a predecir si se puede contraer una enfermedad pero eso no abarca todas las labores de un médico especialista. Por ejemplo, machine learning le puede ayudar al médico a identificar si la persona tiene cáncer o no, sin embargo el cuidado y tratamiento que se le debe de dar a la persona debe ser establecido por un médico. 
  • La combinación de “big data” y un excelente científico de datos siempre va a ser una receta para el éxito a la hora de predecir si una persona puede contraer una enfermedad: estas dos características son muy importantes pero en muchos casos los datos no son de calidad o podría no encontrarse un patrón en ellos.  Asimismo, cuando se entrena un modelo con un grupo de datos, este va a encontrar patrones específicos sobre ellos. Sin embargo, existe la posibilidad de que estos patrones no funcionen sobre nuevos datos.
  • Los médicos utilizan los modelos recientemente descubiertos: en muchos casos, la actualización de modelos no se encuentra dentro de la línea de trabajo de un médico. El hallar el tiempo para que un médico especialista colabore nuevamente en la verificación de los datos y resultados puede ser difícil. Asimismo, es riesgoso cambiar un buen modelo entrenado por uno que no se tiene certeza que funcione. De igual forma, seguir utilizando un modelo entrenado que ya no predice bien puede llegar a ser peligroso, especialmente si se habla de la salud de las personas.

Conclusión

La aplicación de machine learning en la predicción del riesgo de adquirir o contagiarse de una enfermedad no es algo nuevo. Su utilización en el diagnóstico, prevención y tratamiento de enfermedades no implica la desaparición de los especialistas de la salud. Machine learning es una poderosa herramienta que puede ayudar a los médicos a salvar vidas. La aplicación de machine learning para ayudar en la predicción de contagio de COVID-19 actualmente está en desarrollo, debido a que aún no hay suficientes datos o no existe confianza en su calidad. De hecho, BBC Mundo (2020) reporta que el avance de la pandemia es tan rápido que la recolección de sus datos se hace difícil. Pero existe la posibilidad de que en un futuro se logre predecir la probabilidad de ser infectado, la probabilidad de presentar complicaciones y la probabilidad de sanar del COVID-19.

Contáctenos

Contenido

Compartir Artículo

Artículos Destacados