Schaefer, J., Lehne, M., Schepers, J., Prasser, F., & Thun, S. (2020). Orphanet Journal of Rare Diseases, 15(145), 1-10

Jordi Gol-Montserrat


Engagement Manager, Health & Public Sector, NTT Data Europe & LATAM

RESUMEN

La ingente cantidad de iniciativas basadas en la aplicación de Inteligencia Artificial que actualmente se están llevando a cabo en el sector sanitario a nivel mundial es prácticamente incatalogable. En el campo de las enfermedades raras, ni siquiera existen revisiones sólidas que consigan fotografiar fielmente el estado del arte. A partir de esta necesidad, y con el objetivo de poner orden y de describir los usos más relevantes de las técnicas de Machine Learning (ML) (aprendizaje automático en su traducción al español) en este campo, se publicó en junio del 2020 el artículo “The use of machine learning in rare diseases: a scoping review”, en la Orphanet Journal of Rare Diseases, que se resume y comenta a continuación.

El artículo en cuestión, mediante un enfoque de revisión panorámica (un tipo de revisión no sistemática, que busca sintetizar el conocimiento disponible con el fin de entender en términos generales lo que se conoce acerca de un fenómeno), explora toda la evidencia disponible respecto a cómo se está empleando el ML en la mejora de diagnóstico y el tratamiento de enfermedades raras (EERR). Se pone el foco en tres aspectos:

  1. En qué EERR es más popular el empleo de dichas técnicas;
  2. Qué tipos de algoritmos y datos de entrada (input) se utilizan;
  3. Cuáles son sus aplicaciones médicas.

La búsqueda panorámica se concretó en la identificación de 211 estudios, repartidos en 32 países. Destacan los siguientes resultados:

  • De las más de 000 EERR conocidas, se encontraron originales sobre 74.
  • Mayor interés en EERR con alta prevalencia (aparecen con más frecuencia en los estudios que las enfermedades con una prevalencia más baja).
  • Los algoritmos más aplicados en los estudios fueron los siguientes: métodos combinados de aprendizaje (36,0%), algoritmo de vectores de soporte (32,2%) y redes neuronales artificiales (31,8%). Se destaca la escasa validación de los mismos (contra un conjunto de datos externos, el 11,8% de los estudios, y contra un experto humano, el 2,4%).
  • Los datos de entrada más utilizados fueron imágenes (32,2%), datos demográficos (27,0%) y datos “ómicos” (26,5%).
  • Respecto a las aplicaciones médicas, la mayoría de los estudios aplicaban el ML para diagnóstico (40,8%) y pronóstico (38,4%). Los estudios destinados a mejoras de tratamiento fueron relativamente escasos (4,7%).
  • El número de pacientes en los estudios fue pequeño, entre 20 y 99.

El trabajo concluye presumiendo de su aportación y utilidad para futuras investigaciones, pues consigue trazar y exponer un mapa conciso de la actividad más relevante que se está llevando hasta la fecha en la aplicación de ML en EERR.

COMENTARIO

El machine learning o aprendizaje automático es la principal técnica empleada dentro de la confusa amalgama de metodologías con las que “se hace” Inteligencia Artificial. En resumidas palabras, el ML es el proceso por el cual una máquina analiza de forma retrospectiva un set de datos input y output, encuentra patrones en dichos datos (se entrena la máquina) y, a partir de estos se hacen predicciones sobre los output con los datos input nuevos que se van cargando. La máquina está en continuo aprendizaje, pues los patrones o algoritmos van mejorando con la experiencia.

En el diagnóstico, el machine learning tiene la capacidad de encontrar patrones de forma mucho más rápida y eficaz que el humano, superando en algunos casos el 95% de eficacia

Si tenemos en cuenta todo el espectro asistencial, la principal aplicación de esta tecnología está orientada a la toma de decisiones clínicas, según una reciente revisión (Benavent et al., 2020). En especial, se están generando avances prometedores en el diagnóstico por imagen médica (lectura e interpretación de imágenes), las pruebas de laboratorio, la proteómica, predicciones de emergencias y pronóstico de enfermedades.

El primer hallazgo relevante de esta síntesis realizada por Schaefer et al., es que las aplicaciones ML que se están pilotando en EERR apenas difieren del resto de áreas terapéuticas: principalmente, diagnóstico y pronóstico. Esto es así porque precisamente el mayor punto fuerte del ML es ese, buscar patrones de forma inductiva sin la generación de hipótesis previas.

Respecto al diagnóstico, esta tecnología tiene la capacidad de ver muchos más detalles y aprender infinitamente más rápido de su lectura que los humanos, procesando múltiple información en tiempo real y encontrando patrones de forma mucho más rápida y eficaz, superando en algunos casos el 95% de eficacia. Respecto al pronóstico, se están llevando a cabo desarrollos para realizar cribados poblacionales inteligentes, a partir del análisis retrospectivo masivo de historias clínicas electrónicas. A partir de ciertos criterios preestablecidos, como por ejemplo patologías previas concretas, o bien sintomatologías, factores de riesgo, antecedentes familiares, etc., que puedan estar disponibles en los registros electrónicos, los algoritmos son capaces de detectar patrones concretos en aquellos pacientes con especial predisposición a sufrir una enfermedad rara concreta, y entonces recomendar para estos la realización de diagnósticos complementarios.

En este punto cabe indicar que, además del diagnóstico y pronóstico, también se están generando avances relevantes a nivel de tratamiento, a pesar de no mencionarse en el artículo revisado. Uno de los campos de investigación más prometedores actualmente es el de los estudios genéticos y terapias génicas (edición y alteración de genes mutados que están causando la enfermedad). Mediante Inteligencia Artificial, se está facilitando enormemente la obtención e interpretación de la secuenciación genómica. El análisis ML de mutaciones está contribuyendo a encontrar las mejores terapias personalizadas en función de cada ADN. Y esto, en el campo de las EERR, es de especial relevancia, pues el 72% tiene un origen genético.

El segundo hallazgo más destacado es que se están llevando a cabo mayores estudios piloto con ML en aquellas EERR con una prevalencia comparativamente alta, mientras que las enfermedades con una prevalencia más baja están recibiendo menos atención.

Estamos ante un cambio de paradigma. Actualmente, existe una confusión generalizada a nivel conceptual, y es que la naturaleza de esta tecnología es compleja

Este es un hecho lógico, pues de la misma manera ocurre con las enfermedades más comunes. Como bien intuyen los autores, es la propia escasez de datos que existe para entrenar a los modelos lo que a priori explica este hecho, habiendo más disponibilidad de datos input (más pacientes) en las EERR con mayor prevalencia, y por ende, más y mejores resultados.

Por último, y saliéndonos ligeramente del objeto del estudio revisado, es necesario destacar lo que la entrada de estas tecnologías está suponiendo en la forma de aprobar, financiar y supervisar los nuevos medicamentos y tecnologías sanitarias. Estamos ante un cambio de paradigma. Actualmente, existe una confusión generalizada a nivel conceptual, y es que la naturaleza de esta tecnología es compleja. Estamos viviendo un ambiente de confusión generado por las numerosas iniciativas que se están llevando a cabo, las grandes expectativas generadas y el estado aún inmaduro de los resultados obtenidos. Este cambio de paradigma no afecta únicamente a la investigación básica, que es de lo que trata el artículo revisado, sino que desde hace un tiempo estamos observando adaptaciones en el ámbito de la autorización y la evaluación de tecnologías sanitarias. Si un algoritmo validado es capaz de diagnosticar, tendrá que ser autorizado y aprobado para su uso generalizado en la práctica clínica, asegurándose el cumplimiento de estándares de calidad y seguridad, tal y como se le exige a cualquier otro medicamento o tecnología. No hay que olvidar que, debido a la oscuridad de los datos y de las técnicas empleadas, puede ser común una manipulación de los estudios realizados con esta tecnología para anticipar los resultados esperados. Esto es de especial relevancia para prevenir, por ejemplo, sobreestimaciones de eficacia.

En conclusión, como se comentaba al principio, son innumerables las iniciativas ML que se están llevando a cabo en el ámbito sanitario. Ya no digamos en el subcampo de las EERR. Por ello, aportaciones como la revisada en este artículo son de gran utilidad para ordenar y sintetizar el conocimiento más relevante generado hasta la fecha. El siguiente paso es validar, autorizar y evaluar los resultados obtenidos, y poder trasladar de la investigación a la práctica clínica aquellos casos de uso que aporten un valor demostrado. Con ello, será igual de importante la implantación de estrategias de acompañamiento en la adaptación al cambio, no solo a nivel del profesional asistencial, sino también a nivel social, organizativo e institucional.

REFERENCIAS


  • Melnyk, M. y Fineout Overholt, (2005). Evidence Based Prac- tice in Nursing & Healthcare. A Guide to Best Practice. Phila- delphia: Lippincott, Williams & Wilkins