Informáticos de la Universidad de Stanford, en Palo Alto, California, Estados Unidos, han diseñado un algoritmo inteligente que permite diagnosticar el cáncer de piel con la misma fiabilidad que los dermatólogos. Para ello, crearon una base de datos de casi 130.000 imágenes de la enfermedad de la piel y entrenaron su algoritmo para diagnosticar visualmente un posible cáncer, algo que se consiguió desde la primera prueba, con una precisión motivadora, según los autores.
'Nos dimos cuenta de que era factible, no sólo hacer algo bien, sino igual que un dermatólogo humano', resalta uno de los creadores, Sebastian Thrun, profesor adjunto del Laboratorio de Inteligencia Artificial de Stanford. 'Fue entonces cuando nuestro pensamiento cambió, fue cuando dijimos: 'Mira, esto no es sólo un proyecto de clase de estudiantes; es una oportunidad para hacer algo grande para la humanidad'', relata.
El producto final, objeto de un artículo en la edición de 'Nature', fue probado en comparación con 21 dermatólogos certificados. En sus diagnósticos de lesiones cutáneas, que representan los cánceres cutáneos más comunes y mortales, el algoritmo coincide con la evaluación de los dermatólogos.
Cada año hay alrededor de 5,4 millones de nuevos casos de cáncer de piel en Estados Unidos y, aunque la tasa de supervivencia a cinco años para el melanoma detectado en sus primeros estados es de alrededor del 97 por ciento, cae a aproximadamente 14 por ciento si se detecta en sus últimas etapa. La detección temprana podría tener un enorme impacto en los resultados del cáncer de piel.
El diagnóstico de cáncer de piel comienza con un examen visual. Un dermatólogo suele analizar la lesión sospechosa a simple vista y con la ayuda de un dermatoscopio, un microscopio de mano que proporciona una imagen de la situación al nivel justo debajo de la piel. Si estos métodos no son concluyentes o llevan al dermatólogo a creer que la lesión es cancerosa, se necesita hacer una biopsia.
Mediante un aprendizaje profundo
Al llevar este algoritmo al proceso de análisis se sigue una tendencia en la informática que combina el procesamiento visual con el aprendizaje profundo, un tipo de inteligencia artificial modelada igual que las redes neuronales en el cerebro. El aprendizaje profundo tiene un historial de décadas en la informática, pero sólo se ha aplicado recientemente a las tareas de procesamiento visual con gran éxito.
La esencia del aprendizaje automático, incluyendo el aprendizaje profundo, es que un ordenador está entrenado para resolver un problema en lugar de tener las respuestas programadas en él. 'Hicimos un algoritmo de aprendizaje automático muy potente que aprende de los datos', relata Andre Esteva, coautor principal del artículo y estudiante graduado en el laboratorio de Thrun. 'En lugar de escribir en código de ordenador qué buscar exactamente, dejamos que el algoritmo lo averigüe', detalla
El algoritmo se alimentó de cada imagen, con píxeles brutos con un término de enfermedad asociado. Comparado con otros métodos de algoritmos de entrenamiento, éste requiere muy poco procesamiento o clasificación de las imágenes antes de la clasificación, permitiendo que el algoritmo trabaje fuera de una variedad más amplia de datos.
En lugar de construir un algoritmo desde cero, los investigadores comenzaron con un algoritmo desarrollado por Google que ya estaba capacitado para identificar 1,28 millones de imágenes de 1.000 categorías de objetos. Aunque estaba preparado para diferenciar a los gatos de los perros, los investigadores necesitaban distinguir, por ejemplo, un carcinoma maligno de una queratosis seborreica benigna.
'No hay un gran conjunto de datos sobre el cáncer de piel con el que podamos entrenar nuestros algoritmos, así que tuvimos que hacer nuestra propia base de datos', recuerda Brett Kuprel, coautor principal del estudio y un estudiante graduado en el laboratorio de Thrun. 'Recogimos imágenes de Internet y trabajamos con la Escuela de Medicina para crear una cuidadosa taxonomía con datos que estaban muy desordenados: sólo los términos estaban en varios idiomas, incluyendo alemán, árabe y latín', señala.
Después de pasar por las traducciones necesarias, los investigadores colaboraron con dermatólogos de Stanford, así como Helen M. Blau, profesora de Microbiología e Inmunología en Stanford y coautora del artículo. Este equipo interdisciplinario trabajó para clasificar la mezcolanza de imágenes de Internet, con muchas de ellas, a diferencia de las tomados por los profesionales médicos, variaban en términos del ángulo, el zoom y la iluminación. Al final, acumularon alrededor de 130.000 imágenes de lesiones cutáneas que representan más de 2.000 enfermedades diferentes.
Durante las pruebas, los investigadores utilizaron sólo imágenes de alta calidad, confirmadas por biopsia, proporcionadas por la Universidad de Edimburgo y el Proyecto de Colaboración Internacional de Imagen de la Piel, que representaban los cánceres de piel más comunes y mortales: carcinomas malignos y melanomas malignos. Se preguntó a los 21 dermatólogos si, sobre la base de cada imagen, procederían a realizar biopsia o tratamiento o tranquilizarían al paciente porque no había lesión cancerígena.
Los investigadores evaluaron el éxito por lo bien que los dermatólogos fueron capaces de diagnosticar correctamente las lesiones cancerosas y no cancerosas en más de 370 imágenes. El rendimiento del algoritmo se midió mediante la creación de una curva de sensibilidad-especificidad, donde la sensibilidad representaba su capacidad para identificar correctamente las lesiones malignas y la especificidad representaba su capacidad para identificar correctamente las lesiones benignas.
Se evaluó la eficacia del algoritmo a través de tres tareas diagnósticas clave: clasificación de carcinoma de queratinocitos, clasificación de melanoma y clasificación de melanoma cuando se observa con dermoscopia. En las tres tareas, el algoritmo coincidió con el resultado de los dermatólogos con el área bajo la curva de sensibilidad-especificidad alcanzando al menos el 91 por ciento del área total de la gráfica.
Una ventaja adicional del algoritmo es que, a diferencia de una persona, el algoritmo puede hacerse más o menos sensible, permitiendo a los investigadores afinar su respuesta dependiendo de lo que quieran que evalúe. Esta capacidad de alterar la sensibilidad indica la profundidad y complejidad de este algoritmo. Aunque este algoritmo está actualmente en un ordenador, el equipo querría hacerlo compatible con teléfonos inteligentes en un futuro cercano.