Póster:
Mapas de reducción de dimensionalidad para la interpretabilidad de modelos de machine learning en distrofias musculares
Benjamín Matías Pizarro Galleguillos
benjaminpizarro@ug.uchile.cl
Centro de Imagenología, Hospital Clínico Universidad de Chile
Pizarro B , Eyssautier MF, Salinas V , Gómez-Andrés D, Díaz J, Bevilacqua J
- Músculo-Esquelético
- Neurorradiología
- Resonancia Magnética
Las distrofias musculares son un grupo de más de 40 enfermedades heterogéneas caracterizadas por debilidad muscular y cambios distróficos a la histología. La RM tiene un rol en el diagnóstico diferencial de estas enfermedades. Las técnicas de machine learning (ML) supervisadas y no supervisadas han comenzado a ser utilizadas en la caracterización de los patrones de infiltración grasa por RM de estos pacientes. Sin embargo, los modelos de ML se comportan como “cajas negras” al utilizar información de alta dimensionalidad y difícil interpretación. Es por esto que se hacen necesarios métodos que faciliten la interpretación de los datos y los resultados que arrojan los modelos. En este trabajo se investigó el rol de distintas técnicas de reducción de dimensionalidad para facilitar la representación e interpretación de patrones de infiltración grasa. Usando el lenguaje python y las librerías, sklearn, matplotlib, numpy y pandas, se evaluaron las técnicas PCA, UMAP, ISOMAP y t - SNE , sobre una base de datos de novecientos setenta y cinco pacientes europeos y seis pacientes chilenos, correspondientes a 10 tipos de distrofias. Además, se evaluó de forma cualitativa la capacidad del modelo de separar las clases de pacientes en un espacio de baja dimensionalidad. Los métodos de reducción de dimensionalidad más modernos, t-SNE y UMAP, fueron capaces de generar representaciones más interpretables favoreciendo la agrupación de pacientes similares. Como limitación, no se pudo evaluar de forma cuantitativa la capacidad de generar clusters de pacientes, por lo que se están buscando nuevas técnicas para medir dicha capacidad. Del mismo modo, no se validó de forma amplia en población chilena, por lo cual más investigación es requerida. La potencialidad de esta técnica corresponde a complementar la clasificación entregada por modelos supervisados, facilitando la visualización de patrones de infiltración grasa y permitiendo la identificación de outliers. Esto último supone el reconocimiento de las clasificaciones erróneas por parte de los modelos supervisados al enfrentarse a patrones para los cuales no han sido entrenados previamente, disminuyendo los errores.