Algoritmo para la estimación de factores de riesgo asociados a la enfermedad de Parkinson en sujetos entre 40 y 60 años
Cargando...
Fecha
Autores
Título de la revista
Publicado en
Publicado por
URL de la fuente
Enlace a contenidos multimedia
ISSN de la revista
Título del volumen
Resumen
La enfermedad de Parkinson (EP) es la segunda patología neurodegenerativa más frecuente a nivel mundial y su identificación temprana continúa siendo un reto debido a la ausencia de biomarcadores objetivos y a la variabilidad clínica entre pacientes. En Colombia, la prevalencia estimada oscila entre 160 y 220 casos por cada 100 000 habitantes, con un subdiagnóstico significativo en fases iniciales. Este panorama evidencia la necesidad de herramientas accesibles que apoyen la detección temprana y la evaluación del riesgo.
En este trabajo se desarrolló un sistema multimodal de apoyo diagnóstico basado en aprendizaje automático para estimar la probabilidad de riesgo de EP mediante el análisis de tres fuentes complementarias de información biológica: voz, dibujo en espiral y anamnesis clínica. Para ello se empleó una arquitectura especializada por modalidad: ResNet50 para imágenes de dibujos de espirales, InceptionV3 para espectrogramas de voz y XGBoost para características acústicas tabulares. Los modelos fueron optimizados mediante búsqueda bayesiana y analizados con métodos de explicabilidad (Grad-CAM y SHAP), integrándose mediante fusión tardía en el caso de la voz.
En la evaluación con el conjunto de prueba independiente, el modelo basado en dibujos alcanzó una exactitud del 88 %, precisión del 93 %, sensibilidad del 81 %, especificidad del 94 % y AUC de 0.91, mientras que el modelo híbrido de voz obtuvo una exactitud del 82 %, precisión del 83 %, sensibilidad del 77 %, especificidad del 87 % y AUC de 0.839. Los factores de riesgo más determinantes identificados fueron el temblor, irregularidad del trazo y calidad global del dibujo en el dominio motor, y la energía promedio (RMS), relación armónico-ruido (HNR), variabilidad de la frecuencia fundamental (F0) y los coeficientes cepstrales en Mel (MFCCs) en el dominio acústico.
Los resultados obtenidos demuestran que la integración de información clínica, motora y acústica, junto con el uso de arquitecturas optimizadas y métodos de interpretabilidad, mejora la estimación del riesgo de EP, ofreciendo una herramienta accesible, reproducible y clínicamente coherente para la detección temprana y el apoyo diagnóstico.
Descripción
Abstract
Parkinson’s disease (PD) is the second most prevalent neurodegenerative disorder worldwide, and its early identification remains challenging due to the lack of objective biomarkers and the heterogeneous nature of clinical manifestations. In Colombia, prevalence estimates range from 160 to 220 cases per 100 000 inhabitants, with substantial underdiagnosis in early stages. This scenario highlights the need for accessible tools that support early detection and risk stratification.
This work presents a multimodal machine-learning-based support system designed to estimate PD risk by integrating three complementary sources of biological information: sustained-vowel phonation, spiral-drawing tasks, and clinical anamnesis. A specialized architecture was used for each modality: ResNet50 for spiral images, InceptionV3 for voice spectrograms, and XGBoost for acoustic tabular features. Models were optimized through Bayesian search and interpreted using Grad-CAM and SHAP, with late-fusion integration implemented for the voice pipelines.
In evaluation on an independent test set, the drawing-based model achieved 88% accuracy, 93% precision, 81% sensitivity, 94% specificity, and an AUC of 0.91, whereas the hybrid voice model achieved 82% accuracy, 83% precision, 77% sensitivity, 87% specificity, and an AUC of 0.839. The most relevant risk patterns included tremor, stroke irregularity, and global handwriting quality in the motor domain, and RMS energy, harmonic-to-noise ratio (HNR), fundamental-frequency variability (F0), and Mel-cepstral coefficients (MFCCs) in the acoustic domain.
Results demonstrate that integrating clinical, motor, and acoustic information—combined with optimized architectures and explainability techniques—enhances PD risk estimation and provides an accessible, reproducible, and clinically consistent tool to support early assessment and diagnostic decision-making.
Palabras clave
Enfermedad de Parkinson, Factores de riesgo, Aprendizaje automático, Análisis de voz, Dibujo en espiral
