Análisis para la detección de Párkinson por medio de variaciones de la voz | Instituto Data Science Argentina

🔥 Cyber Week: 12 cuotas sin interés con todos los medios de pago | 20% de descuento en 1 pago por transferencia. Con tu inscripción te incluimos GRATIS el Curso Experto en Power BI 🔥

Proyecto Final de Mariano De martini
Diplomatura en Ciencia de Datos con R y Python

El avance de la ciencia de datos y el aprendizaje automático está transformando el campo de la salud. Uno de los ejemplos más prometedores es el análisis para la detección de Párkinson por medio de variaciones de la voz, un enfoque que combina el poder del machine learning con el estudio acústico de la fonación humana.

Un proyecto de la Diplomatura en Ciencia de Datos con Python

Este trabajo, presentado por Mariano de Martínez en el marco de la Diplomatura en Ciencia de Datos con Python del Instituto de Data Science Argentina, bajo la tutoría de Julio Paredes, explora cómo las alteraciones en la voz pueden utilizarse como indicadores tempranos de la enfermedad de Párkinson.

Para ello, el autor empleó un conjunto de datos que contiene diversas características acústicas de pacientes diagnosticados y no diagnosticados. Entre las variables analizadas se incluyen:

  • Frecuencias fundamentales de la voz.
  • Variaciones en la amplitud y tono.
  • Relación entre ruido y armónicos.
  • Medidas de complejidad y variaciones no lineales.

Del análisis exploratorio al modelado predictivo

El proyecto comienza con una limpieza y exploración de datos para asegurar la calidad del dataset. Posteriormente, se realiza un análisis visual mediante gráficos interactivos utilizando librerías como Plotly y Seaborn, lo que permitió identificar diferencias notables entre las voces de pacientes sanos y aquellos con diagnóstico positivo de Párkinson.

Para la etapa predictiva, Mariano aplicó modelos de clasificación basados en XGBoost y Máquinas de Soporte Vectorial (SVM).
Tras un riguroso proceso de ajuste de hiperparámetros, el modelo SVM alcanzó una precisión del 97,29%, mostrando una excelente capacidad para distinguir entre pacientes positivos y negativos.

Resultados y aplicación práctica

Además de su precisión técnica, el proyecto incluyó un análisis económico para evaluar el impacto potencial de un diagnóstico automatizado, demostrando beneficios significativos en términos de eficiencia y reducción de costos.
Como aplicación práctica, se desarrolló un modelo interactivo en Shiny, capaz de predecir nuevos casos a partir de datos acústicos, demostrando la utilidad del modelo en entornos clínicos reales.

Ciencia de datos aplicada a la salud

El análisis para la detección de Párkinson por medio de variaciones de la voz es un ejemplo concreto del valor que puede aportar la ciencia de datos en el diagnóstico médico. Gracias a técnicas de machine learning y análisis estadístico avanzado, es posible construir modelos que apoyen la detección temprana de enfermedades neurológicas, mejorando la calidad de vida de los pacientes y optimizando los recursos del sistema de salud.

LinkedIn de Mariano de Martini: https://www.linkedin.com/in/mariano-demartini-5854a01b2/

¿Te gustaría estudiar Ciencia de Datos?

Artículo añadido al carrito.
0 artículos - $0,00