Proyecto: Prediciendo el Hábitat Mosquito Aedes albopictus en Argentina
Proyecto Final de Arturo A. Lizuain
Diplomatura en Python orientado a Científico de Datos
La predicción del hábitat del mosquito Aedes en Argentina es un desafío clave para la salud pública, especialmente por su rol como vector de enfermedades como el dengue, el zika y la fiebre amarilla. En este proyecto, desarrollado en el marco de la Diplomatura en Python orientada a Ciencia de Datos del Instituto Data Science Argentina, se aplicaron técnicas de Machine Learning para identificar zonas potenciales de presencia del mosquito Aedes albopictus en el territorio nacional.
El trabajo busca apoyar la toma de decisiones sanitarias mediante la creación de modelos predictivos basados en variables climáticas, geográficas y ambientales, optimizando los recursos destinados al control vectorial.
Contexto del Proyecto
El Aedes albopictus, también conocido como “mosquito tigre”, es una especie invasora con una creciente presencia en el norte argentino, especialmente en Misiones y Corrientes. Aunque su distribución es aún limitada, su expansión representa un riesgo sanitario considerable debido a su capacidad de transmitir enfermedades virales.
El objetivo principal del proyecto fue crear un modelo predictivo confiable que permita detectar el hábitat del mosquito a partir de datos obtenidos de la plataforma GBIF (Global Biodiversity Information Facility) y fuentes bibliográficas. Además, se construyó una base de datos de ausencias confirmadas, utilizando información de muestreos donde la especie no fue detectada.
Metodología y Modelos Aplicados
El proyecto utilizó tres enfoques de Machine Learning supervisado para predecir la presencia o ausencia del mosquito:
- K-Nearest Neighbors (KNN)
- Máquinas de Soporte Vectorial (SVM)
- Redes Neuronales Artificiales (ANN)
Cada modelo fue evaluado con la métrica F1 Score, ideal para conjuntos de datos desbalanceados. Además, se introdujo un análisis de costo basado en los impactos económicos de los errores de predicción:
- Falsos positivos: $10.000 (por controles innecesarios)
- Falsos negativos: $50.000 (por riesgo sanitario en zonas no detectadas)
Resultados Obtenidos
- KNN: Alta precisión en detección de presencias (99,6%) pero menor rendimiento en ausencias (80,7%).
- SVM: Mejor balance general (99% en presencias y 98% en ausencias).
- Red Neuronal: Modelo óptimo, con un 100% de aciertos tanto en presencias como en ausencias, y costo total igual a cero.
El modelo de red neuronal fue seleccionado como el más eficaz, al eliminar completamente los falsos positivos y negativos. Esto se traduce en una herramienta de predicción confiable, con beneficios económicos y sanitarios para las autoridades encargadas del control de vectores.
Conclusiones
El proyecto “Prediciendo el Hábitat del Mosquito Aedes en Argentina” demuestra cómo la ciencia de datos y el aprendizaje automático pueden tener un impacto directo en la salud pública.
El modelo desarrollado no solo predice con exactitud la distribución del mosquito Aedes albopictus, sino que también optimiza los recursos estatales y reduce los riesgos de brotes epidémicos inesperados.
Este tipo de desarrollos refuerza la importancia de formar profesionales en Data Science, capaces de aplicar técnicas de análisis y modelado a problemáticas ambientales y sanitarias reales.
Aprendizaje Destacado
Este proyecto es un claro ejemplo de cómo el Machine Learning aplicado al medio ambiente puede generar soluciones innovadoras y de alto impacto social.
La combinación de datos geográficos, climáticos y modelos predictivos avanzados permite anticipar escenarios críticos y tomar decisiones más inteligentes en salud pública.
LinkedIn de Arturo Lizuain: https://www.linkedin.com/in/arturo-lizuain-b82452132/
