Predicción del riesgo de salud mental en empleados con R y Random Forest
Proyecto Final de Jonatan Oyola
Diplomatura en Ciencia de Datos con R y Python
La salud mental en el ámbito laboral se ha convertido en un tema crítico. El estrés, la ansiedad y el burnout no solo afectan la calidad de vida de los empleados, sino que también impactan en la productividad, el ausentismo y la rotación de personal.
En este contexto, Jonatan Oyola, egresado de nuestra diplomatura en Data Science, desarrolló un proyecto final que combina análisis de datos y modelos predictivos para clasificar el riesgo mental de los empleados, utilizando R Studio y datos reales de encuestas anónimas.
Objetivo del Proyecto
El proyecto buscó crear un modelo predictivo de clasificación multiclase que identifique empleados en riesgo bajo, medio o alto de sufrir problemas de salud mental, considerando factores como:
- Uso de pantallas y dispositivos electrónicos.
- Calidad y cantidad de sueño.
- Alimentación y hábitos de bienestar.
- Prácticas de mindfulness y actividad física.
Metodología y técnicas
Para lograr esto, se aplicaron las siguientes técnicas de análisis de datos y modelado:
- Análisis exploratorio de datos:
- Limpieza y traducción de variables.
- Visualización de la distribución de variables y outliers.
- Correlación entre variables predictoras y la variable objetivo.
- Creación de variables e interacciones:
- Transformación de puntajes de salud mental, ansiedad y depresión.
- Desarrollo de interacciones relevantes, por ejemplo, relación entre tiempo de pantalla y salud mental, o consumo de cafeína y estrés.
- Modelos de clasificación supervisada:
- KNN: como modelo base para entender la distribución de los datos.
- Random Forest: modelo más robusto para detectar patrones complejos y determinar la importancia de las variables.
- Evaluación de desempeño:
- Métricas de precisión, sensibilidad, F1 score y matriz de confusión.
- Comparación de costos económicos asociados a errores de clasificación.
Resultados clave
- Random Forest superó significativamente a KNN, logrando una clasificación más precisa, especialmente en empleados con riesgo medio.
- La identificación temprana de riesgos puede reducir costos por ausentismo y rotación hasta en un 76%.
- Se confirmó que hábitos saludables como dormir mejor y practicar mindfulness tienen un impacto positivo en el bienestar emocional.
Conclusión
El proyecto demuestra que la ciencia de datos puede ser una herramienta estratégica para las empresas, permitiendo:
- Detectar empleados en riesgo antes de que los problemas se agraven.
- Reducir gastos asociados a ausencias y rotación de personal.
- Fomentar un clima laboral más saludable y sostenible.
⚠️ Nota: Este proyecto no reemplaza un diagnóstico clínico. Sus resultados deben ser interpretados por profesionales de la salud.
La combinación de análisis de datos, modelos predictivos y hábitos saludables puede marcar la diferencia en la gestión del bienestar laboral. Implementar estas estrategias no solo es ético, sino también inteligente y rentable para cualquier organización.
LinkedIn de Jonatan Oyola: https://www.linkedin.com/in/joyola83/
