Proyecto: Optimización del Riesgo Crediticio con Machine Learning
Proyecto Final de Facundo José Negrelli
Diplomatura en Ciencia de Datos con R y Python
En el mundo financiero actual, las decisiones basadas en datos son esenciales para mantener la rentabilidad y reducir los riesgos. En este proyecto, Facundo Negueri, licenciado en Sociología y analista de datos, nos presenta un caso de aplicación real donde la Ciencia de Datos y el Machine Learning se ponen al servicio de la Optimización del Riesgo Crediticio en una institución bancaria.
📉 El desafío: revertir un área de préstamos en déficit
La entidad bancaria atravesaba una situación crítica: su área de préstamos era deficitaria, con una alta tasa de impagos que comprometía la estabilidad financiera. Cada crédito impago generaba pérdidas del 18% del monto total, mientras que los préstamos exitosos apenas rendían un 5% de ganancia.
El objetivo fue claro: utilizar modelos predictivos para mejorar la asignación de préstamos y volver rentable el área de créditos.
🧠 Ciencia de Datos aplicada al negocio bancario
A partir de un dataset de 32.000 observaciones y 12 variables, se realizó un exhaustivo análisis exploratorio para comprender los factores que más influían en el impago. Entre las variables más relevantes se destacaron:
- La tasa de interés aplicada,
- El porcentaje del préstamo sobre los ingresos,
- Y la situación habitacional del cliente.
Este análisis permitió detectar umbrales críticos donde aumentaba la probabilidad de default, como tasas de interés superiores al 13% o préstamos que superaban el 24% del ingreso mensual.
⚙️ Modelado predictivo y evaluación de rentabilidad
Para abordar el problema, Facundo implementó tres algoritmos basados en árboles de decisión:
- RPart
- Party
- XGBoost
Se compararon sus desempeños tanto con ajuste manual de hiperparámetros como mediante validación cruzada (K-Fold), evaluando no solo la precisión del modelo sino también su impacto económico real.
Los resultados fueron contundentes:
- XGBoost demostró ser el modelo más robusto y estable, con una pérdida mínima de rendimiento ante nuevos datos (solo un 5%) y ganancias proyectadas cercanas a los 2,8 millones.
- Los otros modelos también mejoraron la rentabilidad, pero mostraron un mayor nivel de sobreajuste.
💡 Conclusiones
La implementación de Machine Learning para la optimización del riesgo crediticio permitió no solo revertir el déficit, sino también garantizar mayor estabilidad y rentabilidad a futuro.
Este caso demuestra el enorme potencial de la Ciencia de Datos aplicada a la banca, donde cada decisión basada en modelos predictivos puede traducirse en mejores estrategias, menor exposición al riesgo y mayor competitividad.
LinkedIn de Facundo Negrelli: https://www.linkedin.com/in/facunegrelli/
