Proyecto: Optimización del Riesgo Crediticio con Machine Learning

Tabla de Contenidos

Proyecto Final de Facundo José Negrelli
Diplomatura en Ciencia de Datos con R y Python

En el mundo financiero actual, las decisiones basadas en datos son esenciales para mantener la rentabilidad y reducir los riesgos. En este proyecto, Facundo Negueri, licenciado en Sociología y analista de datos, nos presenta un caso de aplicación real donde la Ciencia de Datos y el Machine Learning se ponen al servicio de la Optimización del Riesgo Crediticio en una institución bancaria.

📉 El desafío: revertir un área de préstamos en déficit

La entidad bancaria atravesaba una situación crítica: su área de préstamos era deficitaria, con una alta tasa de impagos que comprometía la estabilidad financiera. Cada crédito impago generaba pérdidas del 18% del monto total, mientras que los préstamos exitosos apenas rendían un 5% de ganancia.
El objetivo fue claro: utilizar modelos predictivos para mejorar la asignación de préstamos y volver rentable el área de créditos.

🧠 Ciencia de Datos aplicada al negocio bancario

A partir de un dataset de 32.000 observaciones y 12 variables, se realizó un exhaustivo análisis exploratorio para comprender los factores que más influían en el impago. Entre las variables más relevantes se destacaron:

La tasa de interés aplicada,
El porcentaje del préstamo sobre los ingresos,
Y la situación habitacional del cliente.

Este análisis permitió detectar umbrales críticos donde aumentaba la probabilidad de default, como tasas de interés superiores al 13% o préstamos que superaban el 24% del ingreso mensual.

⚙️ Modelado predictivo y evaluación de rentabilidad

Para abordar el problema, Facundo implementó tres algoritmos basados en árboles de decisión:

RPart
Party
XGBoost

Se compararon sus desempeños tanto con ajuste manual de hiperparámetros como mediante validación cruzada (K-Fold), evaluando no solo la precisión del modelo sino también su impacto económico real.

Los resultados fueron contundentes:

XGBoost demostró ser el modelo más robusto y estable, con una pérdida mínima de rendimiento ante nuevos datos (solo un 5%) y ganancias proyectadas cercanas a los 2,8 millones.
Los otros modelos también mejoraron la rentabilidad, pero mostraron un mayor nivel de sobreajuste.

💡 Conclusiones

La implementación de Machine Learning para la optimización del riesgo crediticio permitió no solo revertir el déficit, sino también garantizar mayor estabilidad y rentabilidad a futuro.

Este caso demuestra el enorme potencial de la Ciencia de Datos aplicada a la banca, donde cada decisión basada en modelos predictivos puede traducirse en mejores estrategias, menor exposición al riesgo y mayor competitividad.

LinkedIn de Facundo Negrelli: https://www.linkedin.com/in/facunegrelli/