Optimización del Riesgo Crediticio con Machine Learning | Instituto Data Science Argentina

🔥 Cyber Week: 12 cuotas sin interés con todos los medios de pago | 20% de descuento en 1 pago por transferencia. Con tu inscripción te incluimos GRATIS el Curso Experto en Power BI 🔥

Proyecto Final de Facundo José Negrelli
Diplomatura en Ciencia de Datos con R y Python

En el mundo financiero actual, las decisiones basadas en datos son esenciales para mantener la rentabilidad y reducir los riesgos. En este proyecto, Facundo Negueri, licenciado en Sociología y analista de datos, nos presenta un caso de aplicación real donde la Ciencia de Datos y el Machine Learning se ponen al servicio de la Optimización del Riesgo Crediticio en una institución bancaria.

📉 El desafío: revertir un área de préstamos en déficit

La entidad bancaria atravesaba una situación crítica: su área de préstamos era deficitaria, con una alta tasa de impagos que comprometía la estabilidad financiera. Cada crédito impago generaba pérdidas del 18% del monto total, mientras que los préstamos exitosos apenas rendían un 5% de ganancia.
El objetivo fue claro: utilizar modelos predictivos para mejorar la asignación de préstamos y volver rentable el área de créditos.

🧠 Ciencia de Datos aplicada al negocio bancario

A partir de un dataset de 32.000 observaciones y 12 variables, se realizó un exhaustivo análisis exploratorio para comprender los factores que más influían en el impago. Entre las variables más relevantes se destacaron:

  • La tasa de interés aplicada,
  • El porcentaje del préstamo sobre los ingresos,
  • Y la situación habitacional del cliente.

Este análisis permitió detectar umbrales críticos donde aumentaba la probabilidad de default, como tasas de interés superiores al 13% o préstamos que superaban el 24% del ingreso mensual.

⚙️ Modelado predictivo y evaluación de rentabilidad

Para abordar el problema, Facundo implementó tres algoritmos basados en árboles de decisión:

  • RPart
  • Party
  • XGBoost

Se compararon sus desempeños tanto con ajuste manual de hiperparámetros como mediante validación cruzada (K-Fold), evaluando no solo la precisión del modelo sino también su impacto económico real.

Los resultados fueron contundentes:

  • XGBoost demostró ser el modelo más robusto y estable, con una pérdida mínima de rendimiento ante nuevos datos (solo un 5%) y ganancias proyectadas cercanas a los 2,8 millones.
  • Los otros modelos también mejoraron la rentabilidad, pero mostraron un mayor nivel de sobreajuste.

💡 Conclusiones

La implementación de Machine Learning para la optimización del riesgo crediticio permitió no solo revertir el déficit, sino también garantizar mayor estabilidad y rentabilidad a futuro.

Este caso demuestra el enorme potencial de la Ciencia de Datos aplicada a la banca, donde cada decisión basada en modelos predictivos puede traducirse en mejores estrategias, menor exposición al riesgo y mayor competitividad.

LinkedIn de Facundo Negrelli: https://www.linkedin.com/in/facunegrelli/

¿Te gustaría aprender Ciencia de Datos?

Artículo añadido al carrito.
0 artículos - $0,00