Proyecto: Modelo Predictivo de Deserción de Clientes de un Banco: Cómo la Ciencia de Datos ayuda a prevenir pérdidas financieras
Proyecto Final de Fermín Villalvilla
Diplomatura en Ciencia de Datos con R y Python
En el competitivo mundo bancario, retener clientes se ha vuelto tan importante como captar nuevos. Uno de los mayores desafíos del sector financiero es anticipar cuándo un cliente está por abandonar la institución. En este contexto, los modelos de aprendizaje automático se posicionan como aliados estratégicos.
Un claro ejemplo de esto es el trabajo desarrollado por Fermín, estudiante de la Diplomatura en Ciencia de Datos del Instituto Data Science Argentina, quien presentó su proyecto titulado “Modelo Predictivo de Deserción de Clientes de un Banco”.
El desafío: identificar clientes en riesgo de abandonar el banco
Todo comenzó cuando Fermín recibió una base de datos anónima de una entidad bancaria. El problema era claro:
el banco no podía diferenciar correctamente entre clientes activos y exclientes, lo que generaba pérdidas al invertir en campañas de retención dirigidas a personas que ya no formaban parte de la institución.
Este error operativo se traducía en una pérdida significativa de recursos y dinero, ya que se ofrecían promociones y beneficios a usuarios que habían cerrado sus cuentas o, por el contrario, se ignoraba a clientes que realmente necesitaban incentivos para permanecer.
Construcción del modelo predictivo
Para resolver este desafío, Fermín desarrolló un modelo de aprendizaje supervisado capaz de predecir la deserción de clientes.
El enfoque consistió en entrenar tres algoritmos distintos:
- Árbol de Decisión
- Random Forest
- Regresión Lineal
Antes de entrenar los modelos, se realizó un análisis exploratorio de los datos. Durante esta etapa se detectó que una variable —relacionada con las quejas de los clientes— tenía una correlación fuerte con la deserción. Sin embargo, al no contar con información temporal sobre cuándo se realizó la queja y cuándo ocurrió la baja, esa variable fue descartada para evitar sesgos en las predicciones.
Optimización con Grid Search
Uno de los pasos más importantes fue la utilización de la técnica Grid Search, que permite encontrar los hiperparámetros óptimos para cada modelo.
Gracias a esta técnica, el modelo Random Forest alcanzó un rendimiento superior, generando una ganancia estimada de USD 538.917 para el banco.
En comparación:
- El Árbol de Decisión obtuvo una ganancia de USD 426.008.
- La Regresión Lineal, un rendimiento menor de USD 370.682.
Estos resultados demostraron cómo la correcta selección y ajuste de modelos puede tener impacto directo en la rentabilidad de una organización.
Valor económico y toma de decisiones
Más allá de la precisión técnica, el proyecto destacó por su análisis económico de resultados. Fermín construyó una matriz de valoración monetaria basada en los cuatro escenarios posibles de predicción (clientes retenidos, desertores identificados, falsos positivos y falsos negativos).
De esta forma, el modelo no solo predice quién se irá o se quedará, sino cuánto dinero gana o pierde el banco según cada caso.
El enfoque fue tan completo que incluyó el cálculo del piso y techo del modelo, es decir, el rango entre el rendimiento mínimo esperable y el máximo teórico posible. Esto permitió evaluar si valía la pena seguir invirtiendo en mejorar el algoritmo.
Conclusiones: una mirada empresarial de la Ciencia de Datos
El proyecto “Modelo Predictivo de Deserción de Clientes de un Banco” demuestra cómo la Ciencia de Datos y el Machine Learning pueden generar soluciones prácticas y medibles para el sector financiero.
Más allá de los modelos y las métricas, Fermín presentó un trabajo con visión estratégica y aplicabilidad real, destacando por su claridad visual, documentación técnica en Markdown y un enfoque orientado al negocio.
Como mencionaron los tutores del Instituto, este tipo de proyectos reflejan la integración entre el análisis técnico y la toma de decisiones empresariales, una competencia clave para el futuro profesional de la Ciencia de Datos.
LinkedIn de Fermín Villalvilla: https://www.linkedin.com/in/ferm%C3%ADn-villalvilla-63a82020a/
