Predicción del Churn: cómo anticipar la pérdida de clientes en el sector retail
Proyecto Final de Antonella Giglio
Diplomatura en Data Analytics con R y Python
En esta nueva defensa de proyecto final de la Diplomatura en Data Analytics con Python, Antonela Giglio nos presenta un trabajo enfocado en uno de los grandes desafíos del mundo empresarial: la Predicción del Churn, o predicción de abandono de clientes.
El proyecto se desarrolló para una empresa del sector retail dedicada a la venta de productos delicatessen, la cual enfrentaba un problema común: un alto costo de adquisición de clientes y una tasa de retención insuficiente.
El desafío: detectar a tiempo el riesgo de abandono
Antonela y su equipo buscaron construir un modelo que permita anticiparse a la pérdida de clientes, identificando quiénes tienen mayor probabilidad de abandonar para optimizar las estrategias de fidelización y maximizar el valor de la cartera.
El proceso comenzó con una limpieza y exploración exhaustiva de datos, analizando variables numéricas y categóricas, detectando outliers, y corrigiendo inconsistencias como fechas de nacimiento erróneas o variables sin valor analítico.
Uno de los primeros hallazgos fue que la base no contaba con una variable objetivo (target) que definiera el “churn”, por lo que el equipo decidió construirla desde cero aplicando la metodología RFM (Recency, Frequency, Monetary Value).
De los datos al modelo predictivo
Mediante el modelo RFM se escoraron los clientes según su recencia, frecuencia de compra y gasto total, estableciendo así un criterio sólido para determinar qué clientes presentaban mayor riesgo de abandono.
Con estos datos, se entrenaron dos modelos:
- Regresión Logística, que alcanzó una precisión del 88% y una exactitud del 91%.
- Random Forest, que mejoró aún más los resultados con una precisión del 99% y un impacto económico neto superior.
El análisis demostró que, aplicando el modelo de Random Forest para segmentar a los clientes y ejecutar las campañas de retención, la empresa podría aumentar sus ganancias en más del 300%, comparado con la estrategia actual.
Temáticas:
Resultado destacado: El modelo de Random Forest logró un beneficio neto superior en un 38% respecto a la regresión logística, demostrando su valor para estrategias de retención de clientes.
La Predicción del Churn se convierte así en una herramienta clave para las empresas que buscan reducir la fuga de clientes, optimizar sus recursos de marketing y tomar decisiones basadas en datos.
Antonela recomienda avanzar con la implementación del modelo de Random Forest, monitorear variables como frecuencia de compra, gasto total y respuesta a campañas, y realizar pruebas A/B con incentivos personalizados para clientes en riesgo.
LinkedIn de Antonella Giglio: https://www.linkedin.com/in/antonella-giglio-b1aa8357/
