Recientemente publicamos un trabajo en la conferencia ASONAM 2016 en San Francisco, trabajo conjunto con la estudiante de doctorado María Óskarsdóttir de la KU Leuven, sus supervisores, y otros colegas en Bélgica y Argentina.
En este trabajo conseguimos siete datasets de distintos países, de varias decenas de millones de clientes en total, con historiales de llamadas (CDR) para prepago y postpago, y construimos la red social compuesta de las llamadas entre los usuarios junto a medidas clásicas de Recency, Frequency y Monetary Value de las llamadas. La idea era investigar si esta información sirve (spoiler alert: ¡SI!) para predecir la fuga – o churn – a otra compañía móvil y cuáles métodos son mejores para predecir este evento. El paper está disponible gratuitamente acá. Este trabajo son los resultados preliminares de una publicación bajo revisión en el European Journal of Operational Research, que publicaré acá en algún momento.

En este trabajo estudiamos cómo las redes sociales impactan la fuga de clientes en compañías de telefonía móvil. (Imagen por Zigomitros Athanasios)
Algunos insights interesantes de este trabajo:
- El fenómeno de la fuga tiene un fuerte efecto local: Las influencias son en tu red directa (las personas a quienes más llamas son más propensas de fugarse contigo), pero esta influencia se propaga muy poco a los amigos de tus amigos. Probablemente esto significa que uno influencia su círculo local (familia y quizás amigos muy cercanos), pero no más allá.
- Las variables de redes sociales son prácticamente independientes de otras: La propuesta de valor agregado de estas variables pasa porque representan información que no está contenida en ningún otro tipo de variables. No es «más de lo mismo», sino que es información totalmente novedosa, con muy baja correlación. Y al menos en fuga funciona bien para predecir, al igual que en fraude como probamos el año pasado (ver acá).
- Desde el punto de vista teórico: No se gana mucho al usar collective inference en este problema, es mejor estimar variables con un modelo relacional y luego estimar un modelo predictivo en conjunto con variables clásicas. La razón puede tener que ver con la influencia local de la fuga.
Pienso que los resultados fueron muy interesantes. Actualmente preparamos un framework en R para poder realizar experimentos rápidamente, tenemos la publicación en EJOR bajo revisión, y estamos explorando el uso de estas herramientas en muchos otros campos. ¿Tienen experiencias similares? Feliz de leerlas.