Hace un tiempo venci贸 el periodo de embargo de mi paper m谩s citado: 芦APATE: A novel approach for automated credit card transaction fraud detection using network-based extensions禄, publicado en Decision Support Systems en 2015. Este paper lo armamos mientras trabajaba como postdoctorante en el grupo de Bart Baesens, en la KU Leuven, B茅lgica, y fue liderado por V茅ronique Van Vlasslaer, en ese entonces estudiante de doctorado. El paper est谩 disponible gratuitamente para descarga aqu铆.

En este paper usamos la misma t茅cnica que usa Google para dar peso a las p谩ginas web del internet para medir c贸mo se propaga el fraude en las compras de tarjetas de cr茅dito en l铆nea. La idea es la siguiente: Adem谩s de contrastar el los patrones de compra de un comprador (usando el cl谩sico modelo RFM), buscamos medir el riesgo que tiene una compra (par comprador – vendedor) dado los fraudes que hemos observado. Esto lo hacemos con el principio del algoritmo PageRank, que dice que tu importancia (tu riesgo de fraude) est谩 medido a partir del riesgo de fraude de tus cercanos, como muestra la siguiente figura.

Red social que muestra las conexiones entre compradores y vendedores, unidos por las compras que realizan. Extra铆do de Van Vlasslaer et al. (2015), licencia CC BY-NC-ND.

Las conclusiones principales de nuestro trabajo fueron las siguientes:

  • Las variables de redes sociales presentan muy baja correlaci贸n con las dem谩s variables de comportamiento. Por lo tanto son una muy buena聽fuente de informaci贸n.
  • El modelo presenta una ganancia de entre un 5% a un 10% con respecto a modelos con menos fuentes de informaci贸n, como se ve abajo.
AUC para diferentes conjuntos de variables

Comparaci贸n AUC entre modelos con distintas fuentes de informaci贸n. El modelo con redes sociales presenta un AUC de 0,986, muy por sobre el resto. Reproducido de Van Vlasslaer et al. (2015), licencia CC BY-NC-ND

 

  • Tarda un par de horas en entrenar una red social para un par de millones de transacciones (el volumen diario esperado de transacciones), por lo que es necesario utilizar redes del d铆a anterior en un caso real. Los resultados anteriores reflejan esta situaci贸n. Nuestro modelo es capaz de generar una predicci贸n en un par de milisegundos.
  • Las variables de redes sociales capturan nuevos patrones a medida que aparecen, sin necesidad de mayor informaci贸n por parte del cliente m谩s all谩 de reportar el robo. Las variables de comportamiento (RFM) permiten dar a su vez una alerta temprana cuando se observan comportamientos an贸malos para cada cliente. As铆, generamos perfiles de comportamiento muy complejos.

Siempre es mejor utilizar mejores fuentes de informaci贸n que modelos m谩s sofisticados, por lo que si tienen situaciones donde hay conexiones entre sus entidades, el uso de redes sociales presenta una gran oportunidad para mejorar sus modelos.