Hace algunas semanas me invitaron a publicar una columna en El Mercurio sobre alg煤n tema que considerara interesante. Eleg铆 hablar un poco acerca de las 煤ltimas investigaciones que he hecho, donde he tratado de integrar distintas fuentes de datos, integrando redes sociales, texto, y variables cl谩sicas. Copio el texto ac谩, pero pueden ver la columna original aqu铆.

El valor est谩 en la diversidad

Mucho se habla de Big Data, Data Science, Deep Learning y Analytics como las grandes fuentes de competitividad en una empresa. Pero el an谩lisis de datos no tiene por qu茅 ser Big, pero s铆 tiene que ser Deep: imaginativo y perspicaz.

Tomemos la inclusi贸n financiera, por ejemplo, donde la meta es proveer el mayor acceso a financiamiento a todos los sectores de la sociedad. El riesgo en las PYME o en las personas que reci茅n entran al mercado laboral es muy dif铆cil de medir, ya que no existe historial financiero con el cual realizar estimaciones. Esto ha resultado en altas tasas de inter茅s, baja cobertura, y en consecuencia menor crecimiento y empleo.

FICO, el proveedor m谩s importante de modelos de riesgo de cr茅dito, ha dicho que tres mil millones de personas podr铆an tener acceso a financiamiento a costo razonable, si pudi茅semos medir mejor su riesgo. Ellos se encuentran actualmente probando el valor de la psicometr铆a, el uso de test est谩ndares como los utilizados para postular a un trabajo, para construir nuevos modelos de riesgo cuando no existe informaci贸n crediticia. Pilotos en 脕frica y Asia ya permiten casi triplicar la tasa de detecci贸n de malos pagadores, y esto s贸lo en el primer a帽o de uso.

A partir de la intersecci贸n de datos bancarios y datos de llamadas telef贸nicas entre personas, un equipo del que participo ha construido un sistema para personas sin historial crediticio, que predice el no pago con la misma eficacia de un modelo bancario cl谩sico. Su secreto se encuentra en que construimos la red social de las llamadas telef贸nicas del solicitante, y calculamos la intensidad del contacto (las llamadas) con personas con buen historial. La responsabilidad financiera parece ser contagiosa: mientras menos riesgosas son las personas con quienes se contacta una persona, menos riesgosa es la persona misma. Mejor dicho, el contexto social de una persona tiene influencia sobre su comportamiento.

Estos ejemplos apuntan al verdadero valor de los datos. La inversi贸n no debe ir por herramientas sofisticadas sin ning煤n objetivo claro. Hay que preguntarse qu茅 fuentes de datos no se est谩n utilizando, c贸mo incorporarlas, y finalmente qu茅, y m谩s importante a qui茅nes, necesito para accionar sobre ellas. Esto siempre debe ser hecho con responsabilidad, respetando las leyes y los conflictos 茅ticos potenciales (驴deber铆amos usar psicometr铆a o llamadas entre celulares?), pero una vez sobrepasadas estas barreras las ganancias son directas.

Todo esto es posible ya que podemos representar el comportamiento desde m煤ltiples perspectivas. En los datos, tal como en las sociedades que 茅stos representan, el mayor valor se alcanza cuando se aprovecha la diversidad de todos bajo el alero de un modelo s贸lido.