Un enfoque práctico para leer las señales en los datos
por Douglas Merrill
Los macrodatos no son nuevos. Una gran cantidad de información de bases de datos ha estado latente en las empresas durante años, solo que ahora tenemos la tecnología para entenderla. Con las nuevas herramientas y métodos, puede utilizar esa información para hacer mejores predicciones (y decisiones) sobre su empresa.
Esta es una forma de empezar: imagine una matriz, una hoja de cálculo, por así decirlo. Las filas capturan algo que ya sabe sobre una interacción. Esa interacción puede ser una venta o alguna otra actividad individual (a menudo denominada «caso»). Las columnas son aspectos de esa interacción; siguiendo con la analogía de las compras, las columnas pueden ser la forma en que pagó o la hora del día en que se produjo la venta. Se conocen como «señales» porque pueden ayudar a predecir alguna variable objetivo futura. Puede ser, por ejemplo, qué más quiera comprar, dada una compra actual.
Según lo que mida, podría tener el siguiente aspecto:
Su objetivo es construir esta matriz y hacer que sea lo más grande y completa posible. Si es como la mayoría de las empresas, es probable que ya tenga algunos datos en las bases de datos y en los registros de sus servidores web. Los nuevos métodos se pueden aplicar cuando sus datos no estén completos. Encontrar, almacenar y fusionar todos estos datos requiere potencia computacional, redes y almacenamiento barato; el rápido aumento de los teléfonos inteligentes es solo una de las formas en que cada uno de ellos se ha hecho omnipresente en los últimos años.
Esto significa que para obtener resultados más precisos, tendrá que ampliar su conjunto de datos. Hay un par de formas de aumentar la cantidad de datos que utiliza para hacer mejores predicciones:
En primer lugar, puede añadir más fundas. Así es, por ejemplo, como los minoristas hacen inferencias de ventas. Añadir más mayúsculas y minúsculas (filas en la hoja de cálculo) reduce la probabilidad de valores atípicos estadísticos y de varianzas aleatorias en las medidas, por lo que puede confiar más en el resultado. Un minorista tendrá muchos datos de transacciones que podrá utilizar para hacer inferencias.
Pero la forma más poderosa es añadir señales. Añadir señales (columnas) le permite hacer dos cosas: primero, puede revelar nuevas relaciones y permitir nuevas inferencias. Con una nueva variable, puede que vea una correlación en los datos de la que no se había dado cuenta antes. En segundo lugar, añadir señales hace que sus inferencias estén menos sujetas a sesgos en cualquier número de señales individuales. Añade casos, manteniendo las mismas señales, para entender mejor esas variables. Por el contrario, añade señales para poder superar los errores en otras señales en las que confía.
Aunque gran parte del debate sobre los macrodatos se ha centrado en añadir casos (de hecho, la percepción común del «macrodato» es poder rastrear muchas transacciones), lo más probable es que añadir señales transforme un negocio. Cuantas más señales tenga, más conocimientos nuevos podrá crear. Por ejemplo, Google usa cientos de señales para clasificar las páginas web.
La evolución de aseguramiento — el proceso de evaluar la elegibilidad de un préstamo — es otra historia de éxito de macrodatos que aún se está contando. Históricamente, la suscripción la realizaba alguien que conocía al solicitante. Por lo general, un funcionario de un banco tomaba las decisiones crediticias de los solicitantes en función del «carácter» de los solicitantes (a qué iglesia asistían, en qué escuela estaban sus hijos, etc. La suscripción basada en la opinión de un oficial de crédito utilizaba mucha perspectiva sobre el solicitante, pero no era muy escalable; hay un número limitado de oficiales de préstamos en el mundo. Y, por supuesto, los oficiales utilizaban un número reducido de señales, por lo que había un sesgo sistémico en el proceso.
A principios de la década de 1970, Fair Isaac saltó a la fama mundial como proveedor de productos estandarizados FICO puntuación que sustituyó gran parte del papel de los oficiales de crédito. La puntuación estandarizada aumentó enormemente la disponibilidad de crédito y, por lo tanto, redujo el coste de los préstamos. Sin embargo, las puntuaciones FICO tienen sus límites. Las puntuaciones tienen un rendimiento especialmente bajo para quienes no tienen mucha información en su historial crediticio o para quienes tienen un crédito relativamente malo. No es culpa de FICO, es de las matemáticas que utilizan. Con muy pocas señales en sus modelos, la puntuación FICO no tiene la capacidad de distinguir entre el riesgo crediticio en un grupo de riesgo generalmente alto.
La forma de abordar esto es añadir más señales. Por ejemplo, se pueden utilizar miles de señales para analizar el riesgo crediticio de una persona. Puede ser de todo, desde el exceso de ingresos disponibles hasta el tiempo que el solicitante dedicó a la solicitud y si el número de seguro social del solicitante aparece asociado a una persona muerta. Cuantas más señales se utilicen, más preciso será el panorama financiero que puede obtener el prestamista, especialmente para los solicitantes con archivos reducidos que necesitan acceso al crédito y probablemente no tengan los puntos de datos tradicionales que analiza un prestamista.
Fair Isaac tiene millones de fundas para usar, pero más señales dan un producto mejor. En este caso, pueden ofrecer una imagen más completa de la calificación crediticia de una persona que el estándar del sector y, como resultado, un crédito de menor coste para un mayor número de personas.
Como decíamos en Google: «Las opiniones son excelentes, los datos son mejores». El big data es a la vez casos y señales, pero las señales ganan al final. En lugar de gastar su tiempo y dinero en tecnología en conseguir casos adicionales, utilice estos recursos para obtener señales adicionales que le permitan encontrar nuevas relaciones.
Artículos Relacionados

La IA es genial en las tareas rutinarias. He aquí por qué los consejos de administración deberían resistirse a utilizarla.

Investigación: Cuando el esfuerzo adicional le hace empeorar en su trabajo
A todos nos ha pasado: después de intentar proactivamente agilizar un proceso en el trabajo, se siente mentalmente agotado y menos capaz de realizar bien otras tareas. Pero, ¿tomar la iniciativa para mejorar las tareas de su trabajo le hizo realmente peor en otras actividades al final del día? Un nuevo estudio de trabajadores franceses ha encontrado pruebas contundentes de que cuanto más intentan los trabajadores mejorar las tareas, peor es su rendimiento mental a la hora de cerrar. Esto tiene implicaciones sobre cómo las empresas pueden apoyar mejor a sus equipos para que tengan lo que necesitan para ser proactivos sin fatigarse mentalmente.

En tiempos inciertos, hágase estas preguntas antes de tomar una decisión
En medio de la inestabilidad geopolítica, las conmociones climáticas, la disrupción de la IA, etc., los líderes de hoy en día no navegan por las crisis ocasionales, sino que operan en un estado de perma-crisis.