Donde el análisis predictivo está teniendo el mayor impacto
por Jacob LaRiviere, Preston McAfee, Justin Rao, Vijay K. Narayanan, Walter Sun

vincent tsui PARA HBR
Se acerca la revolución de los macrodatos. Las empresas se esfuerzan por contratar una nueva marca de analistas denominados «científicos de datos», y las universidades han respondido a esta demanda introduciendo cursos de ciencia de datos en grados que van desde la informática hasta los negocios. Los informes basados en encuestas revelan que las empresas gastan actualmente aproximadamente 36 000 millones de dólares en almacenamiento e infraestructura, y se espera que el doble para 2020.
Una vez que las empresas registren y almacenen datos detallados sobre todas sus interacciones con los clientes y sus procesos internos, ¿qué sigue? Presumiblemente, las empresas invierten en una infraestructura de macrodatos porque creen que ofrece una rentabilidad de la inversión positiva. Sin embargo, al observar las encuestas y los informes de consultoría, no está claro cuáles son los casos de uso precisos que impulsarán este ROI positivo del big data.
Nuestro objetivo en este artículo es ofrecer estudios de casos específicos del mundo real para mostrar cómo los macrodatos han aportado valor a las empresas que han trabajado con los equipos de análisis de Microsoft. Estos casos revelan las circunstancias en las que es probable que el análisis predictivo del big data permita soluciones novedosas y de gran valor, y las situaciones en las que es probable que las ganancias sean mínimas.
Predecir la demanda. El primer caso de uso implica predecir la demanda de productos de consumo que están en la «cola larga» del consumo. Las empresas valoran las previsiones de demanda precisas porque es caro mantener el inventario en las estanterías y los desabastecimientos van en detrimento tanto de los ingresos a corto plazo como de la fidelización de los clientes a largo plazo. Las ventas totales agregadas son un indicador deficiente porque las empresas necesitan distribuir el inventario geográficamente, lo que requiere previsiones hiperlocales. La forma tradicional de resolver este problema es usar econometría de series temporales con datos históricos de ventas. Este método funciona bien con los productos populares en regiones grandes, pero tiende a fallar cuando los datos se reducen porque el ruido aleatorio abruma la señal subyacente.
Una solución de macrodatos para este problema consiste en utilizar datos anónimos y agregados de búsquedas o opiniones en la web vinculados a la ubicación de cada tienda, además de los datos de series temporales existentes. Los científicos de datos de Microsoft han empleado este enfoque para ayudar a una empresa de pronósticos a predecir las ventas de automóviles. Crear modelos con los datos de las búsquedas en la web como una de las entradas reduce el error medio de previsión absoluto, una medida estándar de la precisión de las predicciones, para las predicciones de ventas nacionales mensuales en torno a un 40% con respecto al valor base para las marcas de automóviles con cuotas de mercado relativamente pequeñas, en comparación con los modelos de series temporales tradicionales. Si bien las ganancias fueron menores para los modelos más populares a nivel nacional, la mejora relativa aumenta a medida que se profundiza hasta el nivel regional.
Centro Insight
Operaciones en un mundo conectado
Patrocinado por Accenture
Las tecnologías y los procesos que están transformando las empresas.
En este caso, la solución de macrodatos aprovecha el punto de datos no utilizado anteriormente para que las personas realicen una cantidad considerable de consultas sociales e investigaciones en Internet antes de comprar un coche. La mayor precisión de las predicciones, a su vez, permite lograr grandes aumentos en la eficiencia operativa, con el inventario correcto en los lugares correctos.
Los datos de búsqueda web anonimizados también han demostrado ser útiles para otras previsiones, ya que la actividad en línea suele ser un buen indicador de las compras y las acciones del público en general. Disponer de los datos adicionales no es suficiente por sí solo. Procesar los datos de búsqueda y combinarlos con las fuentes tradicionales es vital para crear una predicción exitosa: descubrimos que el volumen de consultas de búsqueda sin procesar es insuficiente para analizar las señales que se correlacionan con la demanda real de productos.
Ser inteligente a la hora de determinar qué señales extraer del big data requiere cuidado, y las mejores prácticas pueden ser específicas para cada caso. Por ejemplo, las consultas individuales de un usuario pueden ser menos importantes que las consultas múltiples de un usuario. Aunque utilizamos los datos de búsqueda en este estudio de caso, una empresa podría utilizar fácilmente la ubicación de los usuarios que visitan su sitio web o vincular los datos de ventas detallados a la ubicación de un cliente.
Mejora de precios. Utilizar un precio único es ineficiente desde el punto de vista económico, ya que parte de la curva de demanda que podría atenderse de forma rentable tiene precios fuera del mercado. Como consecuencia, las empresas ofrecen normalmente descuentos, promociones y precios segmentados para dirigirse a diferentes consumidores. Los sitios web de comercio electrónico tienen una clara ventaja a la hora de adoptar este enfoque, ya que registran información detallada sobre la navegación de los clientes, no solo sobre los productos que acaban comprando, y ajustan los precios de forma agresiva con el tiempo. Estos ajustes de precios son una forma de experimentación y, junto con los macrodatos, permiten a las empresas obtener más información sobre la capacidad de respuesta de los precios de sus clientes.
Los minoristas fuera de línea pueden imitar las matizadas estrategias de precios del comercio electrónico rastreando a los consumidores a través de la conectividad de los teléfonos inteligentes y registrando qué clientes entran a la tienda, qué tipo de productos ven y si realizan una compra. El aprendizaje automático aplicado a estos datos puede generar segmentos de clientes de forma algorítmica en función de la capacidad de respuesta y las preferencias de los precios, lo que, en general, ofrece una gran mejora con respecto a la segmentación tradicional basada en la demografía.
Nuestra experiencia con la publicidad de precios en el motor de búsqueda Bing es que el uso de macrodatos puede generar beneficios sustanciales al hacer coincidir mejor a los anunciantes con los consumidores. El éxito de la segmentación algorítmica está bien documentado y es uno de los principales impulsores de los ingresos en el mercado de la publicidad online. Los avances en la tecnología de medición permiten cada vez más a las empresas fuera de línea beneficiarse de este tipo de beneficios a través de precios más eficientes.
Mantenimiento predictivo. El buen funcionamiento de las cadenas de suministro es vital para obtener beneficios estables. El tiempo de inactividad de las máquinas supone un coste para las empresas debido a la pérdida de productividad y puede ser particularmente disruptivo tanto en las complejas cadenas de suministro de fabricación como en los productos de consumo. Los ejecutivos de los sectores con un uso intensivo de activos suelen afirmar que el principal riesgo operativo para sus empresas son las quiebras inesperadas de sus activos. Una ola de nuevos datos generados por el «Internet de las cosas» (IoT) puede proporcionar telemetría en tiempo real sobre aspectos detallados de los procesos de producción. Los modelos de aprendizaje automático basados en estos datos permiten a las empresas predecir cuándo fallarán diferentes máquinas.
Las compañías aéreas están especialmente interesadas en predecir los fallos mecánicos con antelación para reducir los retrasos o las cancelaciones de los vuelos. Los científicos de datos de Microsoft del equipo de Cortana Intelligence Suite pueden predecir la probabilidad de que las aeronaves se retrasen o cancelen en el futuro basándose en las fuentes de datos pertinentes, como el historial de mantenimiento y la información de las rutas de vuelo. Una solución de aprendizaje automático basada en datos históricos y aplicada en tiempo real predice el tipo de problema mecánico que provocará el retraso o la cancelación de un vuelo en las próximas 24 horas, lo que permite a las compañías aéreas tomar medidas de mantenimiento mientras las aeronaves están en servicio y, por lo tanto, evitar posibles retrasos o cancelaciones.
También se utilizan soluciones de mantenimiento predictivo similares en otros sectores: por ejemplo, el seguimiento de los datos de telemetría en tiempo real para predecir la vida útil restante del motor de un avión, el uso de los datos de los sensores para predecir el fracaso de una transacción de retiro de efectivo en un cajero automático, el uso de datos de telemetría para predecir el fallo de las bombas sumergibles eléctricas utilizadas para extraer crudo en la industria del petróleo y el gas, predecir los fallos de las placas de circuitos en las primeras etapas del proceso de fabricación, predecir los impagos crediticios, y pronosticar la demanda de energía en las regiones hiperlocales para predecir las situaciones de sobrecarga de las redes eléctricas. El aprendizaje automático hará que las cadenas de suministro sean menos frágiles y reducirá los efectos de las interrupciones en muchos bienes y servicios.
Estos casos ayudan a poner de relieve algunos principios generales:
- El valor derivado de la parte de análisis puede superar con creces el coste de la infraestructura. Esto indica que habrá un fuerte crecimiento de los servicios de consultoría de macrodatos y de las funciones especializadas en las empresas.
- Los macrodatos tienen menos que ver con el tamaño y más con introducir información fundamentalmente nueva en los procesos de predicción y decisión. Esta información es más importante cuando las fuentes de datos existentes no son suficientes para ofrecer predicciones precisas o procesables, por ejemplo, debido al tamaño reducido de las muestras o a la reducción del historial de ventas (pequeñas regiones efectivas, productos especializados, nuevas ofertas, etc.).
- La nueva información suele estar escondida en registros de datos detallados y relativamente desestructurados (conocidos como «lago de datos»), y se necesitan técnicas de la informática para extraer información de ella. Para aprovechar los macrodatos, es vital contar con ingenieros de datos, estadísticos y científicos del comportamiento con talento que trabajen en conjunto. «Científico de datos» se utiliza a menudo para referirse a alguien que tiene estas tres habilidades, pero según nuestra experiencia, las personas solteras rara vez tienen las tres.
Aplicaciones radicalmente nuevas. Los casos que hemos analizado se refieren a la forma en que se pueden utilizar los macrodatos para mejorar los procesos existentes (por ejemplo, previsiones de la demanda más precisas, mejores estimaciones de la sensibilidad a los precios, mejores predicciones de los fallos de las máquinas). Pero también tiene el potencial de aplicarse de manera que pueda generar disrupción en los procesos existentes. Por ejemplo, los modelos de aprendizaje automático que utilizan enormes conjuntos de datos como entradas, junto con diseños inteligentes que tienen en cuenta los historiales de los pacientes, tienen el potencial de revolucionar la forma en que se diagnostican y tratan ciertas enfermedades. Otro ejemplo consiste en hacer coincidir la generación de electricidad distribuida (por ejemplo, paneles solares en los tejados) con la demanda de electricidad localizada, lo que genera un enorme valor al equiparar la oferta y la demanda de electricidad con una generación más eficiente.
El valor descrito de predecir la demanda con mayor precisión, mejores precios y mantenimiento predictivo son los casos de uso específicos que justifican fácilmente las inversiones de las grandes empresas en infraestructura de macrodatos y ciencia de datos. Es probable que estos usos generen valor del mismo orden de magnitud que las inversiones. El valor de las aplicaciones radicalmente nuevas es difícil de entender ex ante y especulativas por naturaleza. Es razonable esperar pérdidas para muchas empresas, debido a las inversiones inciertas y de mayor riesgo, y algunas empresas obtienen beneficios espectaculares.
Artículos Relacionados

La IA es genial en las tareas rutinarias. He aquí por qué los consejos de administración deberían resistirse a utilizarla.

Investigación: Cuando el esfuerzo adicional le hace empeorar en su trabajo
A todos nos ha pasado: después de intentar proactivamente agilizar un proceso en el trabajo, se siente mentalmente agotado y menos capaz de realizar bien otras tareas. Pero, ¿tomar la iniciativa para mejorar las tareas de su trabajo le hizo realmente peor en otras actividades al final del día? Un nuevo estudio de trabajadores franceses ha encontrado pruebas contundentes de que cuanto más intentan los trabajadores mejorar las tareas, peor es su rendimiento mental a la hora de cerrar. Esto tiene implicaciones sobre cómo las empresas pueden apoyar mejor a sus equipos para que tengan lo que necesitan para ser proactivos sin fatigarse mentalmente.

En tiempos inciertos, hágase estas preguntas antes de tomar una decisión
En medio de la inestabilidad geopolítica, las conmociones climáticas, la disrupción de la IA, etc., los líderes de hoy en día no navegan por las crisis ocasionales, sino que operan en un estado de perma-crisis.