PathMBA Vault

Analytics and data science

La democratización de la ciencia de datos

por Jonathan Cornelissen

La democratización de la ciencia de datos

jul18-27-833771544-Patricia-Toth-McCormick

Patricia Toth McCormick/Getty Images

¿Quiere atrapar a los tramposos fiscales? El gobierno de Ruanda sí, y las encuentra estudiando las anomalías en los datos de recaudación de ingresos.

¿Quiere entender cómo está cambiando la cultura estadounidense? Lo mismo ocurre con un sociólogo en ciernes en Indiana. Utiliza la ciencia de datos para encontrar patrones en las enormes cantidades de texto que la gente utiliza cada día para expresar sus visiones del mundo, patrones que ningún lector individual podría reconocer.

Las personas inteligentes encuentran nuevos usos para la ciencia de datos todos los días. Aun así, a pesar del enorme interés por los datos recopilados por casi todos los sectores de la empresa estadounidense (desde las compañías financieras y las firmas de atención médica hasta las consultorías de gestión y el gobierno), muchas organizaciones siguen relegando los conocimientos de ciencia de datos a un número reducido de empleados.

Eso es un error y, a la larga, es insostenible. Piénselo de esta manera: muy pocas empresas esperan solo escritores profesionales para saber escribir. Entonces, ¿por qué pregunta? solo científicos de datos profesionales para entender y analizar los datos, ¿al menos a un nivel básico?

Relegar todo el conocimiento de los datos a un puñado de personas de una empresa es problemático en muchos niveles. A los científicos de datos les resulta frustrante porque les resulta difícil comunicar sus hallazgos a sus colegas que carecen de conocimientos básicos de datos. Las partes interesadas de la empresa no están contentas porque las solicitudes de datos tardan demasiado en tramitarse y, a menudo, no responden a las preguntas originales. En algunos casos, se debe a que el autor de la pregunta no explicó la pregunta correctamente al científico de datos.

¿Por qué necesitarían aprender ciencia de datos los que no son científicos de datos? Eso es como preguntarse por qué se espera que las personas que no son contadores se mantengan dentro del presupuesto.

Hoy en día, todos los sectores están repletos de datos y las organizaciones que tienen éxito son las que más rápido dan sentido a sus datos para adaptarse a lo que viene. La mejor manera de permitir un descubrimiento rápido y una visión más profunda es dispersar la experiencia en ciencia de datos en toda la organización.

Las empresas que quieren competir en la era de los datos tienen que hacer tres cosas: compartir herramientas de datos, difundir las habilidades con los datos y difundir la responsabilidad con los datos.

Compartir herramientas

La mayoría de las herramientas de datos pertenecen al equipo de ciencia de datos. Si bien esto puede parecer lógico, crear un silo de herramientas de datos y restringir el acceso a un grupo reducido de empleados supone una carga demasiado pesada para esos empleados. La mayoría de las consultas de otros departamentos (ingeniería, finanzas, producto, marketing) son solicitudes relativamente sencillas que cualquier persona con formación básica podría cumplir. Al encargar a los científicos de datos tareas básicas de control, las organizaciones desvían su atención de los proyectos más grandes que requieren su amplia experiencia.

Airbnb, cree firmemente en la democratización de la ciencia de datos, se esfuerza por permitir a todos los miembros del equipo tomar decisiones basadas en los datos. Para garantizarlo, la empresa creó su propia Universidad de Datos.

Las herramientas colaborativas también ayudan. En Airbnb, cualquiera puede publicar un artículo en un repositorio de conocimientos. El resto de la empresa ve nuevos análisis en una sección de noticias que les permiten saber (1) qué nuevo problema se acaba de resolver y (2) quién lo ha resuelto, de modo que cualquier persona que tenga más preguntas sepa a quién llamar. Además de ayudar a toda la empresa a ser más eficaz, estos artículos reconocen a las personas que los publican, lo que incentiva a otros a hacer lo mismo.

Compartir habilidades

Por supuesto, cuando comparte herramientas de datos, también necesita permitir que las personas usen esas herramientas. No todas las empresas pueden crear su propia universidad de datos. Sin embargo, según las herramientas de datos que utilice su organización, hay una variedad de programas educativos, tanto en línea como presenciales, que pueden ayudar a su equipo a ponerse al día. (Por supuesto, soy parcial: fui cofundador de uno de ellos.)

A medida que su equipo tenga la oportunidad de aprender esas habilidades, se sentirá más cómodo al utilizar los datos en cada decisión importante. Quedará claro que algunos miembros del equipo se sienten más cómodos con las habilidades de datos que otros. Anime a los más competentes a ser mentores de los demás. Incluso en nuestra empresa, donde la ciencia de datos es nuestro negocio, algunas personas no trabajan con los datos todo el tiempo. Cuando necesitan ayuda en un problema complicado, hacen pareja con los que la necesitan.

Un equipo alfabetizado en datos hace mejores solicitudes. Incluso un conocimiento básico de las herramientas y los recursos mejora en gran medida la calidad de la interacción entre los compañeros. Cuando el «nivel de esfuerzo» (la cantidad de ida y vuelta necesaria para aclarar lo que se quiere) de cada solicitud disminuye, la velocidad y la calidad aumentan.

Las habilidades compartidas mejoran la cultura laboral y también los resultados de otra manera: mejoran la comprensión mutua. Si sabe lo difícil que será obtener una salida de datos en concreto, ajustará la forma en que interactúa con las personas que le dan esa salida. Estos ajustes mejoran el lugar de trabajo para todos.

Compartir la responsabilidad

Una vez que una organización ofrezca el acceso y la formación necesarios para democratizar los datos entre sus empleados, puede que sea el momento de ajustar las funciones y responsabilidades. Como mínimo, los equipos deberían poder acceder a los conjuntos de datos más relevantes para sus propias funciones y comprenderlos. Sin embargo, al equipar a más miembros del equipo con habilidades básicas de codificación, las organizaciones también pueden esperar que los equipos que no son de ciencia de datos apliquen estos conocimientos a la resolución de problemas departamentales, lo que se traducirá en resultados considerablemente mejores.

Si sus empleados conocen los datos, por ejemplo, su equipo de datos centralizado puede cambiar su enfoque de «hacer el trabajo de los demás con los datos» a «crear las herramientas que permitan a todos hacer que sus datos trabajen más rápido». Nuestro propio equipo de datos no realiza análisis todos los días. En cambio, crea nuevas herramientas que todos pueden utilizar para que 50 proyectos puedan avanzar tan rápido como un proyecto anterior.

La ciencia de datos ya no es solo para los científicos de datos, si es que alguna vez lo fue. Las empresas inteligentes actuales se aseguran de que muchos de sus empleados hablen el idioma de los datos y lo utilicen para mejorar los resultados laborales. Al capacitar a los empleados con estas habilidades fundamentales, las empresas están alcanzando niveles enormes de innovación y eficiencia.