PathMBA Vault

Desarrollo de productos

Cómo crear excelentes productos de datos

por Emily Glassberg Sands

Cómo crear excelentes productos de datos

CintaScotch/Getty Images

Los productos impulsados por los datos y el aprendizaje automático pueden ser una forma eficaz de resolver las necesidades de los usuarios. También pueden crear un «foso de datos» que ayude a mantener a raya a la competencia. Los ejemplos clásicos incluyen la búsqueda de Google y las recomendaciones de productos de Amazon, que mejoran a medida que más usuarios interactúan. Pero la oportunidad va mucho más allá de los gigantes tecnológicos: empresas de diferentes tamaños y sectores están invirtiendo en sus propios productos basados en datos. En Coursera, utilizamos el aprendizaje automático para ayudar a los alumnos a encontrar el mejor contenido para alcanzar sus objetivos de aprendizaje y para asegurarnos de que cuentan con el apoyo —automatizado y humano— que necesitan para triunfar.

El ciclo de vida de un denominado «producto de datos» refleja el desarrollo de productos estándar: identificar la oportunidad de resolver una necesidad principal de los usuarios, crear una versión inicial y, a continuación, evaluar su impacto y realizar iteraciones. Sin embargo, el componente de datos añade una capa adicional de complejidad. Para hacer frente al desafío, las empresas deberían hacer hincapié en la colaboración interfuncional, evaluar y priorizar las oportunidades de los productos de datos con la vista puesta en el largo plazo y empezar de forma sencilla.

Etapa 1: Identificar la oportunidad

Los productos de datos son un deporte de equipo

Identificar las mejores oportunidades de productos de datos exige unir la perspectiva del producto y la empresa con la perspectiva de la tecnología y los datos. Los directores de producto, los investigadores de usuarios y los líderes empresariales suelen tener una gran intuición y experiencia en el campo para identificar las principales necesidades empresariales y de los usuarios sin resolver. Mientras tanto, los científicos e ingenieros de datos tienen un buen ojo para identificar soluciones factibles basadas en datos y una fuerte intuición sobre qué se puede escalar y cómo.

Para identificar y priorizar las oportunidades de productos de datos correctas, reúna estas dos caras de la mesa. Algunas normas pueden ayudar:

  • Educar a los científicos de datos sobre las necesidades de los usuarios y la empresa. Ayudará mantener a los científicos de datos en estrecha colaboración con los directores de productos, los investigadores de usuarios y los líderes empresariales, y garantizar que parte de su función consista en analizar los datos directamente para entender a los usuarios y sus necesidades.
  • Haga que los científicos de datos actúen como evangelistas de datos, socializar las oportunidades de datos con la organización en general. Esto puede ir desde proporcionar a la organización un fácil acceso a los datos sin procesar y a las muestras de resultados del modelo en las primeras etapas de la ideación, hasta crear prototipos completos en las etapas posteriores.
  • Desarrolle el conocimiento de los datos de los grupos de productos y empresas. Personas de diversas funciones e industrias están mejorando sus habilidades en datos y los empleadores pueden acelerar la tendencia invirtiendo en programas de aprendizaje. Cuanto mayor sea el conocimiento de los datos del producto y las funciones empresariales, mejor podrán colaborar con los equipos de ciencia y tecnología de datos.
  • Dé a la ciencia de datos un asiento en la mesa. La ciencia de datos puede estar en diferentes lugares de la organización (por ejemplo, centralizada o descentralizada), pero sea cual sea la estructura, tener a los líderes de la ciencia de datos en la sala para debatir sobre productos y estrategias empresariales acelerará el desarrollo de los productos de datos.

Priorizar con la vista puesta en el futuro

Los mejores productos de datos mejoran con los años, como un buen vino. Esto es cierto por dos razones:

En primer lugar, las aplicaciones de productos de datos suelen acelerar la recopilación de datos, lo que a su vez mejora la aplicación. Considere un producto de recomendaciones basado en los datos de perfil autodeclarados por los usuarios. Con datos de perfil limitados en la actualidad, la inicial (o «arranque en frío») las recomendaciones pueden resultar poco inspiradoras. Pero si los usuarios están más dispuestos a rellenar un perfil cuando lo utilizan para personalizar su experiencia, el lanzamiento de recomendaciones acelerará la recopilación de perfiles y las mejorará con el tiempo.

En segundo lugar, se pueden crear muchos productos de datos para impulsar varias aplicaciones. No se trata solo de distribuir la costosa I+D en diferentes casos de uso, sino de crear efectos de red a través de los datos compartidos. Si los datos producidos por cada aplicación se retroalimentan a las bases de datos subyacentes, las aplicaciones mejoran, lo que a su vez impulsa una mayor utilización y, por lo tanto, la recopilación de datos, y el ciclo virtuoso continúa. De Coursera Gráfico de habilidades es un ejemplo. El gráfico, una serie de algoritmos que asignan una sólida biblioteca de habilidades al contenido, las carreras y los alumnos, impulsa una serie de aplicaciones relacionadas con el descubrimiento en el sitio, muchas de las cuales generan datos de entrenamiento que refuerzan el gráfico y, a su vez, mejoran sus aplicaciones.

Centrarse demasiado en el rendimiento a corto plazo puede generar una inversión insuficiente en oportunidades prometedoras a medio o largo plazo. De manera más general, no se puede exagerar la importancia de los datos de alta calidad; las inversiones en la recopilación y el almacenamiento de datos deben priorizarse en cada etapa.

Etapa 2: Crear el producto

Elimine el riesgo organizando la ejecución

Los productos de datos generalmente requieren validar si el algoritmo funciona y si les gusta a los usuarios. Como resultado, los creadores de productos de datos se enfrentan a una tensión inherente entre cuánto invertir en I+D por adelantado y la rapidez con la que se publica la aplicación para validar que resuelve una necesidad fundamental.

Los equipos que invierten demasiado en la validación técnica antes de validar la adecuación del producto al mercado corren el riesgo de desperdiciar sus esfuerzos de I+D apuntando al problema o la solución equivocados. Por el contrario, los equipos que invierten de más en validar la demanda de los usuarios sin suficiente I+D pueden acabar presentando a los usuarios un prototipo con poca potencia y, por lo tanto, se arriesgan a un falso negativo. Los equipos de este extremo del espectro pueden lanzar un MVP impulsado por un modelo débil; si los usuarios no responden bien, es posible que con una mayor I+D que impulse la aplicación, el resultado hubiera sido diferente.

Si bien no existe una fórmula mágica para validar simultáneamente la adaptación de la tecnología y el producto al mercado, la ejecución por etapas puede ayudar. Empezar de forma sencilla acelerará tanto las pruebas como la recopilación de datos valiosos. Al crear nuestro gráfico de habilidades, por ejemplo, lanzamos inicialmente búsqueda basada en habilidades — una aplicación que solo necesitaba un pequeño subconjunto del gráfico y que generaba una gran cantidad de datos de entrenamiento adicionales. Una serie de enfoques de MVP también pueden reducir el tiempo de las pruebas:

  • Modelos ligeros por lo general, se envían más rápido y tienen la ventaja adicional de que son más fáciles de explicar, depurar y desarrollar con el tiempo. Si bien el aprendizaje profundo puede ser poderoso (y no cabe duda de que es tendencia), en la mayoría de los casos, no es el punto de partida.
  • Fuentes de datos externas, ya sean soluciones de código abierto o de compra o asociación, pueden acelerar el desarrollo. Si hay una señal fuerte en los datos que genera el producto, el producto se puede adaptar para que se base en ese diferenciador de la competencia.
  • Limitar el dominio puede reducir el alcance del desafío algorítmico para empezar. Por ejemplo, algunas aplicaciones se pueden crear y lanzar inicialmente solo para un subconjunto de usuarios o casos de uso.
  • Curación a mano — si los humanos hacen el trabajo que uno espera que haga el modelo, o al menos revisen y modifiquen el resultado inicial del modelo, puede acelerar aún más el desarrollo. Lo ideal es hacerlo con la vista puesta en cómo se podrían automatizar los pasos de curación manual con el tiempo para ampliar el producto.

Etapa 3: Evaluar e iterar

Tenga en cuenta el potencial futuro al evaluar el rendimiento de los productos de datos.

Evaluar los resultados después de un lanzamiento para tomar la decisión de aceptar o no un producto de datos no es tan sencillo como hacer un simple ajuste en la interfaz de usuario. Esto se debe a que el producto de datos puede mejorar sustancialmente a medida que recopile más datos y a que los productos de datos fundamentales pueden ofrecer muchas más funciones con el tiempo. Antes de diseñar un producto de datos que no parezca una victoria obvia, pida a sus científicos de datos que cuantifiquen las respuestas a algunas preguntas importantes. Por ejemplo, ¿a qué ritmo mejora el producto de forma orgánica gracias a la recopilación de datos? ¿Cuántos frutos fáciles hay para las mejoras algorítmicas? ¿Qué tipos de aplicaciones desbloqueará en el futuro? Según las respuestas a estas preguntas, un producto con métricas poco inspiradoras hoy en día podría merecer ser conservado.

La velocidad de iteración importa.

Los productos de datos suelen necesitar iteraciones tanto en los algoritmos como en la interfaz de usuario. El desafío consiste en determinar de dónde vendrán las iteraciones más valiosas, en función de los datos y los comentarios de los usuarios, de modo que los equipos sepan qué funciones están en apuros para impulsar las mejoras. Donde las iteraciones algorítmicas ocuparán un lugar central, como lo son generalmente en los sistemas complejos de recomendación o comunicación, como el de Coursera intervenciones de aprendizaje personalizadas — considere diseñar el sistema para que los científicos de datos puedan implementar y probar nuevos modelos de forma independiente en la producción.

Al fomentar la colaboración entre los líderes empresariales y de productos y los científicos de datos, priorizar las inversiones con la vista puesta en el futuro y empezar de forma sencilla, las empresas de todas las formas y tamaños pueden acelerar el desarrollo de potentes productos de datos que resuelvan las principales necesidades de los usuarios, impulsen el negocio y creen una ventaja competitiva duradera.