PathMBA Vault

AI and machine learning

Un marco para elegir el proyecto de IA generativa adecuado

por Marc Zao-Sanders, Marc Ramos

Un marco para elegir el proyecto de IA generativa adecuado

En los últimos meses, se ha producido un enorme revuelo y especulación sobre las implicaciones de los grandes modelos lingüísticos (LLM) como ChatGPT de OpenAI, Bard de Google, Claude de Anthropic, LLaMA de Meta y, más recientemente, GPT4. ChatGPT, en concreto, alcanzó los 100 millones de usuarios en dos meses, lo que la convierte en la aplicación de consumo de más rápido crecimiento de todos los tiempos.

Aún no está claro qué tipo de impacto tendrán los LLM, y las opiniones varían enormemente. Muchos expertos sostienen que los LLM tendrán poco impacto en absoluto (las primeras investigaciones académicas sugieren que la capacidad de los LLM se limita a la competencia lingüística formal) o que incluso un volumen casi infinito de datos de entrenamiento basados en texto sigue siendo muy limitante. Otros, como Ethan Mollick, sostienen lo contrario: “Las empresas que comprendan la importancia de este cambio -y actúen primero en consecuencia- tendrán una ventaja considerable”.

Lo que sí sabemos ahora es que la IA generativa ha cautivado la imaginación del gran público y que es capaz de producir primeros borradores y generar ideas de forma prácticamente instantánea. También sabemos que puede tener problemas de precisión.

A pesar de los interrogantes abiertos sobre esta nueva tecnología, las empresas están buscando formas de aplicarla… ahora. ¿Existe alguna forma de atravesar los argumentos polarizantes, el bombo y la hipérbole y pensar con claridad dónde llegará primero la tecnología? Creemos que sí la hay.

Riesgo y demanda

En cuanto al riesgo, ¿cuán probable y perjudicial es la posibilidad de que se generen y difundan falsedades e inexactitudes? En cuanto a la demanda, ¿cuál es la necesidad real y sostenible de este tipo de producción, más allá del rumor actual?

Es útil considerar estas variables conjuntamente. Pensar en ellas en una matriz de 2×2 proporciona un análisis más matizado, de talla única, de lo que puede estar por venir. De hecho, los riesgos y las exigencias difieren entre las distintas industrias y actividades empresariales. Hemos colocado algunos casos de uso común entre industrias en la tabla siguiente.

Piense dónde podría situarse su función empresarial o industria. Para su caso de uso, ¿cuánto se reduce el riesgo introduciendo un paso para la validación humana? ¿Cuánto podría ralentizar el proceso y reducir la demanda?

As your company decides where to start exploring generative A I, it’s important to balance risk and demand. One way to think about that is to ask two questions: “How damaging would it be if untruths and inaccuracies were generated and disseminated?” and “What is the real and sustainable need for this kind of output, beyond the current buzz?” In this 2 by 2 matrix, the authors sort common cross-industry use cases by risk and demand to provide examples of the most valuable, least risky applications for a company. For high demand, low risk applications, they suggest marketing, learning, copyediting, code reviews, ideation, and rapid design and reviews. For high demand, high risk applications, they suggest medical diagnoses, production code, legal advice, business intelligence, regulatory and compliance, and technical publishing. For low risk, low demand use, they suggest whimsical applications such as funny twitter bios, and creative, subjective output such as images, jokes, and poems. For low demand, high risk applications, they suggest specialist technical advice, for example, niche medical topics.

El recuadro superior izquierdo -donde la consecuencia de los errores es relativamente baja y la demanda del mercado es alta- se desarrollará inevitablemente más rápido y más lejos. Para estos casos de uso, existe un incentivo ya preparado para que las empresas encuentren soluciones, y hay menos obstáculos para su éxito. Deberíamos esperar ver una combinación de utilización bruta e inmediata de la tecnología, así como herramientas de terceros que aprovechen la IA generativa y sus API para su dominio particular.

Esto ya está ocurriendo en el marketing, donde varias start-ups han encontrado formas innovadoras de aplicar la IA generativa para generar ideas y textos de marketing de contenidos, y han alcanzado el estatus de unicornio. El marketing requiere mucha generación e iteración de ideas, mensajes adaptados a públicos específicos y la producción de mensajes ricos en texto que puedan captar al público e influir en él. En otras palabras, hay usos claros y una demanda demostrada. Y lo que es más importante, también hay una gran cantidad de ejemplos que pueden servir de guía a una IA para ajustar el estilo y el contenido. Por otra parte, la mayoría de los textos de marketing no están repletos de hechos, y los que son importantes pueden corregirse en la edición.

Si observamos la matriz, podemos darnos cuenta de que existen otras oportunidades a las que se ha prestado menos atención. Por ejemplo, el aprendizaje. Al igual que el marketing, la creación de contenidos para el aprendizaje -para nuestros propósitos, utilicemos el ejemplo de las herramientas de aprendizaje corporativo interno- requiere una comprensión clara de los intereses de su audiencia, y un texto atractivo y eficaz. También es probable que haya contenidos que puedan utilizarse para guiar una herramienta de IA generativa. Preparándola con la documentación existente, puede pedirle que reescriba, sintetice y actualice los materiales de que dispone para dirigirse mejor a los distintos públicos, o para hacer que el material de aprendizaje sea más adaptable a los distintos contextos.

Las capacidades de la IA generativa también podrían permitir que los materiales de aprendizaje se entreguen de forma diferente: entretejidos en el flujo del trabajo diario o sustituyendo a las engorrosas preguntas frecuentes, los abultados centros de conocimiento y los sistemas de tickets. (Microsoft, accionista del 49% de OpenAI, ya está trabajando en ello, con una serie de anuncios previstos para este año).

Los otros usos del cuadro anterior de alta demanda/bajo riesgo siguen una lógica similar: Son para tareas en las que a menudo intervienen personas, y el riesgo de que la IA juegue al despiste con los hechos es bajo. Tomemos el ejemplo de pedir a la IA que revise un texto: Puede darle un borrador, darle algunas instrucciones (quiere una versión más detallada, un tono más suave, un resumen de cinco puntos o sugerencias sobre cómo hacer el texto más conciso) y revisar sus sugerencias. Como segundo par de ojos, la tecnología está lista para usarse ahora mismo. Si quiere ideas para alimentar una tormenta de ideas -pasos a seguir a la hora de contratar a un diseñador multimedia moderno, o qué comprarle a una niña de cuatro años a la que le gustan los trenes para su cumpleaños- la IA generativa será una apuesta rápida, fiable y segura, ya que es probable que esas ideas no estén en el producto final.

Rellenar la matriz 2×2 anterior con tareas que formen parte del trabajo de su empresa o equipo puede ayudar a trazar paralelismos similares. Al evaluar el riesgo y la demanda, y considerar los elementos compartidos de determinadas tareas, puede darle un punto de partida útil y ayudarle a trazar conexiones y ver oportunidades. También puede ayudarle a ver dónde no tiene sentido invertir tiempo y recursos.

Los otros tres cuadrantes no son lugares donde deba apresurarse a encontrar usos para las herramientas de IA generativa. Cuando la demanda es baja, hay poca motivación para que la gente utilice o desarrolle la tecnología. Producir haikus al estilo de un pirata shakesperiano puede hacernos reír y dejarnos boquiabiertos hoy, pero esos trucos de fiesta no mantendrán nuestra atención durante mucho más tiempo. Y en los casos en los que hay demanda pero un alto riesgo, la inquietud general y la regulación ralentizarán el ritmo del progreso. Considerando su propia matriz 2×2, puede dejar de lado por el momento los usos que allí se enumeran.

El bajo riesgo sigue siendo riesgo

Una leve nota de advertencia: incluso en el aprendizaje corporativo donde, como hemos argumentado, el riesgo es bajo, existe riesgo. La IA generativa sigue siendo vulnerable a los sesgos y los errores, al igual que los humanos. Si da por hecho que los resultados de un sistema de IA generativa son buenos y los distribuye inmediatamente a toda su plantilla, el riesgo es considerable. Se pondrá a prueba su capacidad para encontrar el equilibrio adecuado entre velocidad y calidad.

Así que tome la salida inicial como una primera iteración. Mejórelo con uno o dos prompt más detallados. Y luego retoque esa salida usted mismo, añadiendo los conocimientos del mundo real, los matices, incluso el arte y el humor que, durante un rato más, sólo tiene un humano.