PathMBA Vault

Technology and analytics

El próximo gran avance de la IA girará en torno al lenguaje

por H. James Wilson, Paul R. Daugherty

El próximo gran avance de la IA girará en torno al lenguaje

Personal de HBR/T_Kimura/Getty Images

La mayoría de las empresas reconocen que la adopción agresiva de las tecnologías digitales es cada vez más importante para ser competitivo. Nuestra investigación muestra que el 10% de los primeros en adoptar las tecnologías digitales ha crecido al doble del ritmo del 25% más pobre y que utilizan sistemas en la nube —no sistemas heredados— para permitir la adopción, una tendencia que esperamos que se acelere entre los líderes del sector en los próximos cinco años. En comparación, muchas empresas rezagadas y medianas están subestimando drásticamente los recursos de nube que necesitarán para acceder, alimentar o entrenar una nueva generación de aplicaciones inteligentes presagiadas por avances como el GPT-3, una herramienta de procesamiento del lenguaje natural (PNL) de última generación.

Los grandes avances de la IA tendrán que ver con el lenguaje.

La década de 2010 produjo avances en las tecnologías de visión, desde búsquedas precisas de imágenes en la web hasta sistemas de visión artificial para el análisis de imágenes médicas o para la detección de piezas defectuosas durante la fabricación y el montaje, como describimos ampliamente en nuestro libro e investigación. GPT3, desarrollado por IA abierta, indica que la década de 2020 consistirá en avances importantes en función del idioma Tareas de IA. Los modelos de procesamiento del lenguaje anteriores utilizaban reglas codificadas a mano (para la sintaxis y el análisis), técnicas estadísticas y, cada vez más en la última década, redes neuronales artificiales para procesar el lenguaje. Las redes neuronales artificiales pueden aprender de los datos sin procesar y requieren mucho menos etiquetado de datos rutinario o ingeniería de funciones. Los GPT (transformadores generativos preentrenados) van mucho más allá y se basan en un transformador, un mecanismo de atención que aprende las relaciones contextuales entre las palabras de un texto. Investigadores a quienes se les dio acceso a la GPT-3 a través de una beta privada pudieron inducirla a producir cuentos, canciones, comunicados de prensa, manuales técnicos, textos al estilo de determinados escritores, tablaturas de guitarra e incluso código de ordenador.

Centro de información

El GPT-3 está lejos de ser perfecto. Son numerosos defectos incluir a veces producir respuestas sin sentido o sesgadas, responder incorrectamente a preguntas triviales y generar contenido plausible pero falso. Incluso uno de los líderes de OpenAI advertido en contra de exagerar el GPT-3. Todo esto sugiere que queda mucho trabajo por hacer, pero lo escrito, por así decirlo, está en la pared: se acerca una nueva etapa de la IA.

El GPT-3 es solo uno de los muchos transformadores avanzados que están surgiendo ahora. Microsoft, Google, Alibaba y Facebook están todos trabajando en sus propias versiones. Estas herramientas se entrenan en la nube y solo se puede acceder a ellas a través de una interfaz de programación de aplicaciones (API) en la nube. Las empresas que quieran aprovechar el poder de la IA de próxima generación cambiarán sus cargas de trabajo de cálculo de los servicios de IA tradicionales a los servicios de IA en la nube, como el GPT-3.

Las aplicaciones de próxima generación permitirán la innovación en toda la empresa.

Estos servicios de IA en la nube permitirán desarrollar una nueva clase de aplicaciones empresariales que sean más creativas (o «generativas», la «G» de GPT) que cualquier otra cosa que hayamos visto antes. Harán que el proceso de síntesis de palabras, intenciones e información en el lenguaje abarate, lo que hará que muchas actividades empresariales sean más eficientes y estimulará la innovación y el crecimiento que vemos entre los primeros en adoptarlo.

Nuestro análisis de más de 50 pruebas de concepto (demostraciones) del GPT-3 relevantes para la empresa indica que las aplicaciones empresariales más vanguardistas del mañana se clasificarán en al menos tres categorías creativas amplias, todas relacionadas con la comprensión del idioma: escribir, programar, y razonamiento específico de la disciplina.

La habilidad del GPT-3 para escribir texto significativo basándose en unas cuantas instrucciones simples, o incluso en una sola frase, puede resultar asombrosa. Por ejemplo, uno de los beta testers privados del GPT-3 la utilizó para producir un blog convincente sobre el tema del bitcoin. Entre las demostraciones que analizamos, había aplicaciones para desarrollar nuevos podcasts, generar campañas de correo electrónico y publicidad, sugerir cómo organizar las reuniones de la junta directiva y responder de forma inteligente a las preguntas que confundían los sistemas lingüísticos anteriores.

Según las indicaciones de los humanos, el GPT-3 también puede codificar, escribir instrucciones para ordenadores o sistemas. Incluso puede convertir el lenguaje natural en lenguaje de programación. En un lenguaje natural (inglés, español, alemán, etc.), describa lo que quiere que haga el código, como desarrollar un sitio web interno o orientado al cliente. Luego, GPT escribe el programa.

La capacidad de pensar en el contenido, los procedimientos y los conocimientos en un campo científico o técnico sugiere otras aplicaciones potencialmente fértiles del GPT-3. Puede responder química preguntas: en una demostración, predijo correctamente cinco de las seis reacciones de combustión química. Puede argumento automático gráficos basados en descripciones verbales, que eliminan gran parte del trabajo pesado de tareas como crear presentaciones. Otro beta tester creó un bot GPT-3 que permite a las personas sin conocimientos de contabilidad generar estados financieros. Otra solicitud puede responder a una pregunta deliberadamente difícil pregunta médica y hablar sobre los mecanismos biológicos subyacentes. La aplicación recibió una descripción de la serie de síntomas respiratorios de un niño de 10 años y se le informó de que le diagnosticaron una enfermedad obstructiva y le dieron medicamentos. Luego se preguntó sobre qué receptor proteico era probable que actuara el medicamento. El programa identificó correctamente el receptor y explicó que el niño tenía asma y que normalmente se trata con broncodilatadores que actúan sobre ese receptor.

Este potencial de razonamiento general en la escritura, la codificación y la ciencia sugiere que el uso de transformadores alimentados por la nube podría convertirse en una metadisciplina, aplicable a las ciencias de la gestión, las ciencias de los datos y las ciencias físicas y de la vida. Además, en los trabajos no técnicos, la nube, en combinación con la GPT3, reducirá la barrera para ampliar las innovaciones digitales. El personal no técnico podrá utilizar todos los días el lenguaje natural en lugar de los lenguajes de programación para crear aplicaciones y soluciones para los clientes.

Los trabajos reinventados aumentarán la productividad.

A la luz de los próximos cambios, las empresas no solo tendrán que replantearse los recursos de TI, sino también los recursos humanos. Pueden empezar por analizar los paquetes de tareas de las funciones actuales, descubrir tareas específicas que la IA puede aumentar y dar rienda suelta a los trabajadores técnicos y no técnicos para que innoven más rápido. Usando el Red de información ocupacional (O*NET), basándonos en una norma del gobierno de los EE. UU. utilizada para clasificar a los trabajadores en categorías ocupacionales, analizamos 73 categorías laborales en 16 grupos profesionales y descubrimos que todos los grupos se verían afectados por el GPT-3. Al analizar las categorías de trabajo, descubrimos que 51 pueden aumentarse o complementarse con el GPT-3 en al menos una tarea y 30 pueden usar el GPT-3 para complementar dos o más tareas.

Algunas tareas se pueden automatizar, pero nuestros análisis muestran que la mayor oportunidad estará en aumentar y amplificar la productividad y el ingenio humanos. Por ejemplo, los profesionales de la comunicación automatizarán la mayoría de sus tareas laborales relacionadas con la generación rutinaria de textos, mientras que las comunicaciones más importantes, como el texto de los anuncios y los mensajes en las redes sociales, se verán aumentadas por la capacidad del GPT-3 para ayudar a desarrollar líneas de pensamiento. Los científicos de la empresa podrían utilizar el GPT-3 para generar gráficos que informen a sus colegas sobre el proceso de desarrollo de productos. Mientras tanto, para aumentar la investigación y la experimentación básicas, podrían consultar el GPT-3 para extraer los hallazgos de una serie específica de artículos científicos. Las posibilidades en todas las disciplinas e industrias solo están limitadas por la imaginación de su gente.

No se quede atrás.

La hora para preparar es ahora. La próxima generación de aplicaciones empresariales no funcionará en los sistemas antiguos y las empresas tendrán que pasar a la nube de forma más agresiva que ahora. Esperar y ver qué pasa no servirá. El 1 de octubre, OpenAI se lanzará El GPT como servicio, poniendo la API a disposición de los usuarios de la versión beta. Los líderes adoptarán y adaptarán el GPT-3 en unos meses, y aprenderán dónde funciona mejor o dónde no funciona en absoluto. Empezarán con ventaja en el rediseño de los puestos de trabajo y en las cuestiones de privacidad, seguridad y responsabilidad social que rodean a toda la IA. Y en los próximos dos años, puede esperar verlos poner en producción todo tipo de aplicaciones y encontrar oportunidades de innovación que pongan a los rezagados aún más atrás.

Los autores desean reconocer las contribuciones de nuestro equipo de investigación de Accenture Research, especialmente de Thijs Deblaere, Surya Mukherjee y Prashant Shukla.