La IA puede (en su mayoría) superar a los directores ejecutivos humanos
por Hamza Mudassir, Kamal Munir, Shaz Ansari, Amal Zahra

¿Podría la IA generativa entrar en la alta dirección e incluso reemplazar al CEO?
A primera vista, la idea de que la IA sustituya a un CEO puede parecer tan descabellada como el exitoso ascenso de un analista junior a la dirección de la sala de juntas. Al fin y al cabo, la IA es propensa a cometer errores importantes, como» alucinaciones» — generar información incorrecta o engañosa, y tendencia a perder la noción de una tarea a mitad del proceso. Estas no son cualidades que normalmente se asocian con liderazgo eficaz, especialmente en un puesto que exige equilibrar los intereses de varias partes interesadas, analizar las tendencias históricas, detectar los cambios sutiles en un mercado y tomar decisiones estratégicas que den forma al futuro de una empresa.
Sin embargo, la IA generativa ya está remodelando las industrias que requieren precisión y creatividad. Por ejemplo, AlphaFold ha revolucionado el plegamiento de proteínas con una precisión sin precedentes, transformando el campo de la biofísica, mientras que el Codex de OpenAI puede generar programas de software completos a partir de simples instrucciones humanas, lo que mejora las capacidades de la ingeniería de software. Son tareas complejas y difíciles que parecían superar con creces la capacidad de la IA hace solo unos años. Entonces, ¿por qué estaría fuera de su alcance asumir un puesto de CEO?
Hasta la fecha, hay pocos o ningún dato empírico sobre el desempeño de la IA como CEO en escenarios del mundo real, sobre todo en comparación con la toma de decisiones humanas en condiciones similares. Los puntos fuertes y débiles de la IA solo se revelarán por completo cuando se ponga a prueba en una amplia gama de situaciones. Hemos dado un primer paso en esta dirección con un experimento a gran escala en el mundo real, que abre la puerta a una exploración más profunda del posible papel e impacto de la IA en la alta dirección.
Un patio de recreo para los directores ejecutivos
Nuestro experimento se llevó a cabo de febrero a julio de 2024, con 344 participantes (estudiantes de pregrado y posgrado de universidades de Asia Central y Meridional y altos ejecutivos de un banco del sur de Asia) y GPT-4o, un modelo lingüístico grande (LLM) contemporáneo creado por OpenAI. Los participantes navegaron por una simulación gamificada diseñada para replicar los tipos de desafíos a los que se enfrentan los directores ejecutivos, con varios parámetros que rastrean la calidad de sus elecciones. La simulación era un grosero gemelo digital de la industria automotriz estadounidense, que incorpora modelos matemáticos basados en datos reales sobre las ventas de automóviles, los cambios del mercado, las estrategias de precios históricas y la elasticidad, así como influencias más amplias, como las tendencias económicas y los efectos de la COVID-19. (Divulgación: El juego lo desarrolló nuestra startup con sede en Cambridge, Inglaterra, Elaborar estrategias. Inc).
Los jugadores tomaban un montón de decisiones de estrategia corporativa a través de la interfaz de juego, por ronda. Cada ronda representaba un año fiscal y esta estructura permitió a los participantes abordar los desafíos estratégicos a lo largo de varios años simulados e interrelacionados. Por lo tanto, el juego tenía más de 500 000 combinaciones de decisión posibles por ronda y no tenía una fórmula ganadora fija. El objetivo del juego era simple: sobrevivir el mayor tiempo posible sin que lo dispare un tablero virtual y, al mismo tiempo, maximizar la capitalización bursátil. El primero lo determina un grupo de indicadores clave de rendimiento (KPI) únicos establecidos por el consejo y el segundo se basa en una combinación de tasas de crecimiento sostenibles y flujo de caja libre. Este objetivo sirvió como indicador realista para medir el desempeño de los directores ejecutivos en el mundo real.
Cuando los participantes humanos completaron su turno, cedimos el control al GPT-4o. Luego comparamos el desempeño del GPT-4o con el de cuatro participantes humanos: los dos mejores estudiantes y los dos ejecutivos. Los resultados fueron a la vez sorprendentes y provocadores, y pusieron en tela de juicio muchas de nuestras suposiciones sobre el liderazgo, la estrategia y el posible papel de la IA en la toma de decisiones en los niveles más altos de la empresa.
La IA tiene un rendimiento superior, pero ¿a qué precio?
El desempeño de GPT-4o como CEO fue notable. El LLM superó constantemente a los mejores participantes humanos en casi todos los indicadores. Diseñó los productos con precisión quirúrgica, maximizando el atractivo y manteniendo estrictos controles de costes. Respondió bien a las señales del mercado, manteniendo a sus competidores de IA no generativa a raya y cobró un impulso tan fuerte que superó la cuota de mercado y la rentabilidad de los estudiantes con mejor desempeño tres rondas por delante.
Sin embargo, había un defecto crítico: la pizarra virtual disparaba el GPT-4o más rápido que los estudiantes que jugaban al juego.
¿Por qué? La IA tuvo problemas con los acontecimientos del cisne negro, como el colapso del mercado durante la pandemia de la COVID-19. Habíamos programado estos choques impredecibles para cambiar la demanda de los clientes, reducir los niveles de precios y poner a prueba las cadenas de suministro. Los estudiantes con mejor rendimiento adoptaron estrategias a largo plazo que los tuvieron en cuenta. Evitaron los contratos rígidos, minimizaron los riesgos de inventario y gestionaron el crecimiento con cautela, garantizando la flexibilidad cuando las condiciones del mercado cambiaban. Su estrategia estaba clara: preservar la adaptabilidad en lugar de perseguir ganancias agresivas a corto plazo.
El GPT-4o, por otro lado, tras una serie de éxitos iniciales, adoptó una mentalidad de optimización a corto plazo, maximizando sin descanso el crecimiento y la rentabilidad hasta que una crisis del mercado hizo descarrilar su racha de victorias. La IA puede aprender e iterar rápidamente en un entorno controlado, lo que la hace menos ideal para hacer frente a eventos altamente disruptivos que requieren la intuición y la previsión humanas. Curiosamente, los altos ejecutivos también cayeron en esta trampa; la pizarra virtual los despidió más rápido, como el GPT-4o, que a los estudiantes. Tanto el GPT-4o como los ejecutivos sucumbieron al mismo defecto: el exceso de confianza en un sistema que recompensa la flexibilidad y el pensamiento a largo plazo tanto como la ambición agresiva.
¿La IA es el nuevo jefe?
A pesar de sus limitaciones, el GPT-4o ofreció una actuación impresionante. Si bien lo dispararon con más frecuencia que los mejores jugadores humanos, se mantuvo firme contra los mejores y más brillantes de nuestra cohorte mundial de 344 participantes. Entonces, ¿cuáles son las implicaciones en el mundo real para la formulación de una metaestrategia basada en este experimento? Estas son algunas ideas iniciales:
La IA generativa es un recurso estratégico clave.
Ignorar la IA generativa en la estrategia empresarial ya no es viable. Este experimento demuestra que incluso los modelos sin afinar pueden ofrecer enfoques estratégicos únicos y creativos cuando se les pide adecuadamente, lo que genera buenos resultados. Si la IA generativa puede ayudar a las empresas a maximizar el valor accionarial de manera más eficaz, ¿por qué resistirse? Al fin y al cabo, maximizar el valor para los accionistas es la razón de ser para el puesto de CEO.
La calidad de los datos es crucial.
Para que la IA destaque en la estrategia corporativa, necesita datos de alta calidad. El GPT-4o funcionó bien en este experimento porque tenía acceso a datos exhaustivos del simulador. Sin embargo, muchas empresas no generan suficientes datos en términos de velocidad, volumen, veracidad y variedad. Crear una infraestructura de datos sólida es esencial antes de llevar la IA generativa a la sala de juntas.
Eficiencia contra riesgo.
Si bien la eficiencia impulsada por la IA puede generar importantes beneficios, también conlleva riesgos. Las estrategias agresivas de maximización del precio de las acciones por parte de ejecutivos humanos sin una supervisión suficiente pueden llevar a resultados desastrosos. No es diferente para una IA sin supervisión o para un humano que utiliza una IA sin supervisión.
Cuestiones de responsabilidad.
Hacer que la IA rinda cuentas de la misma manera que un CEO humano es casi imposible. Eliminar el sistema no deshace los daños causados por una toma de decisiones errónea, sino que plantea cuestiones críticas sobre la responsabilidad y la protección pública. Establecer barreras transparentes que garanticen que las decisiones impulsadas por la IA se alinean con los valores empresariales y el bien social es fundamental para evitar consecuencias no deseadas.
El papel de los gemelos digitales.
Un gemelo digital realista del ecosistema de una empresa, poblado por varios agentes de LLM, podría servir como un valioso entorno de pruebas para los líderes de la IA, ya que proporcionaría un amortiguador contra los errores en el mundo real que la IA podría cometer si se dejara sola y, al mismo tiempo, proporcionar información valiosa para que los directores ejecutivos tomen grandes decisiones. En un entorno tan contenido, la IA puede cometer errores, identificar las reservas de valor y obtener resultados con estrategias optimizadas para lograr los objetivos de la empresa. Imaginamos un conjunto de agentes de LLM en exclusiva con el gemelo digital de una empresa, que evolucionan en un entorno sandbox (o «dojo», según otro término de Silicon Valley) adaptado a esa organización y a su ecosistema (Divulgación: nuestra empresa emergente Strategize.Inc está trabajando para ofrecer esas capacidades a las empresas y los organismos gubernamentales).
Interrupción de la consultoría estratégica.
El auge de los «directores ejecutivos artificiales» podría generar disrupción en los departamentos tradicionales de consultoría estratégica y estrategia interna. Es posible que empresas como McKinsey descubran que sus servicios se complementan (o incluso se sustituyen) por sistemas de IA adaptados a los ecosistemas de sus clientes.
Dando un paso atrás, creemos que la principal conclusión es la siguiente: a pesar de su impresionante desempeño, la IA no puede asumir toda la responsabilidad de un CEO en los mercados que sirven a los humanos. En cambio, puede mejorar significativamente el proceso de planificación estratégica y ayudar a evitar costosos errores. Ya hemos visto cómo la IA de primera generación puede impulsar con éxito microestrategias a nivel funcional en gigantes tecnológicos como Amazon y Google a través de tareas como la igualación de precios y la gestión del inventario de anuncios. Eso, además de los poderosos efectos de aprendizaje y red, es la salsa secreta de estos gigantes corporativos. La IA generativa es la siguiente evolución lógica de ese modelo operativo: una metaIA que actúa como CEO, compite y colabora con otras IA en un entorno de pruebas gemelas digitales, lo que hace que los directores ejecutivos humanos tomen mejores decisiones de las que habrían tomado de otro modo.
La mayor fortaleza de la IA generativa no es reemplazar a los directores ejecutivos humanos sino aumentar la toma de decisiones. Al automatizar los análisis con muchos datos y modelar escenarios complejos, la IA permite a los líderes humanos centrarse en el juicio estratégico, la empatía y la toma de decisiones éticas, áreas en las que los humanos sobresalen.
¿El verdadero riesgo para los directores ejecutivos humanos? Aferrarse a la ilusión de que solo nosotros tomaremos las riendas en el futuro. El futuro del liderazgo es híbrido, en el que la IA complemente a los humanos. Los directores ejecutivos se centran en la visión, los valores y la sostenibilidad a largo plazo. Los directores ejecutivos que prosperen serán los que dominen esta sinergia, aprovechando la IA no como rival sino como socio en la toma de decisiones.
Artículos Relacionados

La IA es genial en las tareas rutinarias. He aquí por qué los consejos de administración deberían resistirse a utilizarla.

Investigación: Cuando el esfuerzo adicional le hace empeorar en su trabajo
A todos nos ha pasado: después de intentar proactivamente agilizar un proceso en el trabajo, se siente mentalmente agotado y menos capaz de realizar bien otras tareas. Pero, ¿tomar la iniciativa para mejorar las tareas de su trabajo le hizo realmente peor en otras actividades al final del día? Un nuevo estudio de trabajadores franceses ha encontrado pruebas contundentes de que cuanto más intentan los trabajadores mejorar las tareas, peor es su rendimiento mental a la hora de cerrar. Esto tiene implicaciones sobre cómo las empresas pueden apoyar mejor a sus equipos para que tengan lo que necesitan para ser proactivos sin fatigarse mentalmente.

En tiempos inciertos, hágase estas preguntas antes de tomar una decisión
En medio de la inestabilidad geopolítica, las conmociones climáticas, la disrupción de la IA, etc., los líderes de hoy en día no navegan por las crisis ocasionales, sino que operan en un estado de perma-crisis.