El presidente de SRI Ventures habla sobre cómo dar vida a Siri
por Norman Winarsky
Jeff Singer
En el largo proceso de diseño y perfeccionamiento de un producto, suele haber un momento en el que la reacción de un cliente potencial ayuda a superar las dudas que rodean cualquier esfuerzo creativo. Para Siri, el asistente personal virtual que ahora forma parte integral del iPhone de Apple, ese momento llegó en un avión en 2009. Acababa de ocupar mi asiento en un vuelo retrasado cuando un pasajero me preguntó a qué hora tenía previsto que aterrizaríamos. Como era una de las pocas docenas de personas que probaban Siri, saqué mi teléfono y dije: «Siri, ¿a qué hora se espera que llegue el vuelo 98 de United?» Cuando Siri respondió con la hora de llegada actualizada, el pasajero quedó atónito. Él dijo: «Solo tengo una pregunta: ¿Por qué está sentado en el autobús? ¡Debería ser multimillonario!»
Había estado tan inmerso en los desafíos empresariales, tecnológicos, estratégicos y financieros de la empresa que había perdido de vista lo deslumbrante que era la tecnología Siri. Un extraño se quedó boquiabierto para recordarme: habíamos desarrollado una aplicación para teléfonos inteligentes que podía entender y responder a las preguntas en lenguaje natural. Íbamos a poner la inteligencia artificial en manos de millones de consumidores.
Había sido un camino largo con un par de curvas sorprendentes.
El valle de la muerte
Como presidente de SRI Ventures, dirijo el grupo que crea, crea y escinde empresas en SRI International, una organización fundada en 1946 como Instituto de Investigación de Stanford (e independiente desde 1970). Tengo un trabajo increíble. Todos los días observo el desarrollo de tecnologías innovadoras con el potencial de hacer que las personas estén más seguras, sanas y productivas.
Pero hay un valle de muerte entre la invención y la innovación. Es una metáfora común en el mundo del riesgo, porque la mayoría de los inventos perecen antes de llegar al mercado, por falta de un mercado grande y en crecimiento, de una propuesta de valor y un plan de negocios sólidos o de recursos suficientes.
Mi trabajo es ayudar a que las oportunidades crucen este valle de la muerte. A veces tenemos éxito más allá de nuestros sueños más locos. De hecho, Siri supuso un avance impresionante.
La visión de mercado que llevó a Siri se remonta a 2003, cuando las principales aplicaciones de los teléfonos móviles seguían limitándose a los tonos de llamada y la mensajería. Reconocimos que las crecientes capacidades del teléfono acabarían por poner un superordenador de comunicación en el bolsillo de todo el mundo, y creíamos que SRI International estaba bien preparada para ser líder en la inevitable revolución de la tecnología y el mercado.
Formamos un equipo, denominado Vanguard, para desarrollar conceptos de mercado. Algunas de las primeras fueron para poner inteligencia en el teléfono inteligente para que los usuarios pudieran preguntarle por mensaje de texto o voz para realizar tareas, como programar una llamada entre varias partes, hacer una llamada o pedir comida.
También de este autor
Si de verdad quiere cambiar el mundo
Innovación Libro
- Henry Kressel y Norman Winarsky
30.00
Casi al mismo tiempo que se formó el equipo de Vanguard, la Agencia de Proyectos de Investigación Avanzada de Defensa de los Estados Unidos (DARPA) financió un programa de 150 millones de dólares para desarrollar un asistente de software «cognitivo». (Una de las inspiraciones fue Radar O’Reilly, de la serie de televisión) M*A*S*H, quien siempre supo lo que quería su coronel antes que el coronel.) Los conceptos del programa DARPA contribuyeron a la reflexión de Vanguard y, en última instancia, ayudaron a inspirar a Siri.
Durante los próximos cuatro años, crear una empresa independiente no era nuestro objetivo: hablamos con docenas de operadores de telecomunicaciones y proveedores de teléfonos con el objetivo de iniciar un proyecto conjunto que licenciara nuestra tecnología e implementara un asistente inteligente en el mundo comercial. Resultó ser difícil. Una y otra vez escuchamos varias objeciones: «No es posible: faltan 20 años para la tecnología». «Demasiado caro» (buscábamos entre 5 y 10 millones de dólares en financiación para el desarrollo, más derechos de licencia). «No forma parte de nuestro modelo de negocio». «La creación de un producto llevará más de 12 meses». «No es una fuente de ingresos temprana». «Ya lo estamos haciendo nosotros mismos». Hicimos algunos proyectos con empresas que implementaron pequeñas partes de nuestra visión, pero al final decidimos escindir una empresa de SRI para crear una categoría de productos completamente nueva.
Los cuatro ingredientes
El equipo fundador de líderes empresariales y tecnológicos de SRI se reunía casi a diario en el espacio empresarial de SRI para analizar las posibilidades del mercado y los productos. Sabíamos que para tener éxito necesitábamos cuatro ingredientes principales: una solución a un problema o punto débil grande e importante, con potencial de rápido crecimiento del mercado; una tecnología diferenciada que superara a la competencia; un equipo capaz de realizar una ejecución sobresaliente; y una propuesta de valor y un plan de negocio que articularan la estrategia y el valor de la empresa. Sin los cuatro, la probabilidad de éxito sería casi nula.
También sabíamos que disponíamos de poco tiempo y recursos financieros limitados para entrar y triunfar en el mercado antes de que se nos acabara el dinero o surgieran competidores.
El punto débil.
Durante varios meses, el equipo se centró en la oportunidad de mercado: la gente se sentía frustrada por todos los clics del teclado necesarios para cualquier tarea en un teléfono inteligente. (Hacer clic en los teléfonos inteligentes aún no era algo natural en 2007.) Un estudio de mercado reveló que cada vez que los usuarios tenían que hacer clic en una pantalla, el 20% abandonaba la solicitud o la intención de compra.
La idea innovadora detrás de Siri era simple y poderosa: a diferencia de los motores de búsqueda, Siri sería un «motor de hacer» impulsado por voz. Entendería su consulta, accedería automáticamente a la información necesaria y la resumiría en una respuesta. Todo el esfuerzo lo haría Siri y no el usuario. Se trataría de un asistente personal virtual que ayudaría a la gente a comprar entradas para un partido de béisbol, reservar una cena, obtener el informe meteorológico o encontrar una película con uno o dos clics.
La tecnología diferenciada.
La tecnología necesaria para abordar el problema era abrumadora, a pesar de que habían quedado atrás décadas de desarrollo. Convertir la voz en texto digital era lo más fácil: SRI lanzó Nuance, un líder mundial en soluciones de voz, en 1994. Lo más difícil consistía en analizar las palabras para entender la intención del usuario y, luego, razonar y responder a la solicitud. El ordenador tenía que identificar los conceptos y asociarles grupos de palabras. Los humanos realizan esas tareas con facilidad, pero la mayoría de la gente creía que eran imposibles para los ordenadores.
Las bases generales de la tecnología para entender el lenguaje natural las desarrollaron el Laboratorio de Tecnología e Investigación del Habla del SRI y el Centro de Inteligencia Artificial del SRI en programas con DARPA y con las inversiones internas del SRI. Adam Cheyer y Didier Guzzoni dirigieron la implementación específica que nos permitió convertir Siri en un producto que pudiera utilizarse en millones de personas. Durante casi dos décadas, Cheyer, uno de los científicos informáticos más visionarios del SRI, diseñó e implementó la computación delegada y los «sistemas basados en agentes» que permitían a los humanos interactuar con programas y dispositivos en red. Con Guzzoni, su estudiante de doctorado, desarrolló enfoques para la comprensión y el razonamiento del lenguaje natural que simplificaban la tarea de responder a las consultas.
El equipo.
Tuvimos la suerte de contratar a un destacado emprendedor, Dag Kittlaus, como CEO de la nueva empresa. Cheyer decidió dejar SRI y unirse a la empresa. Tom Gruber, uno de los principales innovadores en interfaces de usuario inteligentes, se incorporó unos meses después y, finalmente, pasó a ser el CTO. Bill Mark, el presidente de Ciencias de la Información y la Computación de SRI, y yo fuimos los otros fundadores. Los dos permanecimos en SRI y pasé a ser miembro del consejo de administración de la nueva empresa.
La propuesta de valor.
Durante los seis meses siguientes, la propuesta de valor general se centró con precisión: resolveríamos un problema importante para millones de consumidores con un producto potente que pudiera generar miles de millones de dólares en ingresos. En concreto, Siri aliviaría el problema de hacer demasiados clics; ahorraría tiempo y energía a las personas; proporcionaría una tecnología diferenciada e innovadora mediante el reconocimiento de voz, la comprensión del lenguaje natural y la inteligencia artificial; proporcionaría usos generadores de ingresos; y sorprendería y deleitaría a los consumidores. Decidimos que el modelo de negocio de Siri dependería del cobro de comisiones en los sitios web para ayudar a ejecutar las transacciones. Reconocimos que los ingresos por los clientes potenciales que Siri ofrecía a hoteles, restaurantes y compañías aéreas podrían ser sustanciales.
Este artículo también aparece en:
Las 10 lecturas imprescindibles de HBR sobre emprendimiento y empresas emergentes
Innovación y emprendimiento Libro
- Harvard Business Review
24.95
A finales de 2007, tras seis meses de elaboración de la propuesta de valor, decidimos buscar inversiones externas para nuestra empresa derivada. Sabíamos que encontrar patrocinadores no sería fácil, porque Siri dependía de los avances tanto del mercado como de la tecnología. Muchos capitalistas de riesgo habían visto el bombo publicitario frente a la realidad por la IA y se mostraron escépticos. Se preocupaban por todos los elementos de la propuesta de valor y el plan de negocio, incluidos el mercado, la tecnología y la competencia. ¿Seríamos capaces de hacer crecer una base de consumidores grande? ¿Sería suficiente la potencia de procesamiento del smartphone? ¿Funcionaría la tecnología de IA? ¿La comunicación y el procesamiento serían demasiado lentos? ¿El modelo de negocio de generación de leads generaría ingresos suficientes? ¿Responderían rápidamente los posibles competidores, como Google y Microsoft, con sus propios productos?
Al final, las preocupaciones solo se pueden mitigar, no eliminar. Siri sería una inversión audaz pero arriesgada. Está claro que tendría un impacto en la industria móvil con su tecnología disruptivo, el resultado de una notable convergencia de las tendencias mundiales, incluida la aparición de los teléfonos inteligentes; la aceleración de la capacidad de cálculo y almacenamiento y la velocidad de comunicación; el crecimiento de los servicios e interfaces web; y el desarrollo de nuevos sistemas de IA. Era el momento adecuado.
Recaudamos 8,5 millones de dólares, suficientes para financiar la empresa durante 18 meses. Sin embargo, el proceso de financiación nos dio mucho más que dinero. Nos dio inversores valientes y perspicaces que se convirtieron en nuestros socios, lo que nos ayudó a identificar los modelos de negocio, desarrollar estrategias, construir relaciones con los clientes y mucho más.
Aun así, nos enfrentamos a muchos desafíos: nos retrasamos seis meses por problemas relacionados con la lenta respuesta del servidor al usuario y la tecnología de reconocimiento de voz. Mientras tanto, Google y otros estaban progresando en sus propias soluciones. Algunas empresas hicieron ofertas para adquirirnos. Las condiciones de los acuerdos con los proveedores y las empresas de servicios web eran complejas. Los operadores de telefonía móvil surgieron con oportunidades que distrajeron la atención de nuestro producto inicial.
El lanzamiento
Finalmente, tras las pruebas con usuarios de noviembre de 2009 a febrero de 2010 (durante las cuales mostré Siri en ese avión), estábamos listos para lanzarlo en la App Store de Apple. (Que «Siri» tenga una ortografía parecida a «SRI» es pura coincidencia. Elegimos el nombre por varias razones, entre ellas que solo tenía cuatro letras y no tenía connotaciones negativas en ningún idioma.) Lo habíamos preparado con demostraciones y reseñas de los mejores blogueros de sitios como Scobleizer y TechCrunch. Las manifestaciones tuvieron un gran éxito y la prensa despertó una avalancha de interés entre los consumidores. Siri se descargó gratis a un ritmo astronómico. Estaba entre las 50 mejores aplicaciones de Apple y era la mejor aplicación de estilo de vida.
Dos semanas después del lanzamiento, Kittlaus recibió una llamada telefónica inesperada: «Hola, soy Steve Jobs». Kittlaus pensó que era una broma y colgó. Entonces el teléfono volvió a sonar: «En serio, es Steve Jobs». Lo era. Los dos hablaron un rato y Jobs felicitó a Kittlaus por la capacidad de Siri. Invitó a Kittlaus, Cheyer y Gruber a su casa, donde hablaron sobre la tecnología de Siri. Jobs comprendió el valor de la IA del motor, así como la naturaleza de la tecnología, y la certeza de que siempre se producían errores, como en el reconocimiento del lenguaje natural, pero no se desanimó. Eso me pareció notable, porque prácticamente todos los productos Apple están diseñados «para la perfección».
Durante las próximas semanas, Jobs y Kittlaus discutieron el precio de compra de Siri. No teníamos ganas de vender, porque creíamos que es casi seguro que el valor del negocio aumentaría con el éxito de las pruebas y los nuevos acuerdos de distribución. Pero Jobs hizo una oferta que los inversores y el equipo ejecutivo no pudieron rechazar. (El precio no puede revelarse por obligaciones contractuales.) El equipo también se sintió muy atraído por trabajar con Jobs y Apple.
Un año después, Siri se convirtió en la plataforma principal de un servicio muy popular en el nuevo iPhone 4S de Apple. El 4 de octubre de 2011, Phil Schiller, vicepresidente sénior de marketing mundial de Apple, presentó Siri como la «función más guay del iPhone 4S». Al día siguiente, murió Steve Jobs. Me alegro de que haya podido ver la presentación. En las primeras semanas después del lanzamiento, los analistas informaron de que Siri ayudó a acelerar las ventas por valor de miles de millones de dólares. Siri sigue siendo un elemento fundamental de todos los dispositivos iOS de Apple.
Apple y muchas otras empresas, incluida SRI, se apresuran ahora a desarrollar productos que hagan avanzar la tecnología y lleguen a nuevos mercados. Se puede hacer mucho. El reconocimiento del habla y el lenguaje natural y el aprendizaje automático aún están en pañales. Los nuevos asistentes personales virtuales comprenderán aún mejor las palabras y los idiomas. Mantendrán el contexto, permitirán conversaciones reales, aprenderán de sus usuarios y se convertirán en «especialistas» que ayudarán a los consumidores a acceder a información como los registros médicos y las cuentas bancarias. Por ejemplo, SRI lanzó recientemente una nueva empresa, Kasisto, que está redefiniendo la experiencia de la banca móvil a través de interfaces de voz, texto y táctiles, y que tiene la capacidad de conversar. El futuro de los asistentes personales virtuales está indiscutiblemente asegurado.
Artículos Relacionados

La IA es genial en las tareas rutinarias. He aquí por qué los consejos de administración deberían resistirse a utilizarla.

Investigación: Cuando el esfuerzo adicional le hace empeorar en su trabajo
A todos nos ha pasado: después de intentar proactivamente agilizar un proceso en el trabajo, se siente mentalmente agotado y menos capaz de realizar bien otras tareas. Pero, ¿tomar la iniciativa para mejorar las tareas de su trabajo le hizo realmente peor en otras actividades al final del día? Un nuevo estudio de trabajadores franceses ha encontrado pruebas contundentes de que cuanto más intentan los trabajadores mejorar las tareas, peor es su rendimiento mental a la hora de cerrar. Esto tiene implicaciones sobre cómo las empresas pueden apoyar mejor a sus equipos para que tengan lo que necesitan para ser proactivos sin fatigarse mentalmente.

En tiempos inciertos, hágase estas preguntas antes de tomar una decisión
En medio de la inestabilidad geopolítica, las conmociones climáticas, la disrupción de la IA, etc., los líderes de hoy en día no navegan por las crisis ocasionales, sino que operan en un estado de perma-crisis.