PathMBA Vault

Technology and analytics

Por qué los gigantes de la tecnología están tan desesperados por ofrecerle su asistente de voz

por Bret Kinsella

Por qué los gigantes de la tecnología están tan desesperados por ofrecerle su asistente de voz

Emma Innocenti/Getty Images

¿Por qué gastan las principales empresas de tecnología del mundo? miles de millones de dólares invertir en asistentes de voz y altavoces inteligentes que perder el dinero ¿cada trimestre? Según se informa, Amazon tiene 10 000 empleados trabajando en Alexa. Los análisis de desmontaje sugieren que Google Home Mini es vendido con pérdidas cada vez que tiene descuentos, que es frecuente. Samsung ha introducido un botón dedicado en sus teléfonos para Bixby que los consumidores se reasignan con regularidad para usar el Asistente de Google en su lugar. Microsoft ya no intenta competir con Alexa o el Asistente de Google, sino que sigue invirtiendo en Cortana.

Cada una de estas empresas, y otras, tienen diferentes motivos para seguir invirtiendo. Algunos están intentando proteger una franquicia dominante, como el comercio en línea en el caso de Amazon y la publicidad en búsquedas para Google. Otros están intentando entrar en espacios en los que han sido excluidos, como la distribución de contenido digital, la publicidad gráfica, las búsquedas y el comercio. Una pareja tiene en mente ambos escenarios.

Solo podrá entender la guerra de las plataformas de voz si reconoce primero que los asistentes de voz, específicamente, representan un cambio tanto de plataforma como de interfaz de usuario (UI) comparable al de la web y los teléfonos inteligentes. La principal diferencia es que estas nuevas plataformas no se basan en estándares abiertos ni en un acceso relativamente abierto a los consumidores. Los asistentes de voz introducen un intermediario propietario en todas las interacciones digitales con los consumidores. Este escenario entusiasma y asusta a las principales empresas de tecnología que se labraron posiciones envidiables en las anteriores guerras de plataformas web y de teléfonos inteligentes.

Los cambios de plataforma y interfaz de usuario van de la mano

Los asistentes de voz representan el tercer cambio clave en la interfaz de usuario y la plataforma tecnológica de las últimas tres décadas, después de la web en la década de 1990 y los teléfonos inteligentes hace unos 10 años. Cada cambio sucesivo en la interfaz de usuario cambiaba la forma en que las personas interactuaban con el contenido digital y accedían a él. Las páginas web nos hacían «hacer clic», en las que navegábamos con el ratón y activábamos botones e hipervínculos. Los teléfonos inteligentes introdujeron las funciones de «tocar», «deslizar» y «pellizcar» a miles de millones de consumidores y sustituyeron las páginas web por aplicaciones. Ambas transiciones exigieron que los consumidores aprendieran un nuevo idioma para interactuar con la tecnología. El cambio a la voz no requiere ningún entrenamiento. Los usuarios simplemente «hablan» como lo hacen de forma natural.

Centro Insight

Cada uno de estos cambios en la interfaz de usuario iba acompañado de una nueva plataforma tecnológica. La World Wide Web se creó sobre la base de Internet y la proliferación de los ordenadores permitió acceder fácilmente a las páginas web. Los sistemas operativos móviles para teléfonos inteligentes, como iOS y Android, fueron avances importantes, pero la economía de las aplicaciones también se basó en la introducción de la computación en nube para entregar contenido de manera eficiente, junto con actualizaciones periódicas de funciones y mejoras de rendimiento. La computación de voz se basa en la inteligencia artificial para el reconocimiento de voz y la comprensión del lenguaje natural. También se utiliza para mejorar dinámicamente la experiencia de usuario.

Los cambios de plataforma, el dominio de la cuota de mercado y las cinco A

La web y los dispositivos móviles introdujeron formas completamente nuevas de hacer negocios y mejoraron la eficiencia de los métodos antiguos. Empresas específicas llegaron a dominar en diferentes áreas. Posteriormente, Voicebot introdujo el marco de las 5 A para evaluar el dominio de los segmentos de valor: acceso, adquisición, autoridad, atención y agencia.

El primero de ellos, Access, puede considerarse distribución de contenido digital. Tal vez recuerde el mantra popularizado por Bill Gates que «el contenido es el rey» en Internet. Ninguna empresa llegó a dominar todo el contenido de la Web, en gran medida porque la propiedad del contenido se distribuye ampliamente, los formatos del contenido son variados y los estándares abiertos de Internet permiten a cualquiera convertirse en editor. Sin embargo, YouTube llegó a dominar el vídeo generado por los usuarios y, más recientemente, Netflix creó cuota de mercado sin igual en el vídeo profesional. En menor medida, Spotify ha tenido éxito dominando el música espacio. Cada uno siguió una estrategia similar de un mercado bilateral que reunía al mayor número de proveedores y consumidores.

YouTube comenzó en la Web y realizó la transición a los dispositivos móviles con éxito. Tanto Netflix como Spotify necesitaron innovaciones adicionales en torno a la omnipresente banda ancha y WiFi para hacer estas mismas transiciones. Por lo tanto, este segmento ha evolucionado con las plataformas.

La adquisición es la segunda «A». Cuando piensa en las compras por Internet, no se discute que Amazon llegó a dominar esta esfera en los EE. UU. y en muchos países occidentales. En China, Alibaba y sus diversas propiedades ostenta este título, pero podemos señalar a estos dos claros ganadores a pesar de que muchas empresas también venden en línea, algunas en exclusiva. Amazon y Alibaba también siguieron el modelo de mercado de agregar la oferta y la demanda.

La autoridad es un activo blando, pero poderoso. Google llegó a dominar la autoridad tanto en la era web como en la móvil al convertirse en el motor de búsqueda dominante. Si quisiera responder a una pregunta, la buscaría en Google. En un momento dado, La Enciclopedia Británica, Walter Cronkite o El New York Times podría haber sido la principal autoridad de su época. La era digital nos dio Google, con más de El 90% de todo el tráfico de búsquedas.

Cada uno de estos tres primeros segmentos tiene como objetivo hacer valer el control en el mercado sobre la distribución del contenido, el comercio y la información. La siguiente A tiene que ver con controlar la forma en que las personas utilizan su tiempo. La atención solía ser algo que los principales programas de televisión, noticieros o los periódicos más populares podían considerar una ventaja. Los consumidores sintonizaban o leían su contenido, y eso les ofrecía la oportunidad de hacer publicidad. Es fácil concluir que Apple y Google, con sus sistemas operativos móviles dominantes, junto con Apple de nuevo y Samsung como los principales fabricantes de teléfonos inteligentes del mundo, fueron los ganadores de la era móvil. Sin embargo, otro ganador fue, sin duda, Facebook. Sus propiedades pasaron a estar al mando más atención de los usuarios que cualquier otra empresa por un amplio margen.

Jugando a la defensa contra un nuevo intermediario

Cada uno de estos segmentos vuelve a estar disponible en la nueva era de la voz. Los asistentes de voz ofrecen un fácil acceso al contenido. Están acostumbrados a Adquirir bienes, y son una nueva fuente de autoridad, según responden miles de millones de preguntas anualmente. También están desviando la atención que antes se centraba en las interacciones con los teléfonos inteligentes hacia nuevas propiedades de interacción por voz.

Esto significa que cada uno de los ganadores de las anteriores guerras de plataformas web y móviles tiene un territorio que debe proteger. ¿El vídeo interactivo por voz, en el que los usuarios pueden controlar la reproducción e incluso elegir la secuencia del contenido, acabará desplazando al consumo pasivo de vídeo en YouTube? ¿Un asistente de voz de Google o Apple canalizará las compras de los usuarios a través de Amazon.com cumplimiento, ¿o, en cambio, irán directamente a los vendedores en línea? ¿Los asistentes de voz de Amazon, Apple, Microsoft y Samsung consultarán únicamente el gráfico de conocimiento de Google para responder a las preguntas? ¿Cómo desviarán los hábitos de los consumidores y los sesgos de los asistentes de voz la atención de los consumidores de Facebook, Instagram y WhatsApp hacia otras distracciones?

El cambio introducido por la voz es aún más disruptivo que el cambio de la web a los dispositivos móviles. Esa transición implicó que los usuarios desviaran su tiempo a un nuevo canal tecnológico que también tenía acceso al canal anterior a través de la web móvil. Gran parte del contenido de la web y los dispositivos móviles es completamente inaccesible a través de los asistentes de voz. Además, las actividades en las plataformas web y móviles estaban dirigidas por los usuarios. El consumidor tomó decisiones. Cada vez más, los asistentes de voz toman decisiones para los consumidores. Ahí es donde entra en juego la quinta «A».

La agencia es lo que más temen todos los grandes ganadores de las plataformas tecnológicas anteriores. Los asistentes de voz se reservan la agencia para tomar decisiones sobre el origen de las respuestas (Autoridad) y pueden influir en gran medida en la fuente del contenido (Acceso), por ejemplo, dirigir a la gente hacia Prime Video o YouTube. También pueden hacer pedidos de varias fuentes (adquisición) que no son Amazon.com. Además, introducen nuevas fuentes de interacción que desplazan el tiempo de los consumidores a los medios de comunicación (atención).

Los asistentes de voz son intermediarios. La web no tiene un intermediario estructural equivalente y las tiendas de aplicaciones móviles imponen restricciones limitadas en función de la certificación de las aplicaciones, pero no dirigen abiertamente a los consumidores a una fuente en particular. Los asistentes de voz guían abiertamente a los usuarios y ofrecen el «mejor resultado» para cualquier solicitud. Los usuarios pueden solicitar los resultados de fuentes específicas, pero eso requiere un esfuerzo y una previsión adicionales, y es posible que el asistente de voz no ponga ese contenido a disposición en última instancia. Por ejemplo, no hay compras en Amazon.com a través del Asistente de Google, y Alexa preferirá los resultados de Prime Video por encima de otros servicios.

La dirección y la disponibilidad son cuestiones claras que pueden socavar la posición de ganador de una plataforma tecnológica anterior, pero la agencia tendrá implicaciones mucho mayores. Los asistentes de voz están diseñados para ayudar a simplificar la vida de los usuarios. Con el tiempo, se concederá cada vez más agencia a los asistentes de voz para que simplemente ejecuten tareas en nombre del usuario. Al consumidor no le importará necesariamente cómo se complete la tarea, solo que se haga. Parte de esto estará dirigido al usuario, como Google Dúplex hacer una reserva en un restaurante. En parte, será proactivo, ya que un asistente de voz verá que un artículo favorito que el usuario compra habitualmente está disponible con descuento y simplemente se pedirá y enviará sin instrucciones explícitas.

Los principales gigantes de la tecnología de nuestra era deben defenderse de los asistentes de voz de otras organizaciones para proteger los logros que tanto les costó conseguir en la web y los dispositivos móviles. No proteger su franquicia podría provocar una caída rápida.

Jugar a la ofensiva controlando al agente

Si un agente toma decisiones en nombre de un consumidor, puede entender por qué todos los gigantes de la tecnología quieren ser los proveedores de ese asistente. Google puede garantizar que los usuarios del Asistente de Google se dirijan a sus servicios de búsqueda y vídeo de YouTube y, al mismo tiempo, hacer mella en las compras en línea. Amazon puede expandirse más allá del comercio hacia la búsqueda y la atención y, al mismo tiempo, acelerar la adopción de sus propiedades de contenido digital. Samsung podría ir más allá de su liderazgo mundial en ventas de teléfonos inteligentes e incluir servicios en línea con voz.

Los cambios de plataforma representan oportunidades para que los nuevos actores creen su propio dominio en el segmento. Apple y Samsung aprovecharon el cambio a los teléfonos inteligentes para crear franquicias aparentemente inexpugnables a expensas de Nokia y Blackberry. Facebook estableció el segmento de atención, siempre disponible, que no existía antes de que tuviéramos ordenadores compactos y conectados con acceso digital de gran ancho de banda todo el tiempo.

Los asistentes de voz no tienen límites

Los asistentes de voz no están limitados a un dispositivo y eso los hace más potentes debido a su ubicuidad. La web estaba originalmente conectada a su PC. Los teléfonos inteligentes son móviles, pero se convierten en una fuente única y personalizada de información, conectividad y entretenimiento. Los asistentes de voz suelen ser más reconocibles a través de los altavoces inteligentes, pero de hecho están encendidos al menos diez veces más teléfonos inteligentes y se están expandiendo rápidamente a los electrodomésticos y a una variedad de otros puntos de acceso por voz, como reproductores multimedia digitales, refrigeradores y relojes inteligentes.

Esta falta de límites entre los dispositivos significa que los asistentes de voz pueden difundirse más fácilmente, pueden ofrecer diferentes tipos de valor que las plataformas anteriores y pueden ofrecer un punto de entrada para nuevos proveedores que no tienen activos de épocas anteriores. Las mayores empresas de tecnología del mundo lo reconocen porque aprovecharon los cambios provocados por los cambios de plataforma anteriores. También están muy en sintonía con sus ventajas competitivas actuales y las de sus rivales, y ven la voz como una oportunidad para reforzar sus defensas y, al mismo tiempo, ganar nuevos y lucrativos terrenos.

Bienvenido a la era de la voz.