Uso de las interfaces de voz para hacer que los productos sean más inclusivos
por Cathy Pearl

Sunny/Getty Images
Ya sea que cree servicios, productos físicos o software, el diseño inclusivo es esencial. El diseño inclusivo significa hacer que los productos sean accesibles y utilizables por el mayor número de personas posible. Las interfaces de usuario de voz (VUI) son una herramienta estupenda para lograr este objetivo.
Las VUI se han popularizado durante más de 20 años, empezando por los primeros sistemas telefónicos automatizados IVR (respuesta de voz interactiva). Originalmente, esta tecnología se diseñó para ayudar a las empresas a ahorrar dinero, ya que los agentes humanos cuestan más que los sistemas automatizados. Su desarrollo tuvo más que ver con los resultados que con el altruismo.
Ahora estamos en lo que yo llamo la «segunda era» de las interfaces de usuario de voz, gracias a la llegada del altavoz inteligente en 2014. Las VUI se utilizan ahora en muchos más lugares que en los sistemas de telefonía automatizados e incluyen asistentes de voz como el Asistente de Google, Amazon Echo, Bixby, Cortana, Siri, etc. Las VUI actuales utilizan una variedad de técnicas impulsadas por la IA, como la mejora del reconocimiento de voz y el procesamiento del lenguaje natural. Al principio, los altavoces inteligentes solo ofrecían funciones básicas, como configurar los temporizadores y reproducir música. En los años transcurridos desde entonces, se han ampliado para abarcar interacciones más complejas, como encender los dispositivos del hogar, ayudar a cocinar y ofrecer entretenimiento.
Si bien este tipo de dispositivos ofrecen comodidad al usuario medio al permitir una experiencia más natural y sin problemas, el futuro de las VUI incluye un escenario mucho más grande: capacitar a las personas que más lo necesitan.
Una estimación 62 millones las personas en los EE. UU. tienen problemas motores o de movilidad. Las VUI ya están disponibles en cientos de millones de dispositivos, incluidos altavoces inteligentes, auriculares y relojes, y son ya se está utilizando para ayudar a las personas a gestionar la comunicación, como el correo electrónico y los mensajes de texto, y a controlar los dispositivos domésticos. Están parejos ayudar a las personas con distrofia muscular utilice su voz para ajustar la cama durante toda la noche y evitar las úlceras por decúbito.
Centro Insight
Interactuar con la IA
Patrocinado por Qlik
Cómo trabajarán juntos los humanos y las máquinas.
Para el 285 millones personas en el mundo con discapacidad visual, las VUI también pueden aportar independencia y dignidad. El uso de la voz puede facilitar a las personas con discapacidad visual encontrar su teléfono inteligente cuando lo pierden, para escuchar música sin tener que seguir probando varios CD en el estéreo, y para saber cuánto tiempo queda en un temporizador. Como tecnólogos, solemos pensar en las cosas importantes (ayudar a la gente a vestirse, alimentarse, moverse, etc.), pero a menudo nos olvidamos de las pequeñas cosas que muchos de nosotros damos por sentadas, como navegar por los canales. Las VUI pueden ayudar con el tipo de tareas que hacen que las personas se sientan más comprometidas con sus vidas.
Sin embargo, no se trata solo de discapacidades físicas. Para las personas con demencia, los asistentes de voz son una forma sin prejuicios de ayudar con los recordatorios de los medicamentos y de responder a las mismas preguntas una y otra vez sin tener que preguntarle a su cuidador, que puede que ya esté agotado emocionalmente.
También es una forma estupenda para que las personas mayores que tal vez no tengan un smartphone o un portátil (o que no tengan un alto nivel de comodidad con ellos) sigan teniendo acceso a Internet y mantenerse en contacto con la familia. En un grupo focal en Carlsbad, California, la empresa FrontPorch instaló altavoces inteligentes en un centro de vivienda asistida y recibió el gran entusiasmo de muchos de los residentes, que podían enviar mensajes a sus familiares, jugar, escuchar su música favorita e incluso enviarse mensajes entre sí. Como dijo un participante:
Lo más divertido de todo fue configurar la mensajería con dos amigos que también han empezado a usar este mágico dispositivo. Sí, podríamos esperar a que nos viéramos en el vestíbulo. Sí, nos vendría bien el teléfono. Pero hay algo tan personal y privado y divertido sobre el uso de [esto]. No me había divertido tanto desde que éramos niños y colgamos un cable entre dos latas y jugábamos al «teléfono».
Las VUI también pueden ser una forma de superar las bajas tasas de alfabetización. En El Wall Street Journal artículo El fin de la escritura: los próximos mil millones de usuarios de dispositivos móviles confiarán en el vídeo y la voz, el autor escribe sobre un hombre que es propietario de un smartphone pero, debido a su falta de alfabetización, no puede utilizar muchas de sus funciones. Con la voz, ahora puede acceder a información importante, como los horarios de los trenes, y hacer cosas como reproducir sus canciones favoritas. La voz también puede generar confianza en el uso de Internet, ya que permite a las personas explorar de una manera cómoda.
La otra cara de esta tecnología consiste en ayudar a las personas que han perdido la capacidad de hablar o cuyo patrón de habla no es normativo. Para estas personas, no siempre se pueden utilizar las VUI, ya que los modelos de voz se entrenan con una voz más estándar. Hay dos enfoques para resolver estos problemas. En primer lugar, para los que pierden la capacidad de hablar debido a enfermedades como la ELA, se les puede grabar la voz y, a continuación, convertirla en una voz TTS (conversión de texto a voz). Cuando ya no puedan hablar, pueden utilizar la voz del TTS para comunicarse. En cuanto al segundo problema, más de 100 millones las personas en EE. UU. y Europa tienen patrones de habla que pueden no funcionar con las VUI actuales, tal vez porque tartamudean o han tenido un derrame cerebral y su idioma es menos inteligible. La solución es crear más modelos de voz que puedan gestionar estas diferencias.
Sin embargo, las ventajas de la tecnología de voz y los diseños inclusivos tienen sentido para todos. Muchos de nosotros tenemos discapacidades temporales. Por ejemplo, una persona que lleve comida (o un bebé), que no pueda usar las manos temporalmente o que tenga problemas del habla debido a un fuerte resfriado o una gripe, puede recibir ayuda de la IA con voz. Incluso algo tan simple como olvidar las gafas de leer puede significar que no puede leer el teléfono; poder utilizar la voz en estos casos puede marcar la diferencia.
Si bien la IA de voz tiene el potencial de ayudar a mejorar los productos y servicios para los grupos que pueden estar infrarrepresentados, también debemos pensar en los propios modelos de reconocimiento de voz. Hay personas para las que los modelos de reconocimiento estándar no funcionan tan bien, y nuestro objetivo es garantizar que nuestros datos de entrenamiento cubran a una población diversa de usuarios para que podamos mejorar la calidad de nuestro reconocimiento de voz para todos. Uno de los ejemplos que destacamos en la reciente conferencia Google I/O muestra cómo utilizamos la IA para mejorar los productos para personas con problemas del habla. Recomiendo encarecidamente a las empresas que consideren cómo el diseño inclusivo beneficia a muchos de sus clientes. La tecnología de voz realmente puede ayudarnos a todos.
Artículos Relacionados

La IA es genial en las tareas rutinarias. He aquí por qué los consejos de administración deberían resistirse a utilizarla.

Investigación: Cuando el esfuerzo adicional le hace empeorar en su trabajo
A todos nos ha pasado: después de intentar proactivamente agilizar un proceso en el trabajo, se siente mentalmente agotado y menos capaz de realizar bien otras tareas. Pero, ¿tomar la iniciativa para mejorar las tareas de su trabajo le hizo realmente peor en otras actividades al final del día? Un nuevo estudio de trabajadores franceses ha encontrado pruebas contundentes de que cuanto más intentan los trabajadores mejorar las tareas, peor es su rendimiento mental a la hora de cerrar. Esto tiene implicaciones sobre cómo las empresas pueden apoyar mejor a sus equipos para que tengan lo que necesitan para ser proactivos sin fatigarse mentalmente.

En tiempos inciertos, hágase estas preguntas antes de tomar una decisión
En medio de la inestabilidad geopolítica, las conmociones climáticas, la disrupción de la IA, etc., los líderes de hoy en día no navegan por las crisis ocasionales, sino que operan en un estado de perma-crisis.