Skip to content

5 Tendencias del diseño de la interfaz de voz

En su esencia, el concepto de interacción siempre tuvo que ver con la comunicación. La Interacción Humano-Computadora nunca ha sido sobre interfaces gráficas de usuario, por lo que las Interfaces de Usuario de Voz (VUIs) son el futuro del diseño de interfaces de usuario.

Una interfaz es sólo un medio que la gente utiliza para interactuar con un sistema, ya sea una interfaz gráfica de usuario (GUI), una interfaz gráfica de usuario (VUI) o cualquier otra cosa. ¿Por qué es tan importante la interfaz VUI? Dos razones:

En primer lugar, las interfaces conversacionales son tan fascinantes porque la conversación es una forma de comunicación que todo el mundo entiende.

Inicio

  1. Es un medio natural de interacción. Las personas asocian la comunicación de voz con otras personas más que con la tecnología.
  2. Los usuarios no necesitan aprender a interpretar ninguna simbología o nueva terminología (el lenguaje de la GUI), pueden utilizar el inglés (o cualquier otro idioma nativo) para operar con un sistema. Esto no significa que los usuarios no tengan que aprender a usar un sistema, sino que la curva de aprendizaje se reduzca significativamente.

En segundo lugar, las expectativas de los usuarios están cambiando. Según Statista, el 39% de los milenios utilizan la búsqueda por voz. Esta audiencia está lista para ser los primeros en adoptar los sistemas VUI.

Top 5 Tendencias VUI

Cuando se trata de diseñar VUI, la interacción de voz representa el mayor reto de UX para los diseñadores desde el nacimiento del iPhone original. Pero la gran noticia es que los principios más fundamentales del diseño de interfaz de usuario que utilizamos al crear productos con interfaz gráfica de usuario siguen siendo aplicables al diseño de interfaz de usuario. A continuación encontrará algunas tendencias que darán forma al diseño de VUI en las próximas décadas.

1. VUI que crea confianza

La confianza ayuda a construir un puente entre una persona y una máquina. Si no hay confianza, es poco probable que los usuarios interactúen con una determinada interfaz de usuario de voz.

La importancia del resultado válido (la VUI debe dar a la persona el entendimiento de que recibirá exactamente lo que solicitó). Es posible lograr este objetivo centrándose en las siguientes cosas:

  • Mejorar la precisión del reconocimiento de voz (algoritmos de PNL más sofisticados).
  • Enfocarse en entender la intención del usuario (una razón para interactuar en primer lugar). Cuando los usuarios interactúan con un sistema, tienen un problema en particular que quieren resolver, y el objetivo del diseñador es entender cuál es este problema.
  • Proporcionar mensajes de error significativos.
  • Creación de flujos impulsados por el contexto. Aunque es imposible predecir todos los comandos que los usuarios pueden preguntar al sistema, los diseñadores necesitan al menos diseñar un flujo de usuario que sea manejado contextualmente. El sistema debe anticipar la intención de los usuarios en cada punto de una conversación y proporcionarles información sobre lo que pueden hacer a continuación. Por ejemplo, encontrar un restaurante cerca del usuario. Cuando los usuarios buscan un restaurante, el sistema debe coincidir exactamente con lo que el usuario está buscando.

La importancia del control del usuario (una de las 10 heurísticas de usabilidad para el diseño de interfaces de usuario de Jakob Nielsen sigue siendo aplicable al diseño de VUI).

  • El sistema debe considerar las limitaciones naturales del cerebro humano (limitaciones de la memoria a corto plazo). La información proporcionada por el sistema debería ser abrumadora. Cuando la gente escucha la respuesta del sistema, la mayoría de los usuarios recuerdan sólo la última frase. Por lo tanto, es mejor mantenerse alejado de frases largas o proporcionar una docena de opciones diferentes mientras el usuario puede recordar sólo un par de ellas a la vez.
  • El sistema debe reaccionar a una solicitud del usuario con la retroalimentación adecuada. Esta retroalimentación debe dar a los usuarios una comprensión completa de lo que el sistema está haciendo en este momento. Por ejemplo, la retroalimentación visual le permite al usuario saber que el sistema está listo y escuchando; o en POD (Process of Doing). Cuando un usuario envía una solicitud al sistema, éste muestra un ARE. POD no es una animación de carga, no sólo indica el hecho de que los usuarios tienen que esperar mientras un sistema está haciendo algo, sino que proporciona información valiosa de lo que hace el sistema. Por ejemplo, un POD para un comando al extraer un archivo de Dropbox puede parecerse a una búsqueda de un archivo correcto en el almacenamiento.

2. Interfaz de usuario adaptable

Una interfaz de usuario adaptativa (también conocida como AUI) es una interfaz de usuario (UI) que se adapta a las necesidades del usuario o contexto. La VUI del futuro se adaptará para los usuarios: el sistema analizará toda la información que tenga sobre los usuarios (incluida la información sobre el estado mental y el estado de salud actual) y su contexto actual para proporcionar respuestas más relevantes a las solicitudes de los usuarios.

Por ejemplo, si un usuario tiene la presión arterial alta en el momento actual y decide fijar una reunión en 2 horas, un asistente digital puede sugerir que se evite o que se reduzca la presión arterial con ejercicio antes de que comience la reunión.

3. VUI que transmite personalidad

Los diseñadores visuales tienen muchas opciones para introducir la personalidad en las interfaces gráficas de usuario – fuentes, color, ilustración, movimiento, por nombrar sólo algunas. ¿Pero qué hay de la VUI? Los diseñadores pueden transmitir la personalidad utilizando el propio lenguaje, jugando con las palabras, la voz y el tono. Hablando de voz, una voz es parte de la persona y forma su identidad. Una vez que asociamos una voz con algo, se convierte en parte de su identidad. Y experimentamos emociones cuando interactuamos con una interfaz de este tipo, al igual que cuando interactuamos con personas reales. La gente quiere voces comprensibles para los humanos, no una voz que suene humana, sino una voz que hable coherentemente humana.

Mal ejemplo: Voz Siri de Susan Bennett – la voz que suena casi humana pero la gente todavía sabe que es una máquina. No puedes tener un diálogo con Siri. Mientras puedes preguntarle a Siri algo como: “¿Cómo está el tiempo hoy?” No se pueden hacer preguntas más sofisticadas como: “¿Qué me pongo hoy?”. Como resultado, no tienes sentimientos profundos por Siri, sabes que es sólo un robot.

Buen ejemplo: La voz de Samantha de la película Her – la voz que suena coherentemente humana y la gente puede estar enamorada de ella.

4. De la IA estrecha hacia la inteligencia general

Las interacciones entre el hombre y la computadora están cambiando a la conversación, pero los usuarios esperan más. La mayoría de los sistemas de IA disponibles hoy en día se limitan a la IA Estrecha – tales sistemas utilizan el Aprendizaje Automático para resolver un problema claramente definido (y, en la mayoría de los casos, demasiado estrecho). Los IAs estrechos no tienen ningún conocimiento fuera de sus datos de entrenamiento. Significa que cuando un usuario quiere resolver un problema ligeramente diferente, o el problema en sí mismo evoluciona, el sistema no será capaz de resolverlo y responderá con algo como, “No entiendo”. Para que tú, como usuario, te enfrentes a una pared.

En comparación con la IA Estrecha, la Inteligencia General no se limita a dominios estrechos. El concepto de aprendizaje está en la base de los sistemas GI – la diferencia fundamental entre la IA Estrecha y la IA General es que los sistemas de Inteligencia General aprenden sin estar expresamente programados (las máquinas aprenden por sí mismas). El sistema de IG utiliza dos tipos de aprendizaje: aprendizaje de refuerzo (cuando un sistema utiliza toda la información disponible para resolver un problema particular de un usuario) y aprendizaje supervisado (cuando un sistema necesita ayuda del usuario para resolver un problema por primera vez). Otra diferencia es que un sistema general de IA puede aprender a utilizar otra IA para propósitos generales y específicos. Como resultado, diferentes modelos de Aprendizaje Automático pueden ser entrenados de manera dependiente y trabajar en forma cooperativa. Un sistema avanzado de PNL es capaz de aprender desde el primer intento combinando y procesando información de múltiples fuentes de datos diferentes.

5. Impacto en la sociedad

Aceptación generalizada de los sistemas VUI. La mejora de la calidad de los sistemas basados en la IA VUI conducirá a una mayor participación de los usuarios. Las relaciones entre el ser humano y la computadora serán interactivas y colaborativas – la gente y las computadoras trabajarán juntas. Esto impactará a la sociedad – imagínese que en diez años, usted entrará a la casa y hablará y controlará todo tipo de máquinas.

Este futuro será con la IA omnipresente: como usuarios, confiaremos en la IA incluso con las decisiones más importantes como “¿Qué escuela debo elegir para mis hijos?” La VUI mejorará la calidad de vida de las personas mayores y de las personas con discapacidad.

Conclusión

“La mejor interfaz es ninguna interfaz” es una famosa cita de Golden Krishna, el autor del libro The Best Interface Is No Interface. Él y muchos otros diseñadores creen que la gente no quiere más tiempo con las pantallas, de hecho quieren menos. Por lo tanto, la tecnología debería dejar de celebrar las soluciones basadas en la pantalla. Y sucederá relativamente pronto – las interacciones del futuro no se harán con botones.

Con el aumento de la potencia de procesamiento de los ordenadores, tendremos más sistemas que podrán calcular hasta 1000 pasos en 1 segundo. Un usuario y una máquina trabajarán juntos, permitiendo la Inteligencia General.