Háblame: qué pueden hacer los bots de voz hoy


Hace 18 años, en la serie de anime Ghost in the Shell: The Lone Syndrome, mostraron operadores de robots absolutamente fantásticos. Además de las capacidades físicas muy avanzadas (¡tendría que escribir un código con tales dedos!), Eran perfectamente capaces de comunicarse con personas en voz. Hoy, los bots no sorprenderán a nadie. Nos reunimos con ellos en todas partes, en diversas áreas de nuestras vidas. Se utilizan en instituciones médicas, bancos, en ventas, en servicio al cliente, en redes sociales, etc. Y si ya estamos comenzando a acostumbrarnos a los bots de chat, entonces los bots de voz siguen siendo una novedad para muchos. Sí, y la tecnología en sí está lejos de ser perfecta. ¿Cuál es la situación con los bots de voz ahora?

La historia de los bots de voz comenzó con los bots de chat en 1966. El primer desarrollo de este tipo fue creado por Joseph Weizenbaum y se llamó "Eliza". El bot mantuvo un diálogo como psicoterapeuta, cuestionó las frases y exigió continuarlas. Muchos en la primera comunicación no se dieron cuenta de que se estaban comunicando con la máquina. Las frases fueron construidas según el tipo:

- Me duele la cabeza.
"¿Por qué te duele la cabeza?"

De hecho, "Eliza" era una parodia de un psicoterapeuta y no realizaba ninguna función. Pero, sin embargo, fue el primer bot de chat.

El siguiente bot apareció en 1972 y llevaba el nombre de "Parry". Jugó el papel de un paciente con esquizofrenia y logró engañar a muchos médicos que hablaron con él.

Un hito significativo en el desarrollo de bots fue ALICE (Entidad de Computación de Internet Lingüística Artificial). Este fue el primer robot que pudo llevar a cabo un diálogo prácticamente completo con una persona, utilizando el análisis heurístico para comparar las frases recibidas con las disponibles en la base de datos. Las respuestas fueron bastante generales, pero incluso esa comunicación para 1995 fue un gran avance. Desde entonces, los algoritmos de interacción de los bots con los usuarios se mejoran cada año a pasos agigantados. Con el advenimiento de las redes neuronales, los bots se han vuelto mucho más inteligentes. Al comunicarse con diferentes personas, los bots que utilizan el aprendizaje automático reponen su base de datos y aprenden a hablar como personas.

Con el desarrollo de la tecnología de reconocimiento de voz y la síntesis de voz, han aparecido bots de voz. Este es el siguiente paso para un asistente virtual completo que puede resolver todo tipo de tareas simples sin intervención humana. Hay muchas áreas de uso para tales asistentes: reemplazar a los operadores de centros de llamadas en la etapa inicial de procesamiento de aplicaciones; soporte técnico en preguntas simples y más comunes; automatización de ventas y pedidos de productos; alertas y encuestas a clientes; secretarios asistentes electrónicos que no se cansan y no olvidan nada; contestadores automáticos inteligentes, etc. Gradualmente, los bots de voz reemplazan centros de llamadas completos y procesan todas las llamadas entrantes de los clientes. Y si el bot no puede resolver el problema que el cliente ha contactado, cambia la llamada al operador humano.

Además, varios dispositivos "inteligentes" comienzan a equipar bots de voz. Gracias al desarrollo de IoT, los asistentes virtuales aparecen cada vez más en nuestras vidas. Por ejemplo, en 2018, cada sexto estadounidense adulto tenía altavoces inteligentes . Este es un dispositivo con un bot de voz integrado que se conecta a Internet a través de cualquier interfaz disponible y puede reproducir música de servicios de transmisión, entrega de pedidos o un taxi, leer correo, encontrar información sobre alguna solicitud, contarle a un niño un cuento de hadas, expresar el clima y mucho más. El crecimiento de las ventas de estos dispositivos en 2017 fue del 128%.. En Rusia, los dispositivos extranjeros que no hablan ruso no han recibido distribución, pero recientemente han aparecido desarrollos domésticos en el mercado. Tienen el mismo conjunto de capacidades que sus contrapartes extranjeras, y en algunas áreas las superan.

Pronto también lanzaremos nuestra columna inteligente "Cápsula" ( el pedido anticipado ya está abierto) Ella nació un poco más tarde que dispositivos similares. El único botón en la columna silencia los 6 micrófonos, el resto es controlado por voz o usando un sensor táctil en la parte superior de la cabeza. La primera conexión es bastante simple: debe descargar la aplicación Maroussia en su teléfono inteligente y conectar el altavoz a través de Wi-Fi. La autorización en VK le permite escuchar música de su lista de reproducción y llamar a sus amigos: “Capsule” es el primer altavoz inteligente en el mercado ruso que puede llamar a través de la red. O puede escuchar su propia selección de música en su teléfono inteligente a través de Bluetooth. También puede usar la columna como una calculadora: pídale que agregue o multiplique algo, y ella dirá inmediatamente el resultado.

Sus capacidades se expanden constantemente. Por ejemplo, recientemente agregó "sonidos de oficina": está sentado en su casa en un lugar remoto, y para que los cambios no sean tan dolorosos, incluya el ruido habitual de la oficina. También hemos enseñado a Capsule a jugar: cuestionarios, ciudades, Erundopel, Believe - Do Believe, Fanta y otros. Y en el futuro cercano planeamos enseñarle a entretener a los niños: hacer voces de varios animales y sonidos interesantes, jugar juegos educativos con tarjetas RFID, etc. Ahora Maroussia puede realizar diálogos y responder preguntas, pero pronto habrá la oportunidad de pedir un taxi, comida, entradas para el cine, etc.

En un futuro cercano, los asistentes de voz podrán realizar las tareas del referente. Por ejemplo, hay una versión de Google Duplex Voice Assistant. Hasta ahora, solo los propietarios de teléfonos inteligentes Pixel en algunas ciudades de EE. UU. Pueden usarlo, pero se planea presentarlo en iOS y Android. La presentación del robot tuvo lugar en 2018 en la conferencia Google I / O . El bot llamó al restaurante y reservó una mesa, comunicándose con una voz indistinguible de la humana. En un futuro cercano, se planea una expansión significativa de las capacidades de Duplex. Podrá hacer llamadas en nombre del usuario, llamar a servicios de reparación, organizar reuniones y mucho más. En este caso, se notificará a la persona en el otro extremo del cable que se está comunicando con el bot en nombre del propietario.

Los centros de llamadas basados ​​en bots de voz son cada vez más populares. Entonces, basado en el mismo Duplex, Google introdujo el sistema inteligente de voz Google Contact Center AI. La inteligencia artificial podrá recibir todas las llamadas entrantes, procesarlas y decidir sobre la necesidad de conectar a un especialista para resolver el problema. Además de Google, muchas empresas están desarrollando asistentes de voz, incluidas KVINT, Robovoice, Glagol, etc.

Los bots como operadores de centros de llamadas se pueden usar tanto para llamadas salientes (información a clientes, encuestas, coordinación de investigación de mercado, aclaración de pedidos y mucho más) como para procesar llamadas entrantes de clientes, resolviendo tareas simples descritas en la base de datos. Si es necesario, el bot cambia la llamada al operador del departamento correspondiente: ventas, servicio, soporte técnico, etc.

Los bots de voz pueden ayudarlo cuando necesita hacer o recibir miles de llamadas de muestra por día. Un robot reemplaza a docenas de operadores 24/7. Naturalmente, reemplazar a una persona por completo hasta el momento no funcionará: hay muchas situaciones que el robot no enfrentará. Pero al menos puede reducir significativamente la carga en los operadores de centros de llamadas.

Por ejemplo, algunos bancos rusos ya usan bots de voz ( 1 , 2 , 3 , 4) El robot puede indicar el saldo, la dirección del cajero automático más cercano, el tipo de cambio, etc. Por ejemplo, VTB Voice Assistant procesa con éxito alrededor del 25% de las solicitudes de los clientes. El robot responde la pregunta en unos pocos segundos y no depende de la hora del día ni de la cantidad de operadores libres. Cuando el cliente expone la esencia del problema, el bot lo redirigirá automáticamente al servicio apropiado. La llamada se transfiere al operador solo si la respuesta a la pregunta del cliente no está en la base de datos. El sistema se basa en una red neuronal y es de autoaprendizaje. Desde la introducción del bot de voz, el nivel de reconocimiento de voz de los clientes bancarios ha aumentado al 85%. El robot recopila y estructura automáticamente la información a petición de los usuarios. Gracias a estos datos, VTB mejoró algunos servicios y lanzó otros nuevos (SMS informando sobre la fecha en que la tarjeta estaba lista, sobre las sucursales, etc.).El bot reduce significativamente la carga sobre los empleados del centro de llamadas del banco y también ahorra tiempo a los especialistas.

Los bots de voz tienen fallas. Aunque la tecnología le permite reconocer la mayoría de las frases de las personas, pero cuando la pregunta es diferente de la típica, muchos robots comienzan a guiar al usuario hacia preguntas simples, tratando de encontrar una solución al problema sin involucrar a un especialista. Esto es muy molesto para los clientes y causa insatisfacción. Además, el bot puede reconocer erróneamente la pregunta y dar la respuesta incorrecta, lo que también quita el tiempo y los nervios de los clientes.

Se están realizando correcciones activas para corregir estas y otras deficiencias. Se están mejorando las bases de datos y las tecnologías de aprendizaje automático, y se están desarrollando métodos para sintetizar y reconocer el habla. Los bots de voz de las próximas generaciones ya están siendo probados. Por ejemplo, se está probando un bot para llamadas salientes en VTB, que puede ofrecer productos bancarios, hablar sobre las condiciones para su uso y responder a las objeciones de los clientes.

Hoy, muchas startups están desarrollando soluciones en el campo de los bots de voz. Algunos de los interesantes incluyen:

ELLIQ de Intuition Robotics. Es un asistente de voz diseñado para personas mayores. Les hace más fácil sumergirse en el mundo digital y comunicarse con Internet de las cosas. ELLIQ hablará sobre cómo usar chats, mensajería instantánea, redes sociales, notificarte si un nuevo mensaje ha llegado de amigos o familiares, o si has recibido una llamada de alguien, o te ofrecerás llamar a tu familia si han aparecido en la red. El asistente puede seleccionar una lista de reproducción, pedir un medicamento o productos, expresar el clima para los próximos días, recordarle la necesidad de tomar medicamentos, etc. ELLIQ ayudará a comprender incluso a las personas con muy poca experiencia en el mundo de las tecnologías digitales.


Chris por German Autolabs . Este es un asistente de voz para conductores. Le permite conectar las aplicaciones necesarias para el controlador, realizar llamadas y responderlas mediante comandos de voz y gestos simples. También con su ayuda puede encender música, cambiar entre pistas y estaciones de radio. Chris puede decirte el camino, encontrar la mejor ruta y mostrarte cómo ahorrar tiempo evitando los atascos.


Ada Health . Un asistente médico especializado desarrollado por un equipo de médicos y científicos para ayudar a cuidar nuestra salud. Actualmente, el asistente es un chatbot en forma de una aplicación móvil separada, pero en un futuro próximo se planea introducir el modo de voz. El bot ayuda a diagnosticar y seleccionar un tratamiento basado en los síntomas ingresados ​​y la descripción de los problemas de salud. Startup trabaja con las principales empresas de atención médica y se basa en su experiencia. Desde el lanzamiento del proyecto en 2016, la aplicación se ha extendido a 140 países y tiene 15 millones de calificaciones.


Dasha.ai . Un sistema universal que ofrece servicios de outsourcing para llamar y contestar llamadas. "Dasha" puede llamar a los clientes, vender productos, enviar cartas en función de los resultados de una conversación, chatear y responder preguntas. Por supuesto, ella necesita un guión detallado para funcionar. "Dasha" entiende sinónimos, recuerda las palabras y el contexto utilizados por el interlocutor; reconoce cuando la interrumpen o le piden que vuelva a llamar. Una persona escucha un discurso "humano" normal en el teléfono, y muchos ni siquiera entienden que se están comunicando con el robot:

https://dasha.ai/ru/wp-content/uploads/2019/09/dasha_demo_1_mp3.mp3

https: // dasha. ai / ru / wp-content / uploads / 2019/09 / dasha_demo_2_mp3.mp3

* * *

En el futuro, los bots de voz reemplazarán por completo numerosos centros de llamadas y resolverán la mayoría de las solicitudes de los clientes, lo que permitirá minimizar el trabajo de los especialistas. Los asistentes electrónicos también se están desarrollando, yendo más allá de los dispositivos habituales. Se instalarán en todos los electrodomésticos, automóviles e incluso en la ropa. En lugar de numerosos asistentes en diferentes dispositivos, habrá un asistente para cada usuario.

All Articles