Fale comigo: o que os robôs de voz podem fazer hoje


Há 18 anos, na série de anime Ghost in the Shell: The Lone Syndrome, eles mostraram operadores de robôs absolutamente fantásticos. Além das capacidades físicas muito avançadas (você teria que digitar um código com esses dedos!), Eles eram perfeitamente capazes de se comunicar com as pessoas na voz. Hoje, os bots não surpreenderão ninguém. Nós os encontramos em todos os lugares, em várias áreas de nossas vidas. Eles são usados ​​em instituições médicas, bancos, vendas, atendimento ao cliente, redes sociais, etc. E se já estamos começando a nos acostumar a conversar com bots, os bots de voz ainda são uma novidade para muitos. Sim, e a própria tecnologia ainda está longe de ser perfeita. Qual é a situação com os robôs de voz agora?

A história dos robôs de voz começou com os robôs de bate-papo em 1966. O primeiro desses desenvolvimentos foi criado por Joseph Weizenbaum e foi chamado de "Eliza". O bot conduziu um diálogo como psicoterapeuta, questionou as frases e exigiu que continuassem. Na primeira comunicação, muitos não perceberam que estavam se comunicando com a máquina. As frases foram construídas de acordo com o tipo:

- Minha cabeça dói.
"Por que sua cabeça dói?"

De fato, “Eliza” era uma paródia de um psicoterapeuta e não exercia nenhuma função. Mas, no entanto, foi o primeiro bot de bate-papo.

O próximo bot apareceu em 1972 e tinha o nome "Parry". Ele desempenhou o papel de um paciente com esquizofrenia e conseguiu enganar muitos médicos que falaram com ele.

Um marco significativo no desenvolvimento de bots foi o ALICE (Entidade de Informática na Internet para Linguística Artificial). Este foi o primeiro robô que conseguiu realizar um diálogo praticamente completo com uma pessoa, usando análise heurística para comparar as frases recebidas com as disponíveis no banco de dados. As respostas foram bastante gerais, mas mesmo essa comunicação para 1995 foi um avanço. Desde então, os algoritmos de interação dos bots com os usuários são aprimorados todos os anos aos trancos e barrancos. Com o advento das redes neurais, os bots se tornaram muito mais inteligentes. Ao se comunicar com pessoas diferentes, os robôs que usam o aprendizado de máquina reabastecem seu banco de dados e aprendem a falar como pessoa.

Com o desenvolvimento da tecnologia de reconhecimento de voz e síntese de voz, os robôs de voz apareceram. Este é o próximo passo para um assistente virtual completo que pode resolver todos os tipos de tarefas simples sem intervenção humana. Existem muitas áreas de uso para esses assistentes: substituição de operadores de call center no estágio inicial de processamento de aplicativos; suporte técnico em perguntas simples e mais comuns; automação de vendas e pedidos de mercadorias; alertas e pesquisas de clientes; secretárias assistentes eletrônicas que não se cansam e não esquecem nada; secretárias eletrônicas inteligentes, etc. Gradualmente, os bots de voz substituem call centers inteiros e processam todas as chamadas recebidas dos clientes. E se o bot não puder resolver o problema que o cliente entrou em contato, ele alterna a chamada para o operador humano.

Além disso, vários dispositivos "inteligentes" começam a equipar os robôs de voz. Graças ao desenvolvimento da IoT, os assistentes virtuais estão aparecendo cada vez mais em nossas vidas. Por exemplo, em 2018, todo sexto americano adulto tinha alto-falantes inteligentes . Este é um dispositivo com um bot de voz integrado que se conecta à Internet através de qualquer interface disponível e pode tocar música de serviços de streaming, entrega de pedidos ou táxi, ler e-mails, encontrar informações mediante solicitação, contar um conto de fadas para a criança, dar voz ao clima e muito mais. O crescimento das vendas desses gadgets em 2017 foi de 128%. Na Rússia, dispositivos estrangeiros que não falam russo não receberam distribuição, mas recentemente surgiram desenvolvimentos domésticos no mercado. Eles têm o mesmo conjunto de capacidades que seus colegas estrangeiros e, em algumas áreas, os superam.

Em breve também lançaremos nossa coluna inteligente "Cápsula" (a pré-encomendaestá aberta) Ela nasceu um pouco mais tarde do que dispositivos semelhantes. O único botão da coluna silencia todos os 6 microfones, o resto é controlado por voz ou usando um sensor tátil na parte superior da cabeça. A primeira conexão é bem simples - você precisa baixar o aplicativo Maroussia no seu smartphone e conectar o alto-falante através dele ao Wi-Fi. A autorização no VK permite que você ouça músicas da sua lista de reprodução e ligue para amigos: "Capsule" é o primeiro alto-falante inteligente no mercado russo que pode ligar pela rede. Ou você pode ouvir sua própria seleção de músicas em seu smartphone via Bluetooth. Você também pode usar a coluna como uma calculadora: peça a ela para adicionar ou multiplicar algo, e ela dirá imediatamente o resultado.

Suas capacidades estão em constante expansão. Por exemplo, “sons do escritório” recentemente adicionados: você está sentado em casa em um local remoto e, para que as mudanças não sejam tão dolorosas, inclua o ruído usual do escritório. Também ensinamos a Capsule a jogar: testes, cidades, Erundopel, Acredite - Não Acredite, Fanta e outros. E, em um futuro próximo, planejamos ensiná-la a divertir as crianças: fazer as vozes de vários animais e sons interessantes, jogar jogos educativos usando cartões RFID, etc. Agora Maroussia é capaz de conduzir diálogos e responder perguntas, mas em breve haverá uma oportunidade de pedir um táxi, comida, ingressos de cinema etc.

Em um futuro próximo, os assistentes de voz poderão executar as tarefas do referente. Por exemplo, há uma versão do Google Duplex Voice Assistant. Até agora, apenas os proprietários de smartphones Pixel em algumas cidades dos EUA podem usá-lo, mas está planejado para introduzi-lo no iOS e Android. A apresentação do bot ocorreu em 2018 na conferência de E / S do Google . O bot ligou para o restaurante e reservou uma mesa, comunicando-se com uma voz indistinguível da humana. Em um futuro próximo, está prevista uma expansão significativa dos recursos do Duplex. Ele poderá fazer chamadas em nome do usuário, ligar para serviços de reparo, organizar reuniões e muito mais. Nesse caso, a pessoa do outro lado da ligação será notificada de que está se comunicando com o bot em nome do proprietário.

Os call centers baseados em bots de voz estão se tornando cada vez mais populares. Portanto, com base no mesmo duplex, o Google introduziu o sistema de voz inteligente Google Contact Center AI. A inteligência artificial poderá receber todas as chamadas recebidas, processá-las e decidir sobre a necessidade de conectar um especialista para resolver o problema. Além do Google, assistentes de voz estão sendo desenvolvidos por muitas empresas, incluindo KVINT, Robovoice, Glagol, etc.

Os bots como operadores de call center podem ser usados ​​tanto para chamadas de saída (informando clientes, pesquisas, coordenação de pesquisas de marketing, esclarecimento de pedidos e muito mais), quanto para processar chamadas de clientes, resolvendo tarefas simples descritas no banco de dados. Se necessário, o bot alterna a chamada para o operador do departamento correspondente: vendas, serviço, suporte técnico etc.

Os bots de voz podem ajudar quando você precisar fazer ou receber milhares de chamadas de amostra por dia. Um robô substitui dezenas de operadores 24/7. Naturalmente, até agora, substituir completamente uma pessoa não funcionará: existem muitas situações nas quais o robô não aguenta. Mas pelo menos pode reduzir significativamente a carga nos operadores de call center.

Por exemplo, alguns bancos russos já usam robôs de voz ( 1 , 2 , 3 , 4) O robô pode saber o saldo, endereço do caixa eletrônico mais próximo, taxa de câmbio, etc. Por exemplo, o VTB Voice Assistant processa com êxito cerca de 25% das solicitações dos clientes. O robô responde à pergunta em alguns segundos e não depende da hora do dia ou do número de operadores gratuitos. Quando o cliente definir a essência do problema, o bot o redirecionará automaticamente para o serviço apropriado. A chamada é transferida para o operador apenas se a resposta à pergunta do cliente não estiver no banco de dados. O sistema é baseado em uma rede neural e é de auto-aprendizado. Desde a introdução do bot de voz, o nível de reconhecimento de fala de clientes bancários aumentou para 85%. O robô coleta e estrutura automaticamente informações a pedido dos usuários. Graças a esses dados, a VTB aprimorou alguns serviços e lançou novos (SMS informando a data em que o cartão estava pronto, os endereços das filiais etc.).O bot reduz significativamente a carga sobre os funcionários da central de atendimento do banco e também economiza o tempo dos especialistas.

Os bots de voz têm falhas. Embora a tecnologia permita reconhecer a maioria das frases das pessoas, mas quando a pergunta é diferente da típica, muitos robôs começam a liderar o usuário em círculos simples em círculos, tentando encontrar uma solução para o problema sem envolver um especialista. Isso é muito irritante para os clientes e causa descontentamento. Além disso, o bot pode reconhecer erroneamente a pergunta e dar a resposta errada, o que também tira o tempo e os nervos dos clientes.

Correções ativas estão em andamento para corrigir essas e outras deficiências. Bancos de dados e tecnologias de aprendizado de máquina estão sendo aprimorados, e métodos para sintetizar e reconhecer a fala estão sendo desenvolvidos. Os robôs de voz das próximas gerações já estão sendo testados. Por exemplo, um bot para chamadas efetuadas está sendo testado na VTB, que pode oferecer produtos bancários, falar sobre as condições de uso e responder às objeções dos clientes.

Hoje, muitas startups estão desenvolvendo soluções no campo de bots de voz. Alguns dos interessantes incluem:

ELLIQ da Intuition Robotics. É um assistente de voz projetado para idosos. Isso facilita a imersão no mundo digital e a comunicação com a Internet das coisas. O ELLIQ falará sobre como usar bate-papos, mensagens instantâneas, redes sociais, notificará se uma nova mensagem chegar de amigos ou familiares, ou se você recebeu uma ligação de alguém ou se oferecerá para ligar para sua família se eles aparecerem na rede. O assistente pode selecionar uma lista de reprodução, solicitar um medicamento ou produtos, dar voz ao clima nos próximos dias, lembrá-lo da necessidade de tomar remédios etc. O ELLIQ ajudará a entender até as pessoas muito pouco versadas no mundo das tecnologias digitais.


Chris, da Autolabs alemã . Este é um assistente de voz para os motoristas. Permite conectar os aplicativos necessários ao motorista, fazer chamadas e atendê-los usando comandos de voz e gestos simples. Também com sua ajuda, você pode ativar a música, alternar entre faixas e estações de rádio. Chris pode lhe dizer o caminho, encontrar a melhor rota e mostrar como economizar tempo contornando engarrafamentos.


Ada Health . Um assistente médico especializado, desenvolvido por uma equipe de médicos e cientistas para ajudar a cuidar de nossa saúde. Atualmente, o assistente é um chatbot na forma de um aplicativo móvel separado, mas em um futuro próximo está planejado introduzir o modo de voz. O bot ajuda a diagnosticar e selecionar um tratamento com base nos sintomas inseridos e na descrição dos problemas de saúde. A startup trabalha com as principais empresas de assistência médica e desenvolve seus conhecimentos. Desde o lançamento do projeto em 2016, o aplicativo se espalhou para 140 países e possui 15 milhões de classificações.


Dasha.ai . Um sistema universal que oferece serviços de terceirização para fazer e atender chamadas. O “Dasha” pode ligar para clientes, vender mercadorias, enviar cartas com base nos resultados de uma conversa, conversar e responder perguntas. Claro, ela precisa de um roteiro detalhado para funcionar. “Dasha” entende sinônimos, lembra as palavras e o contexto usados ​​pelo interlocutor; reconhece quando é interrompida ou solicitada a ligação. Uma pessoa ouve o discurso "humano" normal no telefone e muitos nem entendem que estão se comunicando com o robô:

https://dasha.ai/ru/wp-content/uploads/2019/09/dasha_demo_1_mp3.mp3

https: // dasha. ai / ru / wp-content / uploads / 2019/09 / dasha_demo_2_mp3.mp3

* * *

No futuro, os bots de voz substituirão completamente vários call centers e resolverão a maioria das solicitações dos clientes, permitindo minimizar o trabalho de especialistas. Assistentes eletrônicos também estão se desenvolvendo, indo além dos aparelhos usuais. Eles se instalam em todos os eletrodomésticos, carros e até em roupas. Em vez de vários assistentes em dispositivos diferentes, haverá um assistente para cada usuário.

All Articles