Sprechen Sie mit mir: Was Voice Bots heute können


Vor 18 Jahren zeigten sie in der Anime-Serie Ghost in the Shell: Das einsame Syndrom absolut fantastische Roboteroperatoren. Zusätzlich zu den sehr fortgeschrittenen physischen Fähigkeiten (Sie müssten mit solchen Fingern einen Code eingeben!) Konnten sie perfekt mit Menschen in Sprache kommunizieren. Heute werden Bots niemanden überraschen. Wir treffen uns überall in verschiedenen Bereichen unseres Lebens. Sie werden in medizinischen Einrichtungen, Banken, im Vertrieb, im Kundenservice, in sozialen Netzwerken usw. eingesetzt. Und wenn wir uns bereits an Chat-Bots gewöhnen, sind Voice-Bots für viele immer noch eine Neuheit. Ja, und die Technologie selbst ist noch lange nicht perfekt. Wie ist die Situation bei Voice Bots jetzt?

Die Geschichte der Voice Bots begann bereits 1966 mit Chat Bots. Die erste derartige Entwicklung wurde von Joseph Weizenbaum geschaffen und hieß "Eliza". Der Bot führte als Psychotherapeut einen Dialog, stellte die Sätze in Frage und forderte, sie fortzusetzen. Bei der ersten Kommunikation merkten viele nicht, dass sie mit der Maschine kommunizierten. Sätze wurden nach dem Typ gebaut:

- Mein Kopf tut weh.
"Warum tut dein Kopf weh?"

Tatsächlich war „Eliza“ eine Parodie auf einen Psychotherapeuten und übte keine Funktionen aus. Trotzdem war es der erste Chat-Bot.

Der nächste Bot erschien 1972 und trug den Namen "Parry". Er spielte die Rolle eines Patienten mit Schizophrenie und schaffte es, viele Ärzte, die mit ihm sprachen, zu täuschen.

Ein wichtiger Meilenstein in der Entwicklung von Bots war ALICE (Artificial Linguistic Internet Computer Entity). Dies war der erste Bot, der einen praktisch vollständigen Dialog mit einer Person führen und mithilfe heuristischer Analysen empfangene Phrasen mit den in der Datenbank verfügbaren vergleichen konnte. Die Antworten waren ziemlich allgemein gehalten, aber selbst eine solche Mitteilung für 1995 war ein Durchbruch. Seitdem werden die Interaktionsalgorithmen von Bots mit Benutzern jedes Jahr sprunghaft verbessert. Mit dem Aufkommen neuronaler Netze sind Bots viel schlauer geworden. Bei der Kommunikation mit verschiedenen Personen füllen Bots, die maschinelles Lernen verwenden, ihre Datenbank auf und lernen, als Person zu sprechen.

Mit der Entwicklung der Spracherkennungstechnologie und der Sprachsynthese sind Sprachbots aufgetaucht. Dies ist der nächste Schritt zu einem vollwertigen virtuellen Assistenten, der alle möglichen einfachen Aufgaben ohne menschliches Eingreifen lösen kann. Es gibt viele Einsatzbereiche für solche Assistenten: Ersetzen von Call-Center-Betreibern in der Anfangsphase der Bearbeitung von Anträgen; technische Unterstützung bei einfachen und häufigsten Fragen; Automatisierung des Verkaufs und der Bestellung von Waren; Kundenbenachrichtigungen und Umfragen; elektronische Assistentensekretäre, die nicht müde werden und nichts vergessen; intelligente Anrufbeantworter usw. Nach und nach ersetzen Voice Bots ganze Call Center und verarbeiten alle eingehenden Anrufe von Kunden. Und wenn der Bot das vom Client kontaktierte Problem nicht lösen kann, leitet er den Anruf an den menschlichen Bediener weiter.

Außerdem rüsten verschiedene „intelligente“ Geräte Voice-Bots aus. Dank der Entwicklung des Internet der Dinge tauchen zunehmend virtuelle Assistenten in unserem Leben auf. Zum Beispiel hatte 2018 jeder sechste erwachsene Amerikaner intelligente Lautsprecher . Dies ist ein Gerät mit einem integrierten Sprachbot, das über eine beliebige verfügbare Schnittstelle eine Verbindung zum Internet herstellt und Musik von Streaming-Diensten abspielen, die Lieferung oder ein Taxi bestellen, E-Mails lesen, auf Anfrage Informationen finden, einem Kind ein Märchen erzählen, das Wetter aussprechen und vieles mehr kann. Das Umsatzwachstum dieser Geräte betrug 2017 128%. In Russland wurden ausländische Geräte, die kein Russisch sprechen, nicht vertrieben, aber in letzter Zeit sind inländische Entwicklungen auf dem Markt erschienen. Sie verfügen über die gleichen Fähigkeiten wie ihre ausländischen Kollegen und übertreffen sie in einigen Bereichen.

In Kürze werden wir auch unsere Smart-Kolumne "Capsule" veröffentlichen ( Vorbestellung ist jetzt offen) Sie wurde etwas später als ähnliche Geräte geboren. Die einzige Taste auf der Säule schaltet alle 6 Mikrofone stumm, der Rest wird per Spracheingabe oder über einen taktilen Sensor oben am Kopf gesteuert. Die erste Verbindung ist ganz einfach: Sie müssen die Maroussia-Anwendung auf Ihr Smartphone herunterladen und den Lautsprecher über WLAN mit Wi-Fi verbinden. Mit der Autorisierung in VK können Sie Musik von Ihrer Wiedergabeliste hören und Freunde anrufen: „Capsule“ ist der erste intelligente Lautsprecher auf dem russischen Markt, der über das Netzwerk telefonieren kann. Oder Sie können Ihre eigene Musikauswahl auf Ihrem Smartphone über Bluetooth hören. Sie können die Spalte auch als Taschenrechner verwenden: Bitten Sie sie, etwas zu addieren oder zu multiplizieren, und sie wird das Ergebnis sofort mitteilen.

Seine Fähigkeiten werden ständig erweitert. Zum Beispiel kürzlich hinzugefügte „Bürogeräusche“: Sie sitzen zu Hause an einem abgelegenen Ort, und damit die Änderungen nicht so schmerzhaft sind, schließen Sie das übliche Bürolärm ein. Wir haben Capsule auch beigebracht, Spiele zu spielen: Quiz, Städte, Erundopel, Glauben - Glaube nicht, Fanta und andere. Und in naher Zukunft wollen wir ihr beibringen, Kinder zu unterhalten: Stimmen verschiedener Tiere und interessante Geräusche zu machen, Lernspiele mit RFID-Karten zu spielen usw. Jetzt kann Maroussia Dialoge führen und Fragen beantworten, aber bald besteht die Möglichkeit, ein Taxi, Essen, Kinokarten usw. zu bestellen.

In naher Zukunft können Sprachassistenten die Aufgaben des Referenten ausführen. Beispielsweise gibt es eine Version von Google Duplex Voice Assistant. Bisher können nur Besitzer von Pixel-Smartphones in einigen US-Städten es verwenden, es ist jedoch geplant, es auf iOS und Android einzuführen. Die Präsentation des Bots fand 2018 auf der Google I / O-Konferenz statt . Der Bot rief im Restaurant an und reservierte einen Tisch, der mit einer vom Menschen nicht zu unterscheidenden Stimme kommunizierte. In naher Zukunft ist eine deutliche Erweiterung der Funktionen von Duplex geplant. Er kann im Namen des Benutzers Anrufe tätigen, Reparaturdienste anrufen, Besprechungen arrangieren und vieles mehr. In diesem Fall wird die Person am anderen Ende des Kabels benachrichtigt, dass sie im Namen des Eigentümers mit dem Bot kommuniziert.

Call Center, die auf Voice Bots basieren, werden immer beliebter. Basierend auf demselben Duplex führte Google das intelligente Sprachsystem Google Contact Center AI ein. Künstliche Intelligenz kann alle eingehenden Anrufe empfangen, verarbeiten und entscheiden, ob ein Spezialist zur Lösung des Problems hinzugezogen werden muss. Neben Google werden von vielen Unternehmen Sprachassistenten entwickelt, darunter KVINT, Robovoice, Glagol usw.

Bots als Call-Center-Betreiber können sowohl für ausgehende Anrufe (Information von Kunden, Umfragen, Koordination der Marktforschung, Klärung von Bestellungen und vieles mehr) als auch für die Verarbeitung eingehender Anrufe von Kunden verwendet werden, um einfache Aufgaben zu lösen, die in der Datenbank beschrieben sind. Bei Bedarf leitet der Bot den Anruf an den Betreiber der entsprechenden Abteilung weiter: Vertrieb, Service, technischer Support usw.

Voice Bots können hilfreich sein, wenn Sie täglich Tausende von Beispielanrufen tätigen oder empfangen müssen. Ein Roboter ersetzt rund um die Uhr Dutzende von Bedienern. Natürlich funktioniert es bisher nicht, eine Person vollständig zu ersetzen: Es gibt viele Situationen, mit denen der Roboter nicht fertig wird. Zumindest kann dies die Belastung der Call-Center-Betreiber erheblich verringern.

Beispielsweise verwenden einige russische Banken bereits Voice Bots ( 1 , 2 , 3 , 4)) Der Roboter kann den Kontostand, die Adresse des nächsten Geldautomaten, den Wechselkurs usw. anzeigen. Beispielsweise verarbeitet VTB Voice Assistant etwa 25% der Kundenanfragen erfolgreich. Der Roboter beantwortet die Frage innerhalb weniger Sekunden und hängt nicht von der Tageszeit oder der Anzahl der freien Bediener ab. Wenn der Client das Wesentliche des Problems darlegt, leitet der Bot es automatisch an den entsprechenden Dienst weiter. Der Anruf wird nur an den Betreiber weitergeleitet, wenn sich die Antwort auf die Frage des Kunden nicht in der Datenbank befindet. Das System basiert auf einem neuronalen Netzwerk und ist selbstlernend. Seit der Einführung des Sprachbots ist der Spracherkennungsgrad von Bankkunden auf 85% gestiegen. Der Roboter sammelt und strukturiert auf Anfrage der Benutzer automatisch Informationen. Dank dieser Daten verbesserte VTB einige Dienste und startete neue (SMS mit Informationen zum Bereitschaftsdatum der Karte, zu Zweigstellenadressen usw.).Der Bot entlastet die Mitarbeiter des Call Centers der Bank erheblich und spart Zeit für Spezialisten.

Voice Bots haben Fehler. Die Technologie ermöglicht es Ihnen zwar, die meisten Sätze von Menschen zu erkennen, aber wenn sich die Frage von der typischen unterscheidet, führen viele Roboter den Benutzer durch einfache Fragen und versuchen, eine Lösung für das Problem zu finden, ohne einen Spezialisten einzubeziehen. Dies ist für die Kunden sehr ärgerlich und führt zu Unzufriedenheit. Außerdem kann der Bot die Frage fälschlicherweise erkennen und die falsche Antwort geben, was den Kunden Zeit und Nerven nimmt.

Aktive Korrekturen sind im Gange, um diese und andere Mängel zu beheben. Datenbanken und Technologien für maschinelles Lernen werden verbessert und Methoden zur Synthese und Erkennung von Sprache entwickelt. Die Voice Bots der nächsten Generationen werden bereits getestet. Beispielsweise wird bei VTB ein Bot für ausgehende Anrufe getestet, der Bankprodukte anbieten, über die Bedingungen für deren Verwendung sprechen und auf Kundeneinwände reagieren kann.

Heute entwickeln viele Startups Lösungen im Bereich Voice Bots. Einige der interessanten sind:

ELLIQ von Intuition Robotics. Es ist ein Sprachassistent für ältere Menschen. Es erleichtert ihnen, in die digitale Welt einzutauchen und mit dem Internet der Dinge zu kommunizieren. ELLIQ wird darüber sprechen, wie Sie Chats, Instant Messenger und soziale Netzwerke verwenden, Sie benachrichtigen, wenn eine neue Nachricht von Freunden oder der Familie eingegangen ist oder Sie einen Anruf von jemandem erhalten haben, oder Sie werden anbieten, Ihre Familie selbst anzurufen, wenn diese im Netzwerk erschienen ist. Der Assistent kann eine Wiedergabeliste auswählen, ein Medikament oder Produkte bestellen, das Wetter für die kommenden Tage mitteilen, Sie an die Notwendigkeit erinnern, Medikamente einzunehmen usw. ELLIQ wird dazu beitragen, auch die sehr schlecht versierten Menschen in der Welt der digitalen Technologien zu verstehen.


Chris von German Autolabs . Dies ist ein Sprachassistent für Fahrer. Sie können die für den Fahrer erforderlichen Anwendungen verbinden, Anrufe tätigen und diese mit Sprachbefehlen und einfachen Gesten beantworten. Mit seiner Hilfe können Sie auch Musik einschalten, zwischen Titeln und Radiosendern wechseln. Chris kann Ihnen den Weg zeigen, die beste Route finden und Ihnen zeigen, wie Sie Zeit sparen können, indem Sie Staus umgehen.


Ada Gesundheit . Eine spezialisierte medizinische Assistentin, die von einem Team von Ärzten und Wissenschaftlern entwickelt wurde, um sich um unsere Gesundheit zu kümmern. Derzeit ist der Assistent ein Chatbot in Form einer separaten mobilen Anwendung. In naher Zukunft ist jedoch die Einführung des Sprachmodus geplant. Der Bot hilft bei der Diagnose und Auswahl einer Behandlung anhand der eingegebenen Symptome und der Beschreibung von Gesundheitsproblemen. Startup arbeitet mit führenden Gesundheitsunternehmen zusammen und baut auf deren Fachwissen auf. Seit dem Start des Projekts im Jahr 2016 hat sich die Anwendung auf 140 Länder ausgeweitet und verfügt über 15 Millionen Bewertungen.


Dasha.ai . Ein universelles System, das Outsourcing-Dienste zum Anrufen und Beantworten von Anrufen bietet. "Dasha" kann Kunden anrufen, Waren verkaufen, Briefe basierend auf den Ergebnissen eines Gesprächs senden, chatten und Fragen beantworten. Natürlich braucht sie ein detailliertes Skript, um arbeiten zu können. "Dasha" versteht Synonyme, erinnert sich an die vom Gesprächspartner verwendeten Wörter und den Kontext; erkennt, wenn sie unterbrochen oder zum Rückruf aufgefordert wird. Eine Person hört normale „menschliche“ Sprache am Telefon und viele verstehen nicht einmal, dass sie mit dem Roboter kommunizieren:

https://dasha.ai/ru/wp-content/uploads/2019/09/dasha_demo_1_mp3.mp3

https: // dasha. ai / ru / wp-content / uploads / 2019/09 / dasha_demo_2_mp3.mp3

* * *

In Zukunft werden Voice Bots zahlreiche Call Center vollständig ersetzen und die meisten Kundenanfragen lösen, wodurch die Arbeit von Spezialisten minimiert werden kann. Es entwickeln sich auch elektronische Assistenten, die über die üblichen Geräte hinausgehen. Sie werden sich in allen Haushaltsgeräten, Autos und sogar in Kleidung niederlassen. Anstelle zahlreicher Assistenten auf verschiedenen Geräten gibt es für jeden Benutzer einen Assistenten.

All Articles