Wie die Sprachsynthese auf dem PC erschien

Das letzte Mal sprachen wir über digitale Sprachsynthesizer und erinnerten uns daran, wie Donald Sherman, der an einer Gesichtslähmung litt, 1974 erstmals einen Text-to-Speech-Computer verwendete, um Pizza über das Telefon zu bestellen. Dann arbeitete der Synthesizer an dem im Labor der Michigan State University installierten Mainframe. Mit der Entwicklung der Technologie und dem Aufkommen von PCs sind TTS-Lösungen jedoch mobiler geworden.

Lassen Sie uns über einige der frühen Entwicklungen dieser Zeit sprechen.


Photo Springsgrace / CC BY-SA

DECtalk Synthesizer


1981 wandte sich Professor Dennis Klatt vom MIT an die Digital Equipment Corporation, um die Perspektiven seines Algorithmus für die verkettete Sprachsynthese zu erörtern . Ein solches System verbindet zuvor aufgezeichnete Segmente natürlicher Sprache. Vertreter des Unternehmens erkannten das Potenzial in der Arbeit von Clatt und beschlossen, damit ihren eigenen Sprachsynthesizer auf den Markt zu bringen. Die Entwicklung dauerte drei Jahre, in denen das Projekt seinen Namen zweimal ändern konnte - von KLATTALK zu CLATTER und schließlich zu DECtalk .

Die Freilassung erfolgte 1984 - der Fall des Gerätes war etwas größer als der der Katze. Das Gerät, das an ein Computersystem mit einer asynchronen seriellen Schnittstelle ( COM-Schnittstelle ) und seinen späteren Versionen angeschlossen ist - an den ISA-Bus . Es hatte auch Anschlüsse für den Anschluss an eine Telefonleitung.

Diese Funktion ermöglichte es, die Arbeit mit eingehenden und ausgehenden Anrufen zu automatisieren. Die Maschine konnte mit neun Stimmen sprechen: vier Männer, vier Frauen und eine Kindin. Jede der Stimmen, die der Benutzer unabhängig einstellen kann - ändern Sie die Tonhöhe und ändern Sie die Übertragungsfunktion des Kopfes ( S. 61 ). Darüber hinaus können Sie mit dem System die Aussprache von Wörtern anpassen. Dank dieser Funktion konnte ihr das Singen beigebracht werden .


, DECtalk « ». DEC 2018 . «» Raspberry Pi, , , — .

In den 90er Jahren beschloss DEC, die Technologielizenz an Entwickler von Audiogeräten von Drittanbietern zu verkaufen. Zum Beispiel ist der DECtalk-Chip Teil der Sound Blaster AWE32-Soundkarte geworden ( wir haben in unserem Blog über die Nachbildung seines Vorfahren geschrieben ). Das Bundle enthielt eine spezielle TextAssist-Software.

DECtalk ist ein ziemlich erfolgreiches Produkt geworden. Aus einer Reihe von Gründen hat die Digital Equipment Corporation die Rechte an dieser Marke jedoch an Force Computers übertragen. Sie wiederum verkaufte ihre Fonix Speech, die heute als SpeechFX bekannt ist , weiter . Es bietet weiterhin DECtalk-basierte Sprachsynthesizer für eingebettete Geräte.

SAM - Software Automatic Mouth


Im Jahr 1982 Entwickler Mark Barton (Mark Barton) freigegeben SA M . Dies ist einer der ersten kommerziellen Software-Sprachsynthesizer für 8-Bit-Computersysteme: Atari 8-Bit, Commodore 64 und Apple II.

Im ersten Fall verwendete SA M den eingebauten Audio-Chip POKEY . Seine Fähigkeiten ermöglichten es, polyphone Musik und Effekte in Spielen zu erzeugen. Die Implementierung wird immer noch in einer Reihe von Emulatoren verwendet, beispielsweise in MAME . Im Fall von Commodore 64 wurde eine eingebaute SID-Schaltung mit einem 4-Bit-DAC verwendet, was die Qualität der Sprachwiedergabe negativ beeinflusste.


Foto Federica Galli / Unsplash

Bei der Version für Apple II arbeitete der Synthesizer mit einer Standarderweiterungskarte und einem 8-Bit-Digital-Analog-Wandler. SAM erschien später auf dem ersten Macintosh. Steve Jobs bestand persönlich darauf, dass das Programm in der früheren Version von Mac OS enthalten sein sollte. Das Unternehmen schloss eine Partnerschaftsvereinbarung mit Barton, und seine Entwicklung, die in MacInTalk umbenannt wurde, wurde Teil des Ökosystems des "Apple Corporation".

Die Neuheit wurde sofort in die Präsentation des Computers im Jahr 1984 aufgenommen. Die Maschine stellte sich selbständig auf der Bühne vor und begann mit dem Satz: „Hallo. Ich bin Macintosh. "

Macintosh Complete Speech
«, Macintosh. .

, , , IBM: „ , “.

, . , … ».




Heute wird SAM fast nie mehr irgendwo verwendet und dient als historisches Erbe - Sie können die Webversion des Synthesizers (und den Code auf GitHub ) im Netzwerk finden . Obwohl im Jahr 2017 Indie-Entwickler von Airdorf Games ein Tool verwendeten, um Charaktere im computergestützten Horrorspiel Faith auszusprechen .

Natürlich ist dies nicht alles - nur einer der ersten - Sprachsynthesizer für PCs, die um die Jahrhundertwende veröffentlicht wurden. Sie ebneten jedoch den Weg für moderne Lösungen, die realistischer klingen. Wir werden im nächsten Artikel weiter über die darin verwendeten Technologien sprechen.



« Hi-Fi»:

« »:
:
Sporth — live-
:
:



All Articles