Die Geschichte der Sprachsynthese: die Ära der elektrischen Lösungen

Zuletzt, wir sprachen über mechanische Vorrichtungen für die Sprachsynthese - Kempelen Vokaltrakts und Joseph Fabers „Talking Head“. Als nächstes folgen elektrische Synthesizer des 20. Jahrhunderts.


Foto Rock'n Roll Monkey / Unsplash

Die ersten elektrischen Anlagen


1850 stellte der deutsche Physiker und Physiologe Hermann von Helmholtz seine Resonatortheorie vor . Er bemerkte, dass Vokale unterschiedliche Resonanzfrequenzen (Formanten) haben. Diese Formanten werden beim Durchgang einer Schallwelle von den Stimmbändern zu den Lippen gebildet. Einige Wellen werden von den Lippen des Sprechers reflektiert und gehen zum Empfänger, andere kehren zur Quelle zurück. Der Wissenschaftler schlug vor, dass der menschliche Stimmapparat als eine Folge von Resonatoren dargestellt werden kann.

Zu Beginn des 20. Jahrhunderts begannen Versuche, ein solches Modell auf der Basis elektrischer Komponenten zu implementieren. Der erste Synthesizer dieses Typs wurde vom Physiker John Stewart entwickelt. Sein Schema ( veröffentlichtin der Zeitschrift Nature) enthalten einen elektrischen Summer zum Modellieren von Bündeln und ein Paar induktiv-kapazitiver Resonatoren. Sie emulierten die physikalischen Prozesse, die mit Geräuschen im Hals ablaufen.

Eine von John Stuart entworfene Synthesizer-Schaltung

Das Stuart-Gerät könnte Klänge erzeugen, die aus zwei Formanten bestehen. Dies sind ein paar einfache Vokale sowieDiphthongs. Aber damit endeten seine Möglichkeiten.

Der erste elektrische Synthesizer, der Sprache reproduzieren kann,erschienspäter - in den 1930er Jahren. Es wurde von Homer Dudley von Bell Laboratories entwickelt. Zu dieser Zeit arbeitete das Unternehmen anVocoder- ein Tool zum Komprimieren von Sprache und zum Speichern von Frequenzressourcen einer Funkleitung in Telefonnetzen. Die Idee war, Schlüsselparameter anstelle der Stimme des Anrufers zu übertragen. Auf der Empfangsseite wurde ein spezieller Decoder installiert, der mit diesen Parametern den Klang rekonstruierte und wiedergab. Dudley erkannte, dass der Vocoder mit geringfügigen Änderungen in einen vollwertigen Synthesizer verwandelt werden kann. Es gab also ein VODER- System - Voice Operating Demonstrator.

Das Gerät wurde 1939 auf der New Yorker Weltausstellung der Öffentlichkeit vorgestellt. Das VODER-Design ist enthaltenZwei Schallquellen: ein Röhrenrauschgenerator für "taube" Phoneme und ein Oszillator für "stimmhafte". Es gab auch zehn parallel geschaltete Bandpassfilter - sie bildeten die Resonanzsteuereinheit. Der Bediener steuerte das System über eine Handtastatur, ein Armband und ein Fußpedal.

Während der Demonstrationen sprach der Apparat verschiedene Sprachen, sang und beantwortete Fragen mit unterschiedlichen Intonationen. Um das Potenzial des Systems auszuschöpfen, benötigte der Bediener jahrelange Schulungen.


Kurz nach der Premiere von VODER begann der Zweite Weltkrieg, und Bell Labs musste die Weiterentwicklung des Synthesizers einschränken. Aufgrund der während der Projektarbeit gewonnenen Erkenntnisse entwickelte Homer Dudley jedoch eine Verschlüsselungstechnologie für Telefongespräche.

Sprachsynthesizer auf Spektrogrammen


1946 wurde ein akustischer Spektrograph erfunden . Und es kam die Idee auf, Spektrogramme zur Steuerung von Sprachsynthesizern zu verwenden. Einer der ersten, der ein solches Gerät einführte, war L. Schott, ein amerikanischer Ingenieur bei Bell Labs. Er verwendete eine lineare Lichtquelle, durchscheinende spektrographische Muster mit unterschiedlichem Transparenzgrad. Spezielle Fotozellen gegenüber der Lampe zeichneten Änderungen des Beleuchtungspegels auf und erzeugten Steuersignale für Bandpassfilter. Homer Dudley verwendete genau die gleichen Filter für seinen VODER.

Foto 120years.net
Andere Entwicklungen in diesem Bereich haben eine Gruppe US-amerikanischer Wissenschaftler unter der Leitung des Physikers Franklin Cooper ( Franklin to Cooper Cooper ) vorgestellt. Ihr optisches System istMusterwiedergabe - modulierte die Harmonischen des Grundtons von 120 Hz und las Bilder auf einem sich bewegenden transparenten Band. Visuelle Informationen wurden an den Oszillator übertragen und in Ton umgewandelt.

In gewisser Weise ähnelte das System den sowjetischen optischen Synthesizern Nivoton und Variofon, auf denen sie Musik für Cartoons schrieben. Die Musterwiedergabe war jedoch zunächst für die Erzeugung menschlicher Sprache „eingesperrt“ und konnte ganze Sätze reproduzieren.


Geräte wie Pattern Playback und VODER haben den theoretischen Grundstein für die Entwicklung von Formant- und Artikulationssynthesizern gelegt. Sie wurden zum Prototyp der modernen Computersynthese. Wir werden das nächste Mal darüber sprechen.



« Hi-Fi»:

:
:
: « »
« »:
:



All Articles