L'histoire de la synthèse vocale: l'ère des solutions électriques

La dernière fois, nous avons parlé des appareils mécaniques pour la synthèse de la parole - l'appareil vocal de Kempelen et la «tête parlante» de Joseph Faber. Viennent ensuite les synthétiseurs électriques du XXe siècle.


Photo Rock'n Roll Monkey / Unsplash

Les premières installations électriques


En 1850, le physicien et physiologiste allemand Hermann von Helmholtz a présenté sa théorie des résonateurs . Il a remarqué que les voyelles ont des fréquences de résonance différentes (formants). Ces formants se forment lors du passage d'une onde sonore des cordes vocales aux lèvres. Certaines ondes sont réfléchies par les lèvres du locuteur et vont vers le destinataire, et certaines retournent à la source. Le scientifique a suggéré que le tractus vocal humain peut être représenté comme une séquence de résonateurs.

Au début du XXe siècle, des tentatives ont commencé pour mettre en œuvre un tel modèle basé sur des composants électriques. Le premier synthétiseur de ce type a été développé par le physicien John Stewart. Son plan ( publiédans la revue Nature), comprenait un buzzer électrique pour la modélisation des faisceaux et une paire de résonateurs inductifs capacitifs. Ils ont imité les processus physiques qui se produisent avec le son dans la gorge.

Un circuit de synthétiseur conçu par John Stuart

L'appareil Stuart pourrait émettre des sons composés de deux formants. Ce sont quelques voyelles simples, ainsi que desdiphtongues. Mais là-dessus, ses possibilités ont pris fin.

Le premier synthétiseur électrique capable de reproduire la paroleest apparuplus tard - dans les années 1930. Il a été développé par Homer Dudley des Bell Laboratories. A cette époque, l'entreprise travaillait survocoder- un outil pour compresser la parole et économiser les ressources de fréquence d'une ligne radio dans les réseaux téléphoniques. L'idée était de transmettre des paramètres clés au lieu de la voix de l'appelant. Un décodeur spécial a été installé du côté de la réception, qui a reconstruit et reproduit le son en utilisant ces paramètres. Dudley s'est rendu compte qu'avec des modifications mineures, le vocodeur peut être transformé en un synthétiseur à part entière. Il y avait donc un système VODER - Voice Operating Demonstrator.

L'appareil a été présenté au grand public à l'Exposition universelle de New York en 1939. Le design VODER inclusdeux sources sonores: un générateur de bruit de lampe pour les phonèmes «sourds» et un oscillateur pour les phonèmes «vocalisés». Il y avait également dix filtres passe-bande connectés en parallèle - ils constituaient l'unité de contrôle de la résonance. L'opérateur a contrôlé le système à l'aide d'un clavier à main, d'un bracelet de poignet et d'une pédale.

Pendant les démonstrations, l'appareil parlait différentes langues, chantait et répondait aux questions avec différentes intonations. Mais pour libérer le potentiel du système, son opérateur avait besoin d'années de formation.


Peu de temps après la première de VODER, la Seconde Guerre mondiale a commencé et Bell Labs a dû interrompre le développement du synthétiseur. Cependant, grâce aux connaissances acquises pendant les travaux sur le projet, Homer Dudley avait l' habitude de créer une technologie de cryptage pour les conversations téléphoniques.

Synthétiseurs vocaux sur spectrogrammes


En 1946, un spectrographe acoustique a été inventé . Et l'idée est venue - d'utiliser des spectrogrammes pour contrôler les synthétiseurs vocaux. L. Schott, ingénieur américain chez Bell Labs, a été l'un des premiers à introduire un tel appareil. Il a utilisé une source de lumière linéaire, des motifs spectrographiques translucides avec différents degrés de transparence. Des photocellules spéciales montées en face de la lampe ont enregistré des changements dans le niveau d'éclairage et généré des signaux de commande pour les filtres passe-bande. Homer Dudley a utilisé exactement les mêmes filtres pour son VODER.

Photo 120ans.net, d'
autres développements dans ce domaine ont présenté un groupe de scientifiques américains dirigé par le physicien Franklin Cooper ( Franklin to Cooper Cooper ). Leur système optique estLecture de motif - modulé les harmoniques du ton fondamental de 120 Hz, en lisant des images sur une bande transparente en mouvement. Des informations visuelles ont été transmises à l'oscillateur, les transformant en sons.

Dans un sens, le système ressemblait à des synthétiseurs optiques soviétiques - Nivoton et Variofon - sur lesquels ils écrivaient de la musique pour des dessins animés. Cependant, le Pattern Playback a été initialement «emprisonné» pour la génération de la parole humaine et a pu reproduire des phrases entières.


Des appareils comme Pattern Playback et VODER ont jeté les bases théoriques de la conception de synthétiseurs formants et articulés. Ils sont devenus le prototype de la synthèse informatique moderne. Nous en parlerons la prochaine fois.



« Hi-Fi»:

:
:
: « »
« »:
:



All Articles