Comment la synthèse vocale est apparue sur PC

La dernière fois, nous avons parlé de synthétiseurs vocaux numériques et nous avons rappelé comment, en 1974, Donald Sherman, une personne souffrant de paralysie faciale, a d'abord utilisé un ordinateur de synthèse vocale pour commander une pizza par téléphone. Le synthétiseur a ensuite travaillé sur l'unité centrale installée dans le laboratoire de la Michigan State University. Mais avec le développement de la technologie et l'avènement des ordinateurs personnels, les solutions TTS sont devenues plus mobiles.

Parlons de certains des premiers développements de cette époque.


Photo Springsgrace / CC BY-SA

Synthétiseur DECtalk


En 1981, le professeur Dennis Klatt du MIT a contacté Digital Equipment Corporation pour discuter des perspectives de son algorithme de synthèse vocale concaténative . Un tel système relie des segments pré-enregistrés de la parole naturelle. Les représentants de l'entreprise ont vu le potentiel des travaux de Clatt et ont décidé de les utiliser pour lancer leur propre synthétiseur vocal sur le marché. Le développement a duré trois ans, au cours desquels le projet a réussi à changer de nom deux fois - de KLATTALK à CLATTER et, enfin, à DECtalk .

La libération a eu lieu en 1984 - le boîtier de l'appareil était légèrement plus grand que le chat. Le périphérique connecté à tout système informatique avec un port série asynchrone ( port COM ) et ses versions ultérieures - au bus ISA . Il avait également des connecteurs pour se connecter à une ligne téléphonique.

Cette fonctionnalité a permis d'automatiser le travail avec les appels entrants et sortants. La machine était capable de parler à neuf voix: quatre hommes, quatre femmes et un enfantin. Chacune des voix que l'utilisateur peut accorder indépendamment - change la hauteur et modifie la fonction de transfert de la tête ( p . 61 ). De plus, le système vous permet d'ajuster la prononciation des mots. Grâce à cette fonctionnalité, elle a pu apprendre à chanter .


, DECtalk « ». DEC 2018 . «» Raspberry Pi, , , — .

Dans les années 90, DEC a décidé de vendre la licence technologique aux développeurs d'appareils audio tiers. Par exemple, la puce DECtalk est devenue une partie de la carte son Sound Blaster AWE32 ( nous avons écrit sur la réplique de son ancêtre sur notre blog). Le pack comprenait un logiciel TextAssist spécialisé.

DECtalk est devenu un produit assez réussi. Cependant, pour un certain nombre de raisons, Digital Equipment Corporation a transféré les droits de cette marque à Force Computers. À son tour, elle a revendu son discours Fonix, qui est aujourd'hui connu sous le nom de SpeechFX . Il propose toujours des synthétiseurs vocaux basés sur DECtalk pour les appareils intégrés.

SAM - Logiciel bouche automatique


En 1982, le développeur Mark Barton (Mark Barton) publié SA M . Il s'agit de l'un des premiers synthétiseurs vocaux logiciels commerciaux pour les systèmes informatiques 8 bits: Atari 8 bits, Commodore 64 et Apple II.

Dans le premier cas, SA M a utilisé la puce audio intégrée POKEY . Ses capacités ont permis de créer de la musique et des effets polyphoniques dans les jeux. Et son implémentation est toujours utilisée dans un certain nombre d'émulateurs, par exemple MAME . Dans le cas du Commodore 64, un circuit SID intégré avec un DAC 4 bits a été utilisé, ce qui a nui à la qualité de la reproduction de la parole.


Photo Federica Galli / Unsplash

Quant à la version pour Apple II, le synthétiseur fonctionnait avec une carte d'extension standard et un convertisseur numérique-analogique 8 bits. SAM est apparu plus tard sur le premier Macintosh. Steve Jobs a personnellement insisté pour que le programme soit inclus dans la version antérieure de Mac OS. La société a conclu un accord de partenariat avec Barton, et son développement, en changeant son nom en MacInTalk, est devenu une partie de l'écosystème de la "Apple Corporation".

La nouveauté a été immédiatement incluse dans la présentation de l'ordinateur en 1984. La machine s'est présentée indépendamment sur scène, en commençant par la phrase: «Bonjour. Je suis Macintosh. "

Discours complet sur Macintosh
«, Macintosh. .

, , , IBM: „ , “.

, . , … ».




Aujourd'hui, SAM n'est presque jamais utilisé et sert d'héritage historique - vous pouvez trouver la version Web du synthétiseur (et le code sur GitHub ) sur le réseau . Bien qu'en 2017, les développeurs indépendants d'Airdorf Games aient utilisé un outil pour exprimer les personnages du jeu d'horreur informatique Faith .

Bien sûr, ce n'est pas tout - seulement l'un des premiers - des synthétiseurs vocaux pour PC commercialisés au début du siècle. Mais ils ont ouvert la voie à des solutions modernes qui semblent plus réalistes. Nous continuerons à parler des technologies qui y sont utilisées dans le prochain article.



« Hi-Fi»:

« »:
:
Sporth — live-
:
:



All Articles