Como a síntese da fala apareceu no PC

Na última vez em que conversamos sobre sintetizadores digitais de fala e lembramos como, em 1974, Donald Sherman, sofrendo de paralisia facial, primeiro utilizou um computador de conversão de texto em fala para pedir pizza por telefone. Em seguida, o sintetizador trabalhou no mainframe instalado no laboratório da Michigan State University. Mas com o desenvolvimento da tecnologia e o advento dos computadores pessoais, as soluções TTS tornaram-se mais móveis.

Vamos falar sobre alguns dos desenvolvimentos iniciais da época.


Foto Springsgrace / CC BY-SA

Sintetizador DECtalk


Em 1981, o professor Dennis Klatt, do MIT, entrou em contato com a Digital Equipment Corporation para discutir as perspectivas de seu algoritmo para a síntese concatenativa da fala . Esse sistema liga segmentos pré-gravados da fala natural. Os representantes da empresa viram o potencial nas realizações de Clatt e decidiram usá-los para lançar seu próprio sintetizador de voz no mercado. O desenvolvimento levou três anos, durante os quais o projeto conseguiu mudar seu nome duas vezes - de KLATTALK para CLATTER e, finalmente, para DECtalk .

O lançamento ocorreu em 1984 - o caso do dispositivo era um pouco maior que o gato. O dispositivo conectado a qualquer sistema de computador com uma porta serial assíncrona ( porta COM ) e suas versões posteriores - ao barramento ISA . Ele também tinha conectores para conectar a uma linha telefônica.

Esse recurso tornou possível automatizar o trabalho com chamadas recebidas e efetuadas. A máquina conseguiu falar em nove vozes: quatro masculinas, quatro femininas e uma infantil. Cada uma das vozes que o usuário pode sintonizar independentemente - altere o tom e modifique a função de transferência da cabeça ( p . 61 ). Além disso, o sistema permite que você ajuste a pronúncia das palavras. Graças a esse recurso, ela pode ser ensinada a cantar .


, DECtalk « ». DEC 2018 . «» Raspberry Pi, , , — .

Nos anos 90, a DEC decidiu vender a licença de tecnologia para desenvolvedores de dispositivos de áudio de terceiros. Por exemplo, o chip DECtalk se tornou parte da placa de som Sound Blaster AWE32 ( escrevemos sobre a réplica de seu ancestral em nosso blog). O pacote incluía o software TextAssist especializado.

O DECtalk se tornou um produto bastante bem-sucedido. No entanto, por vários motivos, a Digital Equipment Corporation transferiu os direitos dessa marca para a Force Computers. Ela, por sua vez, revendeu seu Fonix Speech, que hoje é conhecido como SpeechFX . Ele ainda oferece sintetizadores de fala baseados em DECtalk para dispositivos incorporados.

SAM - Boca Automática de Software


Em 1982, desenvolvedor Mark Barton (Mark Barton) divulgou SA M . Este é um dos primeiros sintetizadores de fala de software comercial para sistemas de computação de 8 bits: Atari 8 bits, Commodore 64 e Apple II.

No primeiro caso, o SA M usou o chip de áudio embutido POKEY . Suas capacidades tornaram possível criar músicas e efeitos polifônicos em jogos. E sua implementação ainda é usada em vários emuladores, por exemplo, MAME . No caso do Commodore 64, foi utilizado um circuito SID interno com um DAC de 4 bits, o que afetou negativamente a qualidade da reprodução da fala.


Foto Federica Galli / Unsplash

Quanto à versão para Apple II, o sintetizador trabalhava com uma placa de expansão padrão e um conversor digital-analógico de 8 bits. O SAM apareceu mais tarde no primeiro Macintosh. Steve Jobs insistiu pessoalmente que o programa fosse incluído na versão anterior do Mac OS. A empresa firmou um contrato de parceria com Barton, e seu desenvolvimento, mudando seu nome para MacInTalk, tornou-se parte do ecossistema da "corporação da maçã".

A novidade foi imediatamente incluída na apresentação do computador em 1984. A máquina se apresentou de forma independente no palco, começando com a frase: “Olá. Eu sou Macintosh. "

Discurso Completo para Macintosh
«, Macintosh. .

, , , IBM: „ , “.

, . , … ».




Hoje, o SAM quase nunca é usado e serve como um legado histórico - você pode encontrar a versão web do sintetizador (e o código no GitHub ) na rede . Embora em 2017, os desenvolvedores independentes da Airdorf Games usassem uma ferramenta para expressar personagens no jogo de terror baseado em computador Faith .

Obviamente, isso não é tudo - apenas um dos primeiros - sintetizadores de fala para PCs, lançado na virada do século. Mas eles abriram o caminho para soluções modernas que soam mais realistas. Continuaremos a falar sobre as tecnologias usadas nelas no próximo artigo.



« Hi-Fi»:

« »:
:
Sporth — live-
:
:



All Articles