A história da síntese da fala: a era das soluções elétricas

Na última vez, falamos sobre dispositivos mecânicos para síntese de fala - o trato vocal de Kempelen e a "cabeça falante" de Joseph Faber. Em seguida, são os sintetizadores elétricos do século XX.


Foto Macaco Rock'n Roll / Unsplash

As primeiras instalações elétricas


Em 1850, o físico e fisiologista alemão Hermann von Helmholtz introduziu sua teoria do ressonador . Ele notou que as vogais têm diferentes frequências ressonantes (formantes). Esses formantes são formados durante a passagem de uma onda sonora das cordas vocais para os lábios. Algumas ondas são refletidas nos lábios do falante e vão para o destinatário, e outras retornam à fonte. O cientista sugeriu que o trato vocal humano pode ser representado como uma sequência de ressonadores.

No início do século XX, tentativas começaram a implementar esse modelo com base em componentes elétricos. O primeiro sintetizador desse tipo foi desenvolvido pelo físico John Stewart. Seu esquema ( publicadona revista Nature), incluiu uma campainha elétrica para modelar feixes e um par de ressonadores indutivo-capacitivos. Eles emularam os processos físicos que ocorrem com o som na garganta.

Um circuito de sintetizador projetado por John Stuart

O dispositivo Stuart pode emitir sons que consistem em dois formantes. Estas são algumas vogais simples editongos. Mas nisso suas possibilidades terminaram.

O primeiro sintetizador elétrico capaz de reproduzir a falaapareceumais tarde - na década de 1930. Foi desenvolvido por Homer Dudley, da Bell Laboratories. Naquela época, a empresa estava trabalhando emvocoder- uma ferramenta para comprimir fala e economizar recursos de frequência de uma linha de rádio em redes telefônicas. A ideia era transmitir parâmetros-chave em vez da voz do chamador. Um decodificador especial foi instalado no lado receptor, que reconstruiu e reproduziu o som usando esses parâmetros. Dudley percebeu que, com pequenas modificações, o vocoder pode ser transformado em um sintetizador completo. Portanto, havia um sistema VODER - Voice Operating Demonstrator.

O dispositivo foi apresentado ao público em geral na Feira Mundial de Nova York em 1939. O design VODER incluídoduas fontes de som: um gerador de ruído de tubo para fonemas “surdos” e um oscilador para fonemas “sonoros”. Havia também dez filtros passa-banda conectados em paralelo - eles formavam a unidade de controle de ressonância. O operador controlou o sistema usando um teclado de mão, pulseira de pulso e pedal.

Durante as manifestações, o aparelho falava idiomas diferentes, cantava e respondia perguntas com entonações diferentes. Mas, para liberar o potencial do sistema, seu operador precisava de anos de treinamento.


Logo após a estréia do VODER, a Segunda Guerra Mundial começou e o Bell Labs teve que restringir o desenvolvimento do sintetizador. No entanto, o conhecimento adquirido durante o trabalho no projeto, Homer Dudley, usou para criar tecnologia de criptografia para conversas telefônicas.

Sintetizadores de fala em espectrogramas


Em 1946, um espectrógrafo acústico foi inventado . E surgiu a idéia - usar espectrogramas para controlar sintetizadores de fala. Um dos primeiros a introduzir esse dispositivo foi L. Schott, engenheiro americano do Bell Labs. Ele usou uma fonte de luz linear, padrões espectrográficos translúcidos com diferentes graus de transparência. As fotocélulas especiais montadas em frente à lâmpada registraram alterações no nível de iluminação e geraram sinais de controle para filtros passa-banda. Homer Dudley usou exatamente os mesmos filtros para seu VODER.

Photo 120years.net
outro desenvolvimento nessa área apresentou um grupo de cientistas norte-americanos liderados pelo físico Franklin Cooper ( Franklin to Cooper Cooper ). O sistema óptico deles éReprodução de padrão - modulou os harmônicos do tom fundamental de 120 Hz, lendo imagens em uma fita transparente em movimento. A informação visual foi transmitida ao oscilador, transformando-a em som.

Em certo sentido, o sistema lembrava sintetizadores ópticos soviéticos - Nivoton e Variofon - nos quais escreviam música para desenhos animados. No entanto, a reprodução de padrões foi inicialmente "aprisionada" pela geração da fala humana e foi capaz de reproduzir sentenças inteiras.


Dispositivos como o Pattern Playback e o VODER lançaram as bases teóricas para o design de sintetizadores formantes e articulados. Eles se tornaram o protótipo da síntese de computadores modernos. Falaremos sobre eles na próxima vez.



« Hi-Fi»:

:
:
: « »
« »:
:



All Articles