La historia de la síntesis del habla: la era de las soluciones eléctricas.

La última vez, hablamos sobre dispositivos mecánicos para la síntesis del habla: el tracto vocal de Kempelen y la "cabeza parlante" de Joseph Faber. Los siguientes son sintetizadores eléctricos del siglo XX.


Foto Rock'n Roll Monkey / Unsplash

Las primeras instalaciones electricas


En 1850, el físico y fisiólogo alemán Hermann von Helmholtz presentó su teoría del resonador . Se dio cuenta de que las vocales tienen diferentes frecuencias resonantes (formantes). Estos formantes se forman durante el paso de una onda sonora desde las cuerdas vocales hasta los labios. Algunas ondas se reflejan desde los labios del hablante y van al destinatario, y algunas vuelven a la fuente. El científico sugirió que el tracto vocal humano puede representarse como una secuencia de resonadores.

A principios del siglo XX, los intentos comenzaron a implementar dicho modelo basado en componentes eléctricos. El primer sintetizador de este tipo fue desarrollado por el físico John Stewart. Su esquema ( publicadoen la revista Nature), incluyó un timbre eléctrico para modelar paquetes y un par de resonadores inductivos-capacitivos. Emularon los procesos físicos que ocurren con el sonido en la garganta.

Un circuito sintetizador diseñado por John Stuart

El dispositivo Stuart podría producir sonidos que constan de dos formantes. Estas son algunas vocales simples, así comodiptongos. Pero en esto sus posibilidades terminaron.

El primer sintetizador eléctrico capaz de reproducir el discursoapareciómás tarde, en la década de 1930. Fue desarrollado por Homer Dudley de Bell Laboratories. En ese momento, la compañía estaba trabajando envocoder- una herramienta para comprimir voz y ahorrar recursos de frecuencia de una línea de radio en redes telefónicas. La idea era transmitir parámetros clave en lugar de la voz de la persona que llama. Se instaló un decodificador especial en el lado receptor, que reconstruyó y reprodujo el sonido utilizando estos parámetros. Dudley se dio cuenta de que con pequeñas modificaciones, el vocoder puede convertirse en un sintetizador completo. Entonces había un sistema VODER - Demostrador de operación de voz.

El dispositivo fue presentado al público en general en la Feria Mundial de Nueva York en 1939. El diseño VODER incluidodos fuentes de sonido: un generador de ruido de tubo para fonemas "sordos" y un oscilador para fonemas "sonoros". También había diez filtros paso banda conectados en paralelo: formaban la unidad de control de resonancia. El operador controlaba el sistema usando un teclado manual, una pulsera y un pedal.

Durante las demostraciones, el aparato hablaba diferentes idiomas, cantaba y respondía preguntas con diferentes entonaciones. Pero para liberar el potencial del sistema, su operador necesitaba años de entrenamiento.


Poco después del estreno de VODER, comenzó la Segunda Guerra Mundial y Bell Labs tuvo que reducir el desarrollo del sintetizador. Sin embargo, el conocimiento adquirido durante el trabajo en el proyecto, Homer Dudley solía crear tecnología de cifrado para conversaciones telefónicas.

Sintetizadores de voz en espectrogramas


En 1946, se inventó un espectrógrafo acústico. Y surgió la idea: utilizar espectrogramas para controlar los sintetizadores de voz. Uno de los primeros en introducir dicho dispositivo fue L. Schott, un ingeniero estadounidense de Bell Labs. Utilizó una fuente de luz lineal, patrones espectrográficos translúcidos con diferentes grados de transparencia. Las fotocélulas especiales montadas frente a la lámpara registraron cambios en el nivel de iluminación y las señales de control generadas para los filtros de paso de banda. Homer Dudley usó exactamente los mismos filtros para su VODER.

Foto 120years.net
otro desarrollo en esta área ha presentado un grupo de científicos estadounidenses liderados por el físico Franklin Cooper ( Franklin a Cooper Cooper ). Su sistema óptico esReproducción de patrones : moduló los armónicos del tono fundamental de 120 Hz, leyendo imágenes en una cinta transparente en movimiento. La información visual se transmitió al oscilador, convirtiéndola en sonido.

En cierto sentido, el sistema se parecía a los sintetizadores ópticos soviéticos , Nivoton y Variofon, en los que escribían música para dibujos animados. Sin embargo, la reproducción de patrones fue inicialmente "encarcelada" por la generación del habla humana y fue capaz de reproducir oraciones completas.


Dispositivos como Pattern Playback y VODER han sentado las bases teóricas para diseñar sintetizadores formantes y articuladores. Se convirtieron en el prototipo de la síntesis informática moderna. Hablaremos de ellos la próxima vez.



« Hi-Fi»:

:
:
: « »
« »:
:



All Articles