Historia de los sintetizadores de voz: la era de la informática

Anteriormente hablamos sobre cómo aparecían los sintetizadores de voz, hablamos sobre las primeras instalaciones mecánicas y eléctricas . Continuamos la discusión con lo que sucedió en la era de los mainframes.


Foto Kate Ter Haar / CC BY

Qué más hay en nuestro blog sobre Habré -> Lectura para el fin de semana: 10 materiales sobre huevos de pascua musicales, pistas ocultas, juegos de ritmo y muestras de audio gratuitas

Sistemas informáticos híbridos


Se cree que el primer sistema informático para la síntesis del habla apareció en Japón. Fue desarrollado por un equipo de especialistas del Laboratorio Electrotécnico (ETL), que el Ministerio de Comunicaciones fundó en el siglo XIX. En 1956, sus empleados introdujeron la computadora transistor ETL Mark III , uno de los primeros sistemas informáticos con memoria incorporada. Fue difícil encontrar un lugar más adecuado para desarrollar un sintetizador de voz en el país.

Los ingenieros comenzaron su trabajo en 1963.con la construcción de un modelo de polímero del tracto vocal humano. Durante dos años, los expertos estudiaron los procesos físicos que ocurren en él: prestaron especial atención al papel de la nariz en la coloración del habla. Después de recopilar los datos necesarios, recurrieron a colegas de Hitachi, quienes ayudaron a diseñar una computadora analógica basada en la lógica de escalera . Incluía 71 amplificadores operacionales y 22 multiplicadores, que eran redes de resistencia con fotoconductores y lámparas de neón. El sistema se conectó al IBM 7090 con el software de control Fortran.

. 1967 . — , . — .


El jefe del departamento de acústica del laboratorio ETL, Eiichi Matsui, tomó las ideas de sus colegas a fines de los años 60 y diseñó un sintetizador de voz totalmente digital para la computadora IBM S / 360. Para modelar las características del tracto vocal, utilizó la transformación de Fourier. Cada segundo de voz sintetizada requiere 20 segundos de preprocesamiento. Pero a pesar de esta deficiencia, el proyecto atrajo la atención de la comunidad científica internacional.

La investigación en esta área fue iniciada por expertos de la Universidad de Nagoya, también ubicada en Japón. Uno de los científicos de la universidad propuso un nuevo método de síntesis del habla: la predicción lineal . Tiene en cuenta varios parámetros que varían en el tiempo: el período del tono fundamental, el volumen promedio y los coeficientes asociados conLa función de transferencia del tracto vocal.

Dichos sintetizadores calcularon los parámetros necesarios a partir del habla digitalizada, los grabaron en la memoria y luego reprodujeron ondas de sonido utilizando el DAC. El sistema no requería una gran potencia informática, por lo que el método de predicción lineal encontró rápidamente aplicación en muchos sistemas de reconocimiento de voz.

. Votrax « » . 1974 (Donald Sherman), ( ), .

— , «». , . . , , .


En 1976, Raymond Kurzweil, un inventor estadounidense, presentó su " máquina de lectura " al mundo . Una caja del tamaño de una impresora de oficina al aire libre escaneaba documentos, los reconocía y los leía en voz alta. En el mismo año , se lanzó una calculadora "parlante", LPC Speech + . Fue construido sobre la base del primer microcircuito comercial con un sintetizador de voz integrado.

Dos años después, Texas Instruments lanzó Speak & Spell , un juguete educativo para niños con un sintetizador de voz incorporado. En la memoria del dispositivo se pusieron 200 palabras, que los niños a menudo pronuncian incorrectamente. El niño escribió una palabra en el teclado y el juguete reprodujosu. El producto se convirtió en un éxito absoluto, incluso fue utilizado por músicos en sus proyectos. La voz de Speak & Spell se puede escuchar en el álbum Computer World de Kraftwerk.

Speak & Spell, aunque en forma actualizada, está en los estantes hoy. En cierto modo, el dispositivo fue el primer dispositivo digital inteligente. Incluso se le llama el "antepasado" de las computadoras personales. Pero hablaremos sobre cómo se desarrollaron los sistemas de síntesis de voz en una PC la próxima vez.



« Hi-Fi»:

:
:
« »:
Sporth — live-




All Articles