Cómo apareció la síntesis de voz en la PC

La última vez hablamos sobre sintetizadores digitales de voz y recordamos cómo, en 1974, Donald Sherman, que sufría de parálisis facial, usó por primera vez una computadora de texto a voz para pedir pizza por teléfono. Luego, el sintetizador trabajó en el mainframe instalado en el laboratorio de la Universidad Estatal de Michigan. Pero con el desarrollo de la tecnología y el advenimiento de las computadoras personales, las soluciones TTS se han vuelto más móviles.

Hablemos sobre algunos de los primeros desarrollos de esa época.


Foto Springsgrace / CC BY-SA

Sintetizador DECtalk


En 1981, el profesor Dennis Klatt, del MIT, contactó a Digital Equipment Corporation para discutir las perspectivas de su algoritmo para la síntesis de voz concatenativa . Tal sistema vincula segmentos pregrabados de habla natural. Los representantes de la compañía vieron el potencial en el trabajo de Clatt y decidieron usarlos para lanzar su propio sintetizador de voz en el mercado. El desarrollo tomó tres años, durante los cuales el proyecto logró cambiar su nombre dos veces: de KLATTALK a CLATTER y, finalmente, a DECtalk .

El lanzamiento tuvo lugar en 1984: la carcasa del dispositivo era ligeramente más grande que el gato. El dispositivo se conectó a cualquier sistema informático con un puerto serie asíncrono ( puerto COM ) y sus versiones posteriores, al bus ISA . También tenía conectores para conectarse a una línea telefónica.

Esta característica hizo posible automatizar el trabajo con llamadas entrantes y salientes. La máquina podía hablar en nueve voces: cuatro masculinas, cuatro femeninas y una infantil. Cada uno de los votos que un usuario puede ajustar usted mismo: cambie el tono y modifique la función de transferencia de una cabeza ( página 61 ). Además, el sistema le permite ajustar la pronunciación de las palabras. Gracias a esta característica, se le pudo enseñar a cantar .


, DECtalk « ». DEC 2018 . «» Raspberry Pi, , , — .

En los años 90, DEC decidió vender la licencia de tecnología a desarrolladores de dispositivos de audio de terceros. Por ejemplo, el chip DECtalk se convirtió en parte de la tarjeta de sonido Sound Blaster AWE32 ( escribimos sobre la réplica de su antepasado en nuestro blog). El paquete incluye software especializado TextAssist.

DECtalk se ha convertido en un producto bastante exitoso. Sin embargo, por varias razones, Digital Equipment Corporation transfirió los derechos de esta marca comercial a Force Computers. Ella, a su vez, revende su Fonix Speech, que hoy se conoce como SpeechFX . Todavía ofrece sintetizadores de voz basados ​​en DECtalk para dispositivos integrados.

SAM - Software de boca automática


En 1982, el desarrollador de Mark Barton (Barton Marcos) lanzado SA M . Este es uno de los primeros sintetizadores de voz de software comercial para sistemas informáticos de 8 bits: Atari de 8 bits, Commodore 64 y Apple II.

En el primer caso, SA M utilizó el chip de audio incorporado POKEY . Sus capacidades permitieron crear música polifónica y efectos en los juegos. Y su implementación todavía se usa en varios emuladores, por ejemplo MAME . En el caso de Commodore 64, se utilizó un circuito SID incorporado con un DAC de 4 bits, que afectó negativamente la calidad de la reproducción del habla.


Foto Federica Galli / Unsplash

En cuanto a la versión para Apple II, el sintetizador funcionaba con una placa de expansión estándar y un convertidor digital a analógico de 8 bits. SAM apareció más tarde en el primer Macintosh. Steve Jobs insistió personalmente en que el programa se incluyera en la versión anterior de Mac OS. La compañía celebró un acuerdo de asociación con Barton, y su desarrollo, cambiando su nombre a MacInTalk, se convirtió en parte del ecosistema de la "corporación de manzanas".

La novedad se incluyó de inmediato en la presentación de la computadora en 1984. La máquina se presentó independientemente en el escenario, comenzando con la frase: "Hola. Soy Macintosh ".

Discurso completo de Macintosh
«, Macintosh. .

, , , IBM: „ , “.

, . , … ».




Hoy, SAM casi nunca se usa en ningún lado y sirve como un legado histórico: puede encontrar la versión web del sintetizador (y el código en GitHub ) en la red . Aunque en 2017, los desarrolladores independientes de Airdorf Games usaron una herramienta para expresar los personajes en el juego de terror basado en computadora Faith .

Por supuesto, esto no es todo, solo uno de los primeros, sintetizadores de voz para PC, lanzado a principios de siglo. Pero allanaron el camino para soluciones modernas que suenan más realistas. Continuaremos hablando sobre las tecnologías utilizadas en ellos en el próximo artículo.



« Hi-Fi»:

« »:
:
Sporth — live-
:
:



All Articles