语音合成的历史:电气解决方案的时代

上次,我们讨论了用于语音合成的机械设备-Kempelen的声道和Joseph Faber的“会说话的头”。接下来是20世纪的电子合成器。


相片Rock'n Roll Monkey / Unsplash

最初的电气装置


1850年,德国物理学家和物理学家赫尔曼·冯·亥姆霍兹介绍了他的谐振器理论他注意到元音具有不同的共振频率(共振峰)。这些共振峰是在声波从声带通过到嘴唇的过程中形成的。某些声音从说话者的嘴唇反射而出,并到达接收者,有些则返回到信号源。科学家建议人的声道可以表示为一系列共振器。

二十世纪初,人们开始尝试基于电气组件来实现这种模型。这种类型的第一台合成器是物理学家约翰·斯图尔特(John Stewart)开发的。他的方案(出版在《自然》杂志上发表的文章中,包括了一个用于对束进行建模的电动蜂鸣器和一对电感电容谐振器。他们模拟了声音在喉咙中发生的物理过程。

John Stuart设计的合成器电路

Stuart设备可以发出由两个共振峰组成的声音。这些是一些简单的元音,以及diphthongs但是,他的可能性就此终结了。

第一个能够再现语音的电子合成器出现在1930年代。它由贝尔实验室的荷马·杜德利(Homer Dudley)开发。当时,该公司正在研究声码器-用于压缩语音并节省电话网络中无线电线路的频率资源的工具。这个想法是传递关键参数而不是呼叫者的声音。在接收侧安装了特殊的解码器,该解码器使用这些参数来重建和再现声音。 Dudley意识到,只需稍作修改,声码器就可以转变为成熟的合成器。因此,有了一个VODER系统-语音操作演示器。

该设备于1939年在纽约世界博览会上向公众展示。包括 VODER设计两种声音来源:用于“聋”音素的电子管噪声发生器和用于“浊音”的振荡器。还有十个并联的带通滤波器-它们组成了谐振控制单元。操作员使用手键盘,腕带和脚踏板控制系统。

在演示期间,该仪器说不同的语言,唱歌并以不同的语调回答问题。但是要释放系统的潜力,其操作员需要多年的培训。


在VODER首映后不久,第二次世界大战开始了,贝尔实验室不得不削减合成器的进一步开发。但是,在项目工作中获得的知识,荷马·杜德利(Homer Dudley)过去曾为电话交谈创建加密技术。

频谱图上的语音合成器


1946年,发明了一种声谱仪。想法浮出水面-使用频谱图来控制语音合成器。贝尔实验室的美国工程师L. Schott是最早引入这种设备的人之一。他使用线性光源,具有不同透明度的半透明光谱图。安装在灯对面的特殊光电管记录了照明水平的变化并为带通滤波器生成了控制信号。荷马·杜德利(Homer Dudley)为VODER使用了完全相同的过滤器。

图片120years.net
在这一领域的其他发展已经提出了一组由物理学家富兰克林·库珀(Franklin Cooper领导的美国科学家(富兰克林到库珀·库珀)。他们的光学系统是图案播放 -调制120 Hz基本音的谐波,在移动的透明磁带上读取图像。视觉信息被传送到振荡器,然后变成声音。

从某种意义上说,该系统类似于苏联的光学合成器 -Nivoton和Variofon-他们在其上创作了卡通音乐。但是,模式回放最初是为了生成人类语音而被“监禁”的,并且能够重现整个句子。


诸如Pattern Playback和VODER之类的设备为设计共振峰和铰接合成器奠定了理论基础。它们成为现代计算机综合的原型。下次我们将讨论它们。



« Hi-Fi»:

:
:
: « »
« »:
:



All Articles