Sejarah Sintesis Pidato: Era Komputer

Sebelumnya kami berbicara tentang bagaimana synthesizer ucapan muncul - kami berbicara tentang instalasi mekanik dan listrik pertama . Kami melanjutkan diskusi dengan apa yang terjadi di era mainframe.


Foto Kate Ter Haar / CC BY

Apa lagi yang ada di blog kami di Habré -> Membaca untuk akhir pekan: 10 materi tentang telur paskah musik, trek tersembunyi, permainan ritme dan sampel audio gratis

Sistem komputer hybrid


Diyakini bahwa sistem komputer pertama untuk sintesis ucapan muncul di Jepang. Ini dikembangkan oleh tim spesialis dari Laboratorium Elektroteknik (ETL), yang didirikan oleh Kementerian Komunikasi pada abad ke-19. Pada tahun 1956, karyawannya memperkenalkan komputer transistor ETL Mark III - salah satu sistem komputasi pertama dengan memori terpasang. Sulit untuk menemukan tempat yang lebih cocok untuk mengembangkan synthesizer pidato di negara ini.

Insinyur memulai pekerjaan mereka pada tahun 1963dengan konstruksi model polimer dari saluran vokal manusia. Selama dua tahun, para ahli mempelajari proses fisik yang terjadi di dalamnya - mereka memberi perhatian khusus pada peran hidung dalam pewarnaan ucapan. Setelah mengumpulkan data yang diperlukan, mereka beralih ke kolega dari Hitachi, yang membantu merancang komputer analog berdasarkan logika tangga . Ini termasuk 71 amplifier operasional dan 22 pengganda, yang merupakan jaringan resistor dengan fotokonduktor dan lampu neon. Sistem terhubung ke IBM 7090 dengan perangkat lunak Fortran control.

. 1967 . — , . — .


Kepala departemen akustik laboratorium ETL, Eiichi Matsui, mengambil ide rekan-rekannya di akhir tahun 60-an dan merancang synthesizer ucapan digital sepenuhnya untuk komputer IBM S / 360. Untuk memodelkan karakteristik saluran vokal, ia menggunakan transformasi Fourier. Setiap detik pidato yang disintesis membutuhkan 20 detik pra-pemrosesan. Namun terlepas dari kekurangan ini, proyek ini menarik perhatian komunitas ilmiah internasional.

Penelitian di bidang ini dimulai oleh para ahli dari Universitas Nagoya, yang juga berlokasi di Jepang. Salah satu ilmuwan universitas mengusulkan metode baru sintesis suara - prediksi linear . Ini memperhitungkan beberapa parameter yang bervariasi waktu: periode nada dasar, volume rata-rata dan koefisien yang terkait denganfungsi transfer saluran vokal.

Synthesizer tersebut menghitung parameter yang diperlukan dari ucapan digital, merekamnya dalam memori, dan kemudian mereproduksi gelombang suara menggunakan DAC. Sistem tidak memerlukan daya komputasi yang besar, sehingga metode prediksi linear dengan cepat menemukan aplikasi di banyak sistem pengenalan suara.

. Votrax « » . 1974 (Donald Sherman), ( ), .

— , «». , . . , , .


Pada 1976, Raymond Kurzweil, seorang penemu Amerika, memperkenalkan " mesin baca " -nya kepada dunia . Sebuah kotak seukuran printer kantor luar ruangan memindai dokumen, mengenalinya, dan membacanya dengan lantang. Pada tahun yang sama, kalkulator "berbicara", LPC Speech +, dirilis . Itu dibangun berdasarkan microcircuit komersial pertama dengan synthesizer suara terintegrasi.

Dua tahun kemudian, Texas Instruments merilis Speak & Spell , mainan pendidikan anak-anak dengan synthesizer ucapan bawaan. Dalam memori perangkat, 200 kata dimasukkan, yang sering diucapkan oleh anak-anak dengan salah. Anak itu mengetik kata di keyboard, dan mainan itu direproduksinya. Produk ini menjadi hit mutlak - bahkan digunakan oleh musisi dalam proyek mereka. Suara Speak & Spell dapat didengar di album Kraftwerk Computer World.

Speak & Eja, meskipun dalam bentuk yang diperbarui, ada di rak hari ini. Di satu sisi, gadget adalah perangkat digital pintar pertama. Dia bahkan disebut sebagai "nenek moyang" komputer pribadi. Tetapi kita akan berbicara tentang bagaimana sistem sintesis wicara dikembangkan pada PC lain kali.



« Hi-Fi»:

:
:
« »:
Sporth — live-




All Articles