Bagaimana sintesis bicara muncul di PC

Terakhir kali kami berbicara tentang synthesizer ucapan digital dan mengingat bagaimana, pada tahun 1974, Donald Sherman, menderita kelumpuhan wajah, pertama kali menggunakan komputer Text-to-Speech untuk memesan pizza melalui telepon. Kemudian synthesizer bekerja pada mainframe yang dipasang di laboratorium Michigan State University. Tetapi dengan perkembangan teknologi dan kemajuan komputer pribadi, solusi TTS menjadi lebih mobile.

Mari kita bicara tentang beberapa perkembangan awal waktu itu.


Foto Springsgrace / CC BY-SA

DECtalk Synthesizer


Pada tahun 1981, Profesor Dennis Klatt dari MIT menghubungi Digital Equipment Corporation untuk membahas prospek algoritme untuk sintesis pidato gabungan . Sistem semacam itu menghubungkan bersama-sama segmen-segmen pidato alami yang direkam sebelumnya. Perwakilan perusahaan melihat potensi dalam karya Clatt dan memutuskan untuk menggunakannya untuk meluncurkan synthesizer suara mereka sendiri di pasar. Pengembangan memakan waktu tiga tahun, di mana proyek berhasil mengubah namanya dua kali - dari KLATTALK menjadi CLATTER dan, akhirnya, menjadi DECtalk .

Rilis berlangsung pada tahun 1984 - casing perangkat sedikit lebih besar dari kucing. Perangkat terhubung ke sistem komputer apa pun dengan port serial asinkron ( port COM ), dan versi selanjutnya - ke bus ISA . Itu juga memiliki konektor untuk menghubungkan ke saluran telepon.

Fitur ini memungkinkan untuk mengotomatiskan pekerjaan dengan panggilan masuk dan keluar. Mesin itu mampu berbicara dalam sembilan suara: empat pria, empat wanita dan satu kekanak-kanakan. Setiap suara yang dapat disetel oleh pengguna secara mandiri - ubah nada dan modifikasi fungsi transfer kepala ( hlm . 61 ). Selain itu, sistem ini memungkinkan Anda untuk menyesuaikan pengucapan kata-kata. Berkat fitur ini, dia bisa diajari menyanyi .


, DECtalk « ». DEC 2018 . «» Raspberry Pi, , , — .

Pada tahun 90-an, DEC memutuskan untuk menjual lisensi teknologi kepada pengembang perangkat audio pihak ketiga. Misalnya, chip DECtalk menjadi bagian dari kartu suara Sound Blaster AWE32 ( kami menulis tentang replika leluhurnya di blog kami ). Bundel ini termasuk perangkat lunak TextAssist khusus.

DECtalk telah menjadi produk yang cukup sukses. Namun, karena sejumlah alasan, Digital Equipment Corporation mengalihkan hak atas merek dagang ini ke Force Computers. Dia, pada gilirannya, menjual Fonix Speech, yang hari ini dikenal sebagai SpeechFX . Itu masih menawarkan synthesizer pidato berbasis DECtalk untuk perangkat tertanam.

SAM - Software Automatic Mouth


Pada tahun 1982, pengembang Mark Barton (Mark Barton) dirilis SA M . Ini adalah salah satu synthesizer pidato perangkat lunak komersial pertama untuk sistem komputasi 8-bit: Atari 8-bit, Commodore 64 dan Apple II.

Dalam kasus pertama, SA M menggunakan chip audio built-in POKEY . Kemampuannya memungkinkan untuk membuat musik dan efek polifonik dalam game. Dan implementasinya masih digunakan di sejumlah emulator, misalnya MAME . Dalam kasus Commodore 64, sirkuit SID built-in dengan DAC 4-bit digunakan, yang secara negatif mempengaruhi kualitas reproduksi bicara.


Foto Federica Galli / Unsplash

Sedangkan untuk versi Apple II, synthesizer bekerja dengan papan ekspansi standar dan konverter digital-ke-analog 8-bit. SAM kemudian muncul di Macintosh pertama. Steve Jobs secara pribadi mendesak agar program tersebut dimasukkan dalam versi Mac OS yang lebih lama. Perusahaan menandatangani perjanjian kemitraan dengan Barton, dan pengembangannya, mengubah namanya menjadi MacInTalk, menjadi bagian dari ekosistem "perusahaan apel."

Kebaruan itu segera dimasukkan dalam presentasi komputer pada tahun 1984. Mesin secara mandiri memperkenalkan dirinya di atas panggung, dimulai dengan kalimat: "Halo. Saya Macintosh. "

Pidato Lengkap Macintosh
«, Macintosh. .

, , , IBM: „ , “.

, . , … ».




Saat ini SAM hampir tidak pernah digunakan di mana pun dan berfungsi sebagai warisan historis - Anda dapat menemukan versi web synthesizer (dan kode pada GitHub ) di jaringan . Meskipun pada tahun 2017, pengembang indie dari Airdorf Games menggunakan alat untuk menyuarakan karakter dalam game horor berbasis komputer Faith .

Tentu saja, ini tidak semua - hanya salah satu synthesizer pidato pertama untuk PC yang dirilis pada pergantian abad ini. Tetapi mereka membuka jalan bagi solusi modern yang terdengar lebih realistis. Kami akan terus berbicara tentang teknologi yang digunakan di dalamnya di artikel selanjutnya.



« Hi-Fi»:

« »:
:
Sporth — live-
:
:



All Articles