Bagaimana saya mendapatkan $ 1.000.000 tanpa pengalaman dan koneksi, dan kemudian menghabiskannya untuk membuat penerjemah saya

Bagaimana semua ini dimulai


Kisah ini dimulai 15 tahun yang lalu. Saat bekerja sebagai programmer di ibukota, saya mengumpulkan uang dan berhenti dari pekerjaan saya untuk membuat proyek saya sendiri nanti. Untuk menghemat uang, ia pulang ke rumah, ke kota kecil, tempat ia bekerja di situs web untuk siswa, program untuk perdagangan, permainan untuk ponsel. Tetapi karena kurangnya pengalaman bisnis, ini tidak menghasilkan pendapatan, dan segera proyek ditutup. Saya harus pergi ke ibukota lagi dan mendapatkan pekerjaan. Kisah ini berulang beberapa kali.

Ketika uang saya habis lagi, krisis datang. Saya tidak dapat menemukan pekerjaan, situasinya menjadi kritis. Waktunya telah tiba untuk melihat semua hal dengan tampilan yang sadar. Saya harus jujur ​​mengakui pada diri sendiri bahwa saya tidak tahu ceruk mana yang harus dipilih untuk bisnis. Membuat proyek yang Anda sukai adalah cara ke mana-mana.

Satu-satunya hal yang bisa saya lakukan adalah aplikasi iOS. Beberapa tahun bekerja di perusahaan IT memungkinkan saya untuk mendapatkan beberapa pengalaman, dan diputuskan untuk membuat banyak aplikasi sederhana yang berbeda secara mendasar (permainan, musik, menggambar, gaya hidup sehat, pembelajaran bahasa) dan menguji di mana ceruk akan ada sedikit kompetisi. Satu set kelas dan perpustakaan disiapkan yang memungkinkan untuk dengan cepat membuat aplikasi sederhana pada berbagai topik (game 2d, pelacak gps, utilitas sederhana, dll.). Kebanyakan dari mereka memiliki beberapa gambar, 2 tombol dan hanya satu fungsi. Tetapi itu sudah cukup untuk menguji ide itu dan betapa mudahnya menghasilkan uang darinya. Misalnya, aplikasi berlari melacak kecepatan seseorang, jarak yang ditempuh, dan menghitung kalori. Saya menghabiskan satu setengah tahun menciptakan ratusan aplikasi sederhana.Kecepatan ini dimungkinkan berkat pembelian grafis pada saham, serta penggunaan kembali kode sumber.



Awalnya aplikasi itu gratis. Lalu saya menambahkan iklan dan pembelian dalam aplikasi, mengambil kata kunci dan ikon cerah. Aplikasi mulai diunduh.

Ketika penghasilan mencapai $ 30 ribu / bulan, saya memutuskan untuk memberi tahu seorang teman yang bekerja di sebuah perusahaan makanan besar bahwa saya dapat mencapai angka seperti itu pada aplikasi pengujian, dan menyarankan untuk membuatnya bersama. Dia menjawab bahwa mereka hanya memiliki 1 aplikasi - sebuah game dengan penghasilan $ 60 ribu dan 25 ribu pengguna per bulan, terhadap pendapatan $ 30 ribu dan 200 ribu pengguna dari saya. Itu benar-benar mengubah pandangan saya. Ternyata lebih baik membuat satu aplikasi berkualitas tinggi daripada seratus berkualitas rendah

Saya mengerti bahwa Anda dapat menghasilkan puluhan kali lebih banyak dengan yang berkualitas tinggi, tetapi saya sendirian di kota kecil tanpa pengalaman dan tim perancang dan pemasar. Saya perlu membayar untuk menyewa apartemen dan mencari nafkah. Aplikasi pengujian diperlukan hanya untuk menguji ceruk pasar dan strategi periklanan untuk mempelajari aplikasi mana dan cara membuatnya. Kebetulan beberapa dari mereka mulai mendatangkan penghasilan bagus. Sekarang topik aplikasi sederhana telah lama mati, dan tidak ada lagi banyak uang yang dihasilkan.

Beberapa aplikasi sangat berbeda dalam laba - ini adalah penerjemah, aplikasi untuk transportasi kargo, program musik (yang mensimulasikan bermain piano, drum atau, misalnya, akord gitar, pemain), serta permainan logika sederhana.

Saat menguji berbagai jenis game, saya menyadari bahwa game dengan panjang sesi panjang dan keterlibatan pengguna (seperti "2048") dapat mendatangkan banyak uang dalam interval waktu yang lama. Tetapi pada awalnya itu tidak jelas. Karena itu, saya membuat test up seperti pelacak GPS untuk pemain ski dan dalam kata kunci cantumkan nama resor ski populer seperti Courchevel. Dan kemudian dia senang bahwa klik pada iklan menghasilkan $ 2. Tetapi itu adalah strategi jangka pendek dan tidak dapat diskalakan.

Kemudian saya perhatikan bahwa hanya dalam sebulan, penerjemah mengunduh lebih dari 1 juta kali. Dan ini terlepas dari kenyataan bahwa mereka berada di posisi ke-100 dalam peringkat kategori.

Aplikasi musik membawa banyak lompatan, tetapi mengingat keterlibatan pengguna, mereka kurang menjanjikan. Pengguna untuk mereka perlu tertarik dengan kata kunci frekuensi tinggi, dan tidak banyak dari mereka di ceruk ini: mereka yang mencari aplikasi untuk gitar masukkan "gitar", "gitar bass", "akord", dll dalam pencarian. Sulit untuk menemukan banyak sinonim untuk topik seperti itu. Dengan demikian, pengguna fokus pada permintaan frekuensi tinggi, dan cepat atau lambat keterlibatan mereka akan mahal. Penerjemah berbeda.

Ada ratusan bahasa di dunia, dan orang-orang memasukkan kueri tidak hanya dengan kata umum "penerjemah", tetapi beberapa kata sebagai solusi untuk masalah mereka: "menerjemahkan ke dalam bahasa Prancis", "penerjemah dari bahasa Cina". Jika ada banyak permintaan, Anda dapat menarik pengguna hanya dengan kata kunci frekuensi tengah (ASO). Niche itu ternyata menjanjikan, terutama karena saya menyukai topik terjemahan.

Belakangan, sekitar 40 penerjemah sederhana dibuat menggunakan terjemahan yang disediakan oleh Google API. Harganya $ 20 per 1 juta karakter yang diterjemahkan. Secara bertahap, versi aplikasi yang lebih baik muncul, di mana saya menambahkan iklan, pembelian dalam aplikasi, dan terjemahan suara.

Setelah mendapat uang, saya pindah ke Minsk dan membeli rumah. Pada waktu itu, saya memiliki 50–70 aplikasi terjemahan dan 5 juta unduhan. Tetapi dengan pertumbuhan pengguna, biaya Google Translate API berbayar meningkat. Profitabilitas bisnis telah menurun secara serius. Pengguna yang membayar menerjemahkan blok-blok dari 1.000 karakter sekaligus, yang memaksa diberlakukannya batasan permintaan. Ketika mereka bersandar pada batas terjemahan, mereka menulis ulasan buruk dan mengembalikan uang. Waktunya telah tiba ketika 70% dari hasil disumbangkan untuk pengeluaran. Dengan volume terjemahan yang besar, bisnis ini tidak terlalu menjanjikan. Untuk mengganti biaya, perlu menambahkan banyak iklan ke aplikasi, dan ini selalu membuat pengguna takut. Itu diperlukan untuk membuat API sendiri untuk terjemahan, dan ini kemungkinan besar tidak akan murah.

Saya mencoba bertanya kepada startup dan komunitas TI untuk saran dan investasi, tetapi saya tidak menemukan dukungan. Kebanyakan orang tidak mengerti mengapa bekerja di pasar di mana sudah ada pemimpin - penerjemah Google.

Selain Google, ada beberapa perusahaan yang menyediakan API untuk terjemahan. Saya siap membayar $ 30 ribu untuk lisensi teknologi terjemahan mereka dalam 40 bahasa. Ini akan memungkinkan saya untuk menerjemahkan jumlah waktu yang tidak terbatas dengan harga tetap dan melayani sejumlah pengguna di server saya. Tetapi sebagai tanggapan mereka memanggil saya jumlahnya beberapa kali lebih tinggi. Itu terlalu mahal. Diputuskan untuk mencoba membuat teknologi mereka sendiri untuk terjemahan. Saya mencoba menarik teman-teman untuk pengembangan, tetapi pada saat itu kebanyakan dari mereka sudah memiliki keluarga, anak kecil, dan pinjaman. Semua orang menginginkan stabilitas dan kehidupan dengan senang hati untuk gaji yang baik, dan tidak pergi ke startup. Mereka juga tidak mengerti mengapa membuat penerjemah jika ada Google dengan aplikasi dan API terjemahan yang keren dan canggih. Saya tidak punya pengalaman berbicara di depan umum,karisma dan aplikasi prototipe keren untuk menarik minat orang. Analitik penghasilan sebesar $ 300 ribu untuk aplikasi terjemahan uji tidak mengejutkan siapa pun.

Saya menoleh ke seorang teman yang memiliki perusahaan outsourcing di Minsk. Pada akhir 2016, dia mengalokasikan sebuah tim untuk saya. Saya berharap bahwa saya akan menyelesaikan masalah dalam enam bulan berdasarkan proyek sumber terbuka, agar tidak bergantung pada API di Google.

Dalam perjalanan ke penerjemah saya


Pekerjaan telah dimulai. Pada 2016, kami menemukan beberapa proyek sumber terbuka - Apertium, Joshua dan Moses. Itu adalah terjemahan mesin statistik, cocok untuk teks sederhana. Proyek-proyek ini didukung oleh 3 hingga 40 orang, dan butuh waktu lama untuk mendapatkan jawaban atas pertanyaan tentang mereka. Setelah kami menemukan jawabannya dan masih menjalankannya untuk pengujian, menjadi jelas bahwa kami membutuhkan server yang kuat dan set data berkualitas tinggi, yang mahal. Bahkan setelah kami menghabiskan uang untuk perangkat keras dan set data berkualitas untuk salah satu pasangan terjemahan, kualitasnya masih banyak yang diinginkan.

Secara teknis, itu tidak mengarah ke skema "unduh dataset dan kereta". Ternyata ada sejuta nuansa yang bahkan tidak kami sadari. Kami mencoba beberapa sumber daya lagi, tetapi tidak mencapai hasil yang baik. Tetapi Google dan Microsoft tidak mengungkapkan pencapaian mereka. Meskipun demikian, pekerjaan terus berlanjut, pekerja lepas terhubung secara berkala.

Pada bulan Maret 2017, kami menemukan sebuah proyek bernama Open NMT. Ini adalah pengembangan bersama Systran, salah satu pemimpin di pasar terjemahan mesin, dan Universitas Harvard. Proyek ini baru saja diluncurkan dan menawarkan terjemahan berdasarkan teknologi baru - jaringan saraf.

Teknologi terjemahan mesin modern milik perusahaan besar, ditutup. Pemain kecil, menyadari betapa sulitnya menyusup ke dunia ini, jangan melakukan upaya seperti itu. Ini menghambat pengembangan pasar. Kualitas terjemahan di antara para pemimpin tidak banyak berbeda satu sama lain untuk waktu yang lama. Jelas, perusahaan besar juga menghadapi kekurangan peminat, makalah ilmiah, startup dan proyek open source untuk mengambil ide-ide baru dan merekrut orang.

Oleh karena itu, Systran membuat manuver baru yang fundamental: meletakkan dasar dalam opensource, sehingga penggemar seperti saya bisa terlibat dalam pekerjaan ini. Mereka menciptakan sebuah forum di mana para ahli mereka mulai membantu pendatang baru secara gratis. Dan itu membawa hasil yang baik: pemula, karya ilmiah tentang terjemahan mulai muncul, karena semua orang dapat mengambil dasar dan melakukan percobaan berdasarkan itu. Systran memimpin komunitas ini. Kemudian perusahaan lain bergabung.

Pada saat itu masih belum ada terjemahan saraf di mana-mana, dan Open NMT menawarkan dasar di bidang ini, mengungguli terjemahan mesin statistik dalam kualitas. Saya dan orang-orang lain di seluruh dunia dapat mengambil teknologi ini dan meminta nasihat para ahli. Mereka dengan rela membagikan pengalaman mereka, dan ini memungkinkan saya untuk memahami ke arah mana saya harus bergerak.

Kami menggunakan OpenNMT sebagai basis. Ini terjadi pada awal 2017, ketika masih "mentah" dan tidak mengandung apa pun selain fungsi dasar. Semua ini ada di Lua (Torch), murni untuk penelitian akademis. Banyak bug ditemukan, semuanya bekerja lambat, tidak stabil dan jatuh di bawah beban ringan. Itu sama sekali tidak cocok untuk produksi. Kemudian dalam obrolan umum kami semua menguji bersama, menangkap kesalahan, berbagi ide, secara bertahap meningkatkan stabilitas (saat itu kami sekitar 100 orang). Awalnya saya bertanya-tanya: bagaimana bisa, mengapa Systran menumbuhkan para pesaingnya? Tetapi seiring berjalannya waktu, saya memahami aturan permainan, ketika semakin banyak perusahaan mulai meletakkan dasar mereka untuk memproses bahasa alami dalam opensource.

Bahkan jika setiap orang memiliki kekuatan komputasi untuk menangani kumpulan data yang besar, pertanyaan untuk menemukan spesialis di NLP (pemrosesan bahasa alami) sangat akut di pasar. Pada 2017, topik ini jauh kurang berkembang daripada pemrosesan gambar dan video. Lebih sedikit dataset, karya ilmiah, spesialis, kerangka kerja dan banyak lagi. Bahkan ada lebih sedikit orang yang mampu membangun bisnis dan menutup ceruk lokal dari makalah penelitian NLP. Baik perusahaan papan atas seperti Google dan pemain Systran yang lebih kecil perlu mendapatkan keunggulan kompetitif dibandingkan pemain dalam kategori mereka.

Bagaimana mereka mengatasi masalah ini?

Pada pandangan pertama, ini tampak aneh, tetapi untuk bersaing di antara mereka sendiri, mereka memutuskan untuk memperkenalkan pemain baru (pesaing) ke pasar, dan agar mereka muncul di sana, Anda harus mengayunkannya. Ambang entri masih tinggi, dan permintaan akan teknologi pemrosesan ucapan tumbuh sangat banyak (asisten suara, bot obrolan, terjemahan, pengenalan dan analisis ucapan, dll.) Jumlah startup yang diperlukan yang dapat Anda beli untuk memperkuat posisi Anda masih belum.

Dalam domain publik diterbitkan karya ilmiah dari tim Google, Facebook, Alibaba. Dari mereka, kerangka kerja dan set data mereka ditata dalam opensource. Forum dibuat dengan jawaban atas pertanyaan.

Perusahaan-perusahaan besar tertarik dengan startup seperti yang kami kembangkan, menangkap ceruk baru dan menunjukkan pertumbuhan maksimum. Mereka senang membeli startup NLP untuk memperkuat perusahaan besar mereka.

Memang, bahkan jika Anda memiliki semua set data dan algoritma di tangan Anda dan mereka memberi tahu Anda, ini tidak berarti bahwa Anda akan membuat penerjemah berkualitas tinggi atau startup lain di bidang NLP. Dan bahkan jika Anda melakukannya, maka itu jauh dari kenyataan bahwa Anda menggigit sebagian besar pasar. Karena itu, Anda perlu bantuan, dan jika seseorang berhasil, beli atau gabungkan.

Pada bulan Maret 2018, Systran mengundang seluruh komunitas ke Paris untuk bertukar pengalaman, dan juga menyelenggarakan kelas master gratis tentang masalah utama yang dihadapi startup dalam penerjemahan. Semua orang tertarik untuk melihat satu sama lain secara langsung.

Setiap orang punya berbagai proyek. Seseorang menciptakan bot untuk belajar bahasa Inggris, yang dengannya Anda dapat berbicara seperti orang lain. Yang lain menggunakan openNMT untuk merangkum teks. Sebagian besar startup mewakili plug-in untuk SDL Trados Studio, yang disesuaikan dengan topik tertentu (kedokteran, konstruksi, metalurgi, dll.) Atau bahasa untuk membantu penerjemah menghemat waktu dalam mengedit teks yang diterjemahkan.

Selain penggemar, orang-orang dari Ebay dan Booking tiba di Paris, yang membuat penerjemah pada platform yang sama dengan kami, tetapi dioptimalkan untuk menerjemahkan deskripsi lelang dan hotel.

Juga pada Mei 2017, Facebook memposting landasannya untuk terjemahan mesin Fairseq ke sumber terbuka bersama dengan model-model terlatih untuk pengujian. Tetapi kami memutuskan untuk tetap menggunakan OpenNMT, menyaksikan bagaimana komunitas tumbuh.

Sejarah DeepL


Pada September 2017, menganalisis pesaing, saya mengetahui tentang DeepL. Mereka baru mulai pada waktu itu dan menyediakan terjemahan hanya dalam 7 bahasa. DeepL diposisikan sebagai alat untuk penerjemah profesional, membantu menghabiskan lebih sedikit waktu untuk mengoreksi setelah terjemahan mesin. Bahkan perubahan kecil dalam kualitas terjemahan menghemat banyak uang untuk perusahaan terjemahan. Mereka terus memantau API untuk terjemahan mesin dari pemasok yang berbeda, karena kualitas dalam banyak pasangan bahasa berbeda untuk semua orang dan tidak ada satu pun pemimpin. Meskipun jumlah bahasa - yang paling penting di Google.

Untuk menunjukkan kualitas terjemahan, DeepL memutuskan untuk menjalankan tes dalam beberapa bahasa.

techcrunch.com/2017/08/29/deepl-schools-other-online-translators-with-clever-machine-learning

Penilaian kualitas dilakukan dengan pengujian buta, ketika penerjemah profesional memilih terjemahan terbaik dari Google, Microsoft, DeepL, Facebook. Menurut hasil, DeepL menang, juri menilai terjemahannya sebagai yang paling "sastra".

Bagaimana hal itu terjadi?

Pendiri DeepL sendiri startup Linguee - basis data tautan terbesar ke teks yang diterjemahkan. Kemungkinan besar, mereka memiliki sejumlah besar kumpulan data yang dikumpulkan oleh parser, dan untuk melatihnya, Anda memerlukan lebih banyak daya komputasi.

Pada tahun 2017, mereka menerbitkan sebuah artikel yang menyatakan bahwa mereka telah mengumpulkan superkomputer 5-petFlops di Islandia (pada saat itu merupakan yang ke 23 dalam hal kinerja di dunia). Melatih model berkualitas besar hanya masalah waktu saja. Pada saat itu, bahkan jika kita membeli set data berkualitas tinggi, kita masih tidak akan pernah bisa bersaing dengan mereka tanpa komputer super semacam itu.

www

. Nvidia meluncurkan komputer DGX-2 seukuran nakas dan kinerja 2 petFlops (FP16), yang sekarang dapat disewa mulai dari $ 5.000 / bulan.

www.nvidia.com/en-us/data-center/dgx-2

Memiliki komputer seperti itu, Anda dapat melatih model Anda dengan kumpulan data raksasa dengan cepat, dan juga menyimpan banyak muatan pada API. Ini secara dramatis mengubah keseimbangan kekuatan dari seluruh pasar startup pembelajaran mesin dan memungkinkan perusahaan kecil untuk bersaing dengan raksasa di bidang bekerja dengan data besar. Itu adalah penawaran terbaik di pasar dalam rasio harga-kinerja.

Saya mulai mencari informasi tentang statistik DeepL. Untuk 2018, Google memiliki 500 juta pengguna setiap bulan. DeepL memiliki 50 juta (artikel bertanggal 12 Desember 2018).

slator.com/ma-and-funding/benchmark-capital-takes-13-6-stake-in-deepl-as-usage-explodes

Ternyata pada akhir 2018, 10% dari pemirsa Google bulanan menggunakan DeepL, dan mereka tidak diiklankan di mana pun. Hanya dalam waktu satu tahun, mereka merebut 10% pasar menggunakan kata-kata.

Sudah saya pikirkan. Jika DeepL mengalahkan Google dengan tim yang terdiri dari 20 orang, memiliki mobil di 5 petaFlops pada tahun 2017, dan sekarang Anda dapat dengan murah menyewa mobil dalam 2 petaFlops dan membeli kumpulan data berkualitas tinggi, seberapa sulitkah untuk mencapai kualitas Google?

Panel kontrol Lingvanex


Agar dapat dengan cepat menangani tugas terjemahan dan tidak menjalankan tes dari konsol, Dashboard dibuat yang memungkinkan Anda melakukan semua tugas, mulai dari menyiapkan dan memfilter data hingga menyebarkan tes terjemahan ke Production. Pada gambar di bawah ini: di sebelah kanan adalah daftar tugas dan server GPU di mana model sedang dilatih. Di tengah adalah parameter dari jaringan saraf, dan di bawah ini adalah kumpulan data yang akan digunakan untuk pelatihan.



Pengerjaan bahasa baru dimulai dengan persiapan dataset. Kami mengambilnya dari sumber terbuka seperti Wikipedia, pertemuan Parlemen Eropa, Paracrawl, Tatoeba, dan lainnya. Untuk mendapatkan kualitas terjemahan rata-rata, 5 juta baris terjemahan sudah cukup.



Kumpulan data adalah baris teks yang diterjemahkan dari satu bahasa ke bahasa lain. Kemudian tokenizer membagi teks menjadi token dan membuat kamus dari mereka, diurutkan berdasarkan frekuensi pertemuan token. Token dapat berupa karakter tunggal, suku kata, atau seluruh kata.



Setelah dataset dimasukkan ke dalam basis data, mereka ternyata banyak kata-kata dengan kesalahan atau dengan terjemahan yang buruk. Untuk mencapai kualitas yang baik, mereka harus disaring dengan kuat. Anda juga dapat membeli dataset yang sudah disaring berkualitas tinggi.



Saat bahasa digunakan untuk API, Anda perlu mengatur daftar fungsi yang tersedia untuknya (pengenalan suara, sintesis ucapan, pengenalan gambar, pengurai file, situs, dll.). Agar fungsi berfungsi, mereka menggunakan opensource bagian API pihak ketiga - pihak ketiga.

Kemudian semuanya disebarkan ke API. Seiring waktu, cache ditambahkan. Ini berfungsi dengan baik pada frasa 1 dan 2 kata dan dapat menghemat hingga 30% permintaan.

Kami terus bekerja


Semua tahun 2018 saya habiskan untuk memecahkan masalah terjemahan berkualitas tinggi dalam bahasa-bahasa Eropa utama. Saya pikir enam bulan lagi - dan semuanya akan beres. Saya sangat terbatas dalam sumber daya, hanya 2 orang yang terlibat dalam tugas-tugas Ilmu Data. Itu perlu untuk bergerak cepat. Tampaknya solusi untuk masalah itu adalah sesuatu yang sederhana. Tetapi momen yang cerah tidak datang, saya tidak puas dengan kualitas terjemahannya. Itu telah menghabiskan sekitar $ 450 ribu yang diperoleh dari para penerjemah tua, dan itu perlu untuk membuat keputusan tentang apa yang harus dilakukan selanjutnya. Meluncurkan proyek ini sendirian dan tanpa investasi, saya menyadari betapa banyak kesalahan manajemen yang saya buat. Tetapi keputusan telah dibuat - pergi ke akhir!

Pada saat ini, saya perhatikan bahwa di komunitas kami mereka mulai berbicara tentang arsitektur baru untuk jaringan saraf - Transformer. Semua orang bergegas untuk melatih jaringan saraf berdasarkan model Transformer ini dan mulai beralih ke Python (Tensorflow) alih-alih Lua (Torch) lama. Saya memutuskan untuk mencobanya juga.

Kami juga mengambil tokenizer baru, melakukan pra-pemrosesan teks, mulai memfilter dan menandai data secara berbeda, jika tidak memproses teks setelah terjemahan untuk memperbaiki kesalahan. Aturan 10 ribu jam bekerja: ada banyak langkah ke tujuan, dan pada titik tertentu saya menyadari bahwa kualitas terjemahan sudah cukup untuk menggunakannya dalam API untuk aplikasi saya sendiri. Setiap perubahan menambahkan 2-4% dari kualitas, yang tidak cukup untuk massa kritis dan di mana orang terus menggunakan produk tanpa meninggalkan persaingan.

Kemudian kami mulai menghubungkan berbagai alat yang memungkinkan kami untuk lebih meningkatkan kualitas terjemahan: penentu entitas bernama, transliterasi, kamus tematik, sistem untuk memperbaiki kesalahan kata-kata. Setelah 5 bulan bekerja, kualitas terjemahan dalam beberapa bahasa menjadi lebih baik dan orang-orang mulai kurang mengeluh. Itu adalah titik balik. Anda sudah dapat menjual program, dan karena Anda memiliki API untuk terjemahan, Anda dapat sangat mengurangi biaya. Anda dapat meningkatkan penjualan atau jumlah pengguna, karena biayanya hanya di server.

Untuk melatih jaringan saraf, diperlukan komputer yang bagus. Tapi kami menyelamatkan. Pertama, kami menyewa 20 komputer biasa (dengan satu GTX 1080) dan secara bersamaan meluncurkan 20 tes sederhana melalui Panel Kontrol Lingvanex. Butuh satu minggu untuk setiap tes, itu adalah waktu yang lama. Untuk mencapai kualitas yang lebih baik, Anda harus menjalankan dengan parameter lain yang membutuhkan lebih banyak sumber daya. Butuh cloud dan lebih banyak kartu video pada satu mesin. Kami memutuskan untuk menyewa layanan cloud Amazon 8 GPU V100 x 4. Ini cepat, tetapi sangat mahal. Kami memulai tes di malam hari, dan di pagi hari - tagihan sebesar $ 1.200. Pada saat itu, ada beberapa opsi penyewaan untuk server GPU yang kuat di sampingnya. Saya harus meninggalkan ide ini dan mencari opsi yang lebih murah. Mungkin mencoba merakit sendiri?

Perusahaan panggilan berakhir dengan fakta bahwa kami sendiri harus mengirim konfigurasi terperinci, dan mereka akan merakitnya. Yang lebih baik dalam hal "kinerja / harga" untuk tugas-tugas kami, tidak ada yang bisa menjawab. Mencoba memesan di Moskow - menemukan beberapa perusahaan yang mencurigakan. Situs itu berkualitas tinggi, bagian penjualan ada di subjek. Tetapi mereka tidak menerima transfer bank, dan satu-satunya pilihan pembayaran adalah membuang uang ke kartu itu ke akuntan mereka. Mereka mulai berkonsultasi dengan tim dan memutuskan bahwa mungkin untuk merakit komputer sendiri dari beberapa GPU yang kuat dan dengan harga hingga 10 ribu dolar, yang akan menyelesaikan masalah kami dan membayar dalam sebulan. Komponen benar-benar menembus nyali: mereka memanggil ke Moskow, memesan sesuatu di Cina, sesuatu di Amsterdam. Sebulan kemudian, semuanya sudah siap.

Pada awal 2019, saya akhirnya merakit komputer ini di rumah dan mulai melakukan banyak tes, tanpa khawatir tentang apa yang harus saya bayar untuk sewa. Dalam bahasa Spanyol, saya mulai memperhatikan bahwa terjemahannya dekat dengan terjemahan Google dari metrik BLEU. Tetapi saya tidak mengerti bahasa ini dan mengatur model penerjemah Inggris-Rusia untuk melatih malam itu untuk memahami di mana saya berada. Komputer mendengung dan menggoreng sepanjang malam, tidak mungkin untuk tidur. Itu perlu untuk memastikan bahwa tidak ada kesalahan di konsol, karena semuanya tergantung secara berkala. Di pagi hari saya menjalankan tes untuk menerjemahkan 100 kalimat dengan panjang dari 1 hingga 100 kata dan melihat bahwa itu ternyata merupakan terjemahan yang baik, termasuk pada kalimat yang panjang. Malam ini telah mengubah segalanya. Saya melihat cahaya di ujung terowongan yang suatu hari Anda masih dapat mencapai kualitas terjemahan yang baik.

Meningkatkan kualitas aplikasi


Setelah mendapatkan uang dari penerjemah iOS dengan satu tombol dan satu fungsi, saya memutuskan untuk meningkatkan kualitasnya, serta membuat versi untuk Android, Mac OS, Windows Desktop. Saya berharap bahwa ketika saya memiliki API saya sendiri, saya akan menyelesaikan pengembangan aplikasi dan memasuki pasar lain. Pada saat saya memecahkan masalah API saya, para pesaing melangkah lebih jauh. Beberapa fungsi diperlukan, untuk itu penerjemah saya yang akan mengunduh.

Hal pertama yang saya putuskan adalah terjemahan suara untuk aplikasi seluler tanpa akses Internet. Ini adalah masalah pribadi. Misalnya, Anda pergi ke Jerman, unduh hanya paket Jerman ke ponsel Anda (400 mb) dan dapatkan terjemahan dari Bahasa Inggris ke Bahasa Jerman dan sebaliknya. Padahal, masalah internet di luar negeri sudah akut. Wifi tidak, atau dilindungi kata sandi atau hanya lambat, akibatnya, tidak mungkin untuk menggunakannya. Meskipun ada ribuan aplikasi penerjemah berkualitas tinggi yang hanya berfungsi melalui Internet menggunakan Google API, bahkan pada tahun 2017.

Karena banyak yang memiliki masalah dengan versi Lua (Torch) dari OpenNMT karena bahasa yang tidak terlalu luas, para pendiri mentransfer logika naskah translate.lua ke versi C ++ (CTranslate), yang digunakan untuk eksperimen terjemahan yang lebih nyaman. Pada versi Lua, dimungkinkan untuk melatih model, pada versi C, untuk menjalankan. Pada Mei 2017, sudah dimungkinkan untuk menggunakannya sebagai basis produksi untuk aplikasi.

Kami mem-porting CTranslate agar berfungsi untuk aplikasi dan menempatkan semuanya dalam opensource.

Berikut ini tautan ke utas ini:

github.com/hunter-packages/onmt

Porting CTranslate ke berbagai platform hanyalah langkah pertama. Itu perlu untuk memahami bagaimana membuat model offline dengan ukuran kecil dan kualitas normal untuk bekerja pada ponsel dan komputer. Versi pertama dari model terjemahan menempati 2GB dalam RAM telepon, yang sama sekali tidak berharga.

Saya menemukan orang-orang di Spanyol dengan pengalaman yang baik dalam proyek terjemahan mesin. Selama sekitar 3 bulan, kami bersama-sama melakukan R&D di bidang pengurangan ukuran model neuron untuk terjemahan, untuk mencapai 150 MB per pasangan dan kemudian berjalan di ponsel.
Ukuran harus dikurangi sedemikian rupa untuk memasukkan sebanyak mungkin pilihan untuk menerjemahkan kata dengan panjang dan topik yang berbeda ke dalam ukuran kamus tertentu (misalnya, 30 ribu kata).

Kemudian, hasil penelitian kami dibuat tersedia untuk umum dan dipresentasikan kepada Asosiasi Terjemahan Mesin Eropa di Alicante (Spanyol) pada Mei 2018, dan salah satu anggota tim membela PhD di sana.

rua.ua.es/dspace/bitstream/10045/76108/1/EAMT2018-Proceedings_33.pdf?fbclid=IwAR1BxipmZMR8Rt0d32gcJ7BaFt1Tf1UEm9LkJCYytBJLgdtx3ujAP

Pada konferensi tersebut, banyak orang ingin membeli suatu produk, tetapi sejauh ini hanya satu pasangan bahasa yang siap (Inggris - Spanyol). Terjemahan offline pada neuron untuk ponsel sudah siap pada bulan Maret 2018, dan dimungkinkan untuk melakukannya dalam semua bahasa lain hingga musim panas. Tetapi di bawah kontrak, saya tidak bisa mendapatkan sumber dan alat yang digunakan untuk melakukan ini, untuk membuat penerjemah offline dalam bahasa lain. Itu perlu untuk hati-hati membaca kontrak. Saja, saya tidak dapat dengan cepat mereproduksi hasil dalam bahasa lain. Saya harus menghentikan fungsi ini. Setahun kemudian, saya kembali kepadanya dan menyelesaikannya.

Selain menerjemahkan teks, suara, dan gambar, diputuskan untuk menambahkan terjemahan panggilan telepon dengan transkripsi yang tidak dimiliki pesaing. Ada perhitungan yang sering disebut orang sebagai dukungan atau masalah bisnis di berbagai negara, apalagi, melalui telepon seluler atau telepon rumah. Orang yang dituju panggilan tidak perlu menginstal aplikasi. Fungsi ini membutuhkan banyak waktu dan biaya, sehingga diputuskan untuk meletakkannya dalam aplikasi terpisah dari yang utama. Ini adalah bagaimana Penerjemah Panggilan Telepon muncul .

Aplikasi terjemahan memiliki satu masalah - mereka tidak digunakan setiap hari. Tidak banyak situasi dalam hidup ketika Anda harus menerjemahkan setiap hari. Tetapi jika Anda mempelajari bahasanya, penggunaan penerjemah menjadi sering. Untuk mempelajari bahasa, kami membuat fungsi kartu, ketika kata-kata ditambahkan ke bookmark di situs melalui ekstensi untuk browser atau dalam subtitle untuk film, dan kemudian pengetahuan dikonsolidasikan menggunakan aplikasi bot obrolan seluler atau aplikasi kolom pintar yang akan memeriksa kata-kata yang dipilih. Semua aplikasi Lingvanex saling terhubung oleh satu akun, sehingga Anda dapat mulai menerjemahkan pada aplikasi seluler dan melanjutkan di komputer Anda.

Juga menambahkan obrolan suara dengan terjemahan. Ini akan bermanfaat bagi kelompok turis, ketika pemandu dapat berbicara dalam bahasa mereka sendiri, dan masing-masing pengunjung akan mendengarkan terjemahan. Dan pada akhirnya - terjemahan file-file besar di ponsel atau komputer.

Proyek Backenster


Selama 7 tahun saya menerima 35 juta unduhan tanpa biaya iklan dan menghasilkan lebih dari $ 1 juta. Hampir setengah dari mereka adalah penerjemah. Ini adalah aplikasi uji untuk mempelajari pemasaran seluler. Karena banyaknya kesalahan, jutaan pengguna datang dan pergi. Setelah mendapatkan pengalaman yang diperlukan, saya memutuskan untuk membuat sub proyek Backenster internal kecil untuk mengelola aplikasi, periklanan, dan analitik, agar tidak mengulangi kesalahan masa lalu pada penerjemah berkualitas tinggi dan dapatkan sebanyak mungkin.

Melalui sistem ini, saya akan mengarahkan pengguna dari aplikasi penerjemah lama saya ke yang baru, karena tidak ada uang untuk membeli traffic. Di tempat lain, 5-10 juta aplikasi lama tetap ada di ponsel. Ketika aplikasi sudah siap, tinggal klik "Mulai". Biayanya berkali-kali lebih murah daripada menarik jumlah pengguna yang sama dengan biaya. Secara bertahap, sistem untuk mengelola pengujian, langganan, pembaruan, konfigurasi, pemberitahuan, mediator periklanan, dll., Serta kemampuan untuk mengiklankan lintas aplikasi seluler dalam ekstensi browser, chatbots, desktop, asisten suara dan sebaliknya, ditambahkan. Saya memutuskan untuk melihat semua masalah yang muncul selama ini dengan aplikasi.



Perspektif dan Strategi


Membuat API untuk aplikasi Anda dan menginvestasikan banyak uang, Anda perlu memahami volume dan prospek pasar terjemahan mesin. Pada 2017, ada perkiraan bahwa pasar akan menjadi $ 1,5 miliar pada 2023, meskipun volume pasar untuk semua transfer adalah $ 70 miliar (untuk 2023).

Mengapa lari seperti itu - sekitar 50 kali?

Katakanlah penterjemah mesin terbaik sekarang menerjemahkan dengan baik 80% dari teks. 20% sisanya harus diedit oleh seseorang. Biaya terjemahan terbesar adalah proofreading, yaitu gaji orang.

Peningkatan kualitas terjemahan bahkan sebesar 1% (hingga 81% dalam contoh kami) dapat secara nyata mengurangi biaya pengoreksian teks sebesar 1%. 1% dari perbedaan antara pasar semua transfer dikurangi mesin yang akan (70 - 1,5 = $ 68,5 miliar) atau $ 685 juta sudah. Angka-angka dan perhitungan di atas diberikan kira-kira untuk menyampaikan esensi.

Artinya, peningkatan kualitas bahkan 1% dapat secara signifikan menghemat perusahaan besar pada layanan terjemahan. Ketika kualitas terjemahan mesin berkembang, semakin banyak yang akan menggantikan pasar terjemahan manual dan menghemat biaya gaji. Tidak perlu mencoba untuk mencakup semua bahasa, Anda dapat memilih pasangan populer (Inggris-Spanyol) dan salah satu bidang (kedokteran, metalurgi, petrokimia, dll.). Kualitas 100% - terjemahan mesin sempurna untuk semua mata pelajaran - tidak dapat dicapai dalam waktu dekat. Dan setiap persentase peningkatan kualitas selanjutnya akan lebih sulit.

Namun, ini tidak mencegah pasar terjemahan mesin menduduki bagian yang signifikan dari total pasar pada tahun 2023 (dengan analogi dengan DeepL, itu secara tidak terlihat meraih 10% dari pasar Google), karena perusahaan besar menguji berbagai API penerjemah setiap hari. Dan meningkatkan kualitas salah satunya dengan persentase (untuk bahasa apa pun) akan memungkinkan mereka menghemat jutaan dolar.
Strategi perusahaan-perusahaan besar untuk menciptakan waktu operasi mereka sendiri telah mulai membuahkan hasil. Ada lebih banyak startup, karya ilmiah, dan orang-orang di industri, yang memungkinkan kami untuk mengguncang pasar dan mencapai kualitas terjemahan yang lebih baik, meningkatkan perkiraan kami untuk pasar terjemahan mesin.

Setiap tahun, kompetisi diadakan pada tugas-tugas NLP, di mana perusahaan, startup dan universitas bersaing yang akan memiliki terjemahan terbaik dalam pasangan bahasa tertentu.

http://statmt.org/wmt18/

Dengan menganalisis daftar pemenang, ada keyakinan bahwa sumber daya kecil dapat mencapai hasil yang sangat baik.

Pembukaan perusahaan


Selama beberapa tahun, proyek ini telah berkembang berkali-kali. Aplikasi telah muncul tidak hanya untuk platform seluler, tetapi juga untuk komputer, perangkat yang dapat dipakai, pesan instan, browser, asisten suara. Selain menerjemahkan teks, terjemahan suara, gambar, file, situs dan panggilan telepon dibuat. Awalnya, saya berencana membuat API terjemahan saya hanya digunakan untuk aplikasi saya. Tapi kemudian saya memutuskan untuk menawarkannya kepada semua orang. Pesaing maju, dan itu perlu untuk mengikuti.

Sampai saat itu, saya mengelola semuanya sendiri sebagai pengusaha perorangan, mempekerjakan orang untuk melakukan outsourcing. Tetapi kompleksitas produk dan jumlah tugas mulai tumbuh dengan cepat, dan menjadi jelas bahwa Anda perlu mendelegasikan fungsi dan dengan cepat merekrut orang ke tim Anda sendiri di kantor Anda. Saya menelepon seorang teman, dia keluar dari pekerjaannya dan memutuskan untuk membuka Lingvanex pada bulan Maret 2019.

Sampai saat itu, saya membuat proyek tanpa iklan di mana pun, dan ketika saya memutuskan untuk mengumpulkan tim saya, saya mengalami masalah pencarian. Tidak ada yang percaya bahwa ini bisa dilakukan sama sekali, dan tidak mengerti mengapa. Saya harus mewawancarai banyak orang dan masing-masing berbicara selama 3 jam tentang ribuan detail yang tidak jelas. Ketika artikel pertama tentang proyek itu keluar, itu menjadi lebih mudah. Saya selalu ditanya satu pertanyaan:

Pertanyaan pertama selalu terdengar "Apa yang Anda lebih baik dari Google?"

Saat ini, tujuan kami adalah untuk mencapai kualitas terjemahan Google dari tema umum dalam bahasa utama Eropa dan Asia dan setelah itu memberikan solusi untuk:

1) Terjemahan teks dan situs melalui API kami tiga kali lebih murah daripada pesaing, memberikan layanan dukungan yang sangat baik dan integrasi yang mudah. Misalnya, biaya terjemahan Google adalah $ 20 per juta karakter, yang sangat mahal untuk jumlah yang signifikan

2) Terjemahan tematik berkualitas tinggi pada topik-topik tertentu (kedokteran, metalurgi, hukum, dll.) Oleh API, termasuk integrasi ke dalam alat profesional penerjemah (seperti SDL Trados)

3) Integrasi ke dalam proses bisnis perusahaan untuk menjalankan model terjemahan di server mereka di bawah lisensi kami. Ini memungkinkan Anda untuk menjaga kerahasiaan data, tidak tergantung pada volume teks yang diterjemahkan dan mengoptimalkan terjemahan untuk spesifikasi perusahaan tertentu.

Anda dapat membuat kualitas terjemahan lebih baik daripada pesaing untuk pasangan bahasa atau topik tertentu. Anda dapat melakukan apapun. Ini adalah masalah sumber daya perusahaan. Dengan investasi yang cukup, tidak ada masalah. Apa dan bagaimana melakukannya - diketahui bahwa Anda hanya perlu bekerja tangan dan uang.

Faktanya, pasar NLP tumbuh sangat cepat karena pengakuan, analisis wicara, peningkatan terjemahan mesin, dan dapat mendatangkan keuntungan baik untuk tim kecil. Semua sensasi di sini akan dimulai dalam 2-3 tahun, ketika promosi pasar hari ini oleh perusahaan besar akan membuahkan hasil. Serangkaian merger / akuisisi akan dimulai. Hal utama saat ini adalah memiliki produk yang bagus dengan audiens yang dapat Anda jual.

Total


Selama ini, aplikasi pengujian telah menghasilkan lebih dari $ 1 juta, yang sebagian besar dihabiskan untuk membuat penerjemah Anda sendiri. Sekarang sudah jelas bahwa semuanya bisa dilakukan jauh lebih murah dan lebih baik. Banyak kesalahan manajemen yang dibuat, tetapi ini adalah pengalaman, dan kemudian tidak ada yang berkonsultasi dengannya. Artikel tersebut menjelaskan sebagian kecil dari cerita ini, dan kadang-kadang mungkin tidak jelas mengapa keputusan tertentu dibuat. Ajukan pertanyaan di komentar.

Saat ini, kami belum mencapai kualitas terjemahan Google, tetapi saya tidak melihat ada masalah dalam melakukan ini jika tim memiliki setidaknya beberapa spesialis dalam Pemrosesan Bahasa Alami.
Sekarang penerjemah kami bekerja dengan sangat baik dari Bahasa Inggris ke Bahasa Jerman, Spanyol, Prancis.

Tautan ke program baru yang telah dikembangkan selama 3 tahun dan di mana uang diinvestasikan. Jika ada yang ingin melihat aplikasi pengujian lama yang dibahas di awal artikel (di mana uang diperoleh dan 35 juta lompatan) - tulis secara pribadi.

Penerjemah untuk iOS


Penerjemah untuk Android


Penerjemah untuk Mac OS


Penerjemah untuk Windows


Penerjemah untuk Chrome


Penerjemah untuk Telegram



Tautan ini dapat ditemukan

Demo API Terjemahan



Tim juga membutuhkan manajer produk (aplikasi mobile) dan programmer Python dengan pengalaman dalam proyek NLP.

Jika Anda memiliki ide untuk kemitraan dan penawaran bersama - menulis di PM, tambahkan ke Facebook, LinkedIn.

All Articles