Podcast: apa yang menanti ilmuwan pemula di bidang pertahanan

Seperti yang dijanjikan , kami menyediakan transkrip lengkap dari rilis pertama podcast kami ( Anda dapat mendengarkannya di Apple Podcasts ). Andrei Filchenkov , Ph.D (Fisika dan Matematika), associate professor dari Fakultas Teknologi Informasi dan Pemrograman dan kepala kelompok pembelajaran mesin di laboratorium komputer ilmu komputer internasional, berbicara dengan kami .


Foto oleh Samuel Bourke (Unsplash.com)

Dmitry:Tahun lalu AndamenerimaHadiah Ilya Segalovich, dan Anda mengatakan bahwa Anda terlibat dalam berbagai bidang, tanpa vektor umum selain pembelajaran mesin. Berikan komentar tentang pendekatan ini. Apakah kebebasan seperti itu menentukan bagi Anda?

Andrey Filchenkov:Ketika saya datang untuk bekerja di Universitas ITMO, di laboratorium Teknologi Komputer kami, yang telah menjadi pusat ilmiah, tidak ada yang berhubungan langsung dengan pembelajaran mesin. Dan kami mulai bereksperimen. Itu tahun 2014.

Dmitry:Sudahkah Anda merumuskan tugas sendiri?

Andrew:Mereka menetapkan, memutuskan. Pembelajaran mesin dirancang sedemikian rupa sehingga ide mengalir dari satu area ke area lain, dan model mengalir dari satu tugas ke tugas lainnya. Cukup sulit untuk dibatasi pada sesuatu. Jadi bukan hanya kita yang bekerja. Hampir selalu, peneliti di bidang pembelajaran mesin tidak duduk ketat di satu ceruk, selalu ada banyak penelitian di sekitar.

Hal lain adalah bahwa pada awalnya kami tidak memiliki vektor di mana kami akan membangun pekerjaan kami. Tetapi sekarang kita mempelajari topik-topik khusus dan umumnya membatasi jumlah relung tempat kita bekerja. Pertama-tama, ini adalah pembelajaran mesin otomatis, segala sesuatu yang berkaitan dengan pemrosesan dan pembuatan gambar, termasuk video, analisis jejaring sosial.

Dua topik yang relatif baru muncul tahun lalu: pembelajaran mesin untuk analisis kode dan pembelajaran mesin untuk routing. Kami telah merutekan sejak 2016, tetapi menyelidiki topik ini. Kami mencoba melakukan berbagai tugas, tetapi pendekatan ini memengaruhi hasilnya. Sekarang kami mencoba untuk lebih fokus pada kualitas daripada pada keanekaragaman.

Dmitry: Dan karena itu, Anda sudah merumuskan poin masalah bagi mereka yang bekerja di laboratorium, dan bertindak sebagai mentor teoretis untuk sejumlah besar spesialis?

Andrew: Ya.

Dmitry: Tampaknya bagi orang awam bahwa kegiatan ini terhubung dengan hal-hal yang sangat mendasar, formula dan artikel ilmiah. Tetapi orang-orang dari lab, seperti yang Anda lihat, bekerja dengan analisis jejaring sosial, mesin rekomendasi, analisis Twitter Trump. Tolong beritahu kami tentang proyek-proyek seperti itu yang dapat dimengerti pada tingkat praktis?

Andrey: Aktivitas kami dapat dibagi menjadi dua kategori. Yang pertama adalah algoritma yang berlaku untuk banyak hal. Misalnya, algoritma pemilihan fitur. Mereka diperlukan untuk banyak tugas - untuk menganalisis urutan DNA, memproses data medis, dan sebagainya. Kategori kedua adalah tugas dari area subjek di mana kami sudah mencoba menggunakan algoritma yang berbeda. Ada lebih banyak tugas dalam kategori ini, mereka dapat dimengerti dan beragam, dan tidak selalu sepenuhnya ilmiah.

Dalam foto: Andrey Filchenkov
Selain laboratorium, kami memiliki lingkungan yang sama di mana startup dan perusahaan berputar. Mereka datang dengan pesanan industri, tugas muncul dengan cukup praktis. Baru-baru ini, kami bekerja dengan saluran TVC. Mereka memiliki sejumlah besar dokumen dan artikel yang berbeda. Dan mereka sangat tertarik untuk memantau bagaimana fenomena ini atau itu disajikan dalam pers dan bagaimana perubahannya dari waktu ke waktu - berapa banyak Ilon Mask konvensional di media, dalam konteks apa ia ditemui. Kami menulis mesin pencari untuk mereka agar dapat dengan cepat melakukan permintaan yang agak rumit pada basis data yang cukup besar.

Dmitry: Apakah lebih efektif bagi mereka untuk menghubungi Anda dan memperkenalkan pengembangan kustom, daripada pergi ke pasar untuk produk "kotak" yang sudah jadi?

Andrew: Ya. Mereka memiliki tugas khusus. Tidak ada solusi seperti itu di pasaran.

Kami juga melakukan hal-hal yang cukup menarik dengan Vk, tempat salah satu mahasiswa pascasarjana kami bekerja. Periklanan adalah salah satu sumber utama pendapatan untuk situs ini, seperti sebagian besar perusahaan ini. Dan Anda perlu memahami kepada siapa harus menampilkan iklan ini, sehingga semuanya efektif. Tugasnya terlihat seperti itu. Ada banyak pengiklan. Kita perlu memastikan bahwa mereka memiliki pertunjukan, dan orang-orang menjadi relevan.

Ada sejumlah penelitian yang berkaitan dengan kedokteran. Misalnya, analisis kulit dari foto untuk mengidentifikasi penanda medis penting. Ada dua topik. Salah satunya terkait dengan mengidentifikasi apakah tahi lalat adalah tahi lalat atau apakah itu pertanda bahwa sesuatu yang serius dapat terjadi. Yang kedua adalah pemahaman tentang apa yang menyebabkan bintik-bintik ini atau itu, ruam (ini bisa merupakan gejala dari sejumlah besar kulit dan penyakit menular seksual).

Dmitry:Dan di sini Anda dapat meningkatkan ketersediaan diagnostik dasar?

Andrew: Ya. Tetapi bahkan jika gejalanya terlihat karena ada di kulit, klasifikasi mereka tidak begitu sederhana. Kami mengotomatiskan tugas ini sehingga Anda dapat meletakkan aplikasi di ponsel Anda, mengambil gambar dan memahami, tetapi ada sesuatu yang mencurigakan. Kami tidak membuat keputusan di sini, tetapi jika aplikasi memberi tahu orang itu bahwa ada sesuatu yang salah, lebih baik pergi ke dokter dan berkonsultasi.



Transfer berbagai solusi dan pengembangan lingkup Wilayah Moskow


Kode waktu ( versi audio ) - 09:07



Dmitry: Pernahkah Anda memiliki situasi ketika Anda mengambil keputusan yang diuji di satu bidang kegiatan dan menerapkannya di bidang lain, sebagai percobaan atau ketika Anda mengalami kesulitan dengan tugas?

Andrew:Biasanya kami mencoba menggunakan pembelajaran mesin otomatis. Secara kasar, kami memiliki beberapa kotak hitam di mana kami meninggalkan tugas dan mendapatkan solusi dasar. Mereka, tentu saja, biasanya lebih buruk daripada apa yang dapat Anda lakukan dengan tangan Anda setelah itu, tetapi ini adalah garis dasar yang dapat Anda fokuskan. Jika kita berbicara tentang solusi spesifik, misalnya, terkait dengan pemrosesan gambar, transfer berfungsi di sini. Hal dasar adalah VGG pra-pelatihan dan pelatihan lebih lanjut tentang data. Pembentukan solusi dasar berdasarkan jaringan akses terlatih dan ditata adalah langkah standar. Dan seringkali ternyata lebih baik tidak melakukan apa pun dalam konfigurasi saat ini.

Dmitry: Dalam kasus ini, apakah Anda mengubah beberapa hal arsitektur dari sudut pandang besi, atau hanya tentang solusi perangkat lunak, algoritme?

Andrew:Biasanya kami hanya berbicara tentang algoritma. Ada beberapa masalah yang harus kami sesuaikan dengan besi. Yang paling cemerlang adalah apa yang kami lakukan dengan Huawei untuk mengenali karakter dalam foto. Ada pembatasan yang agak ketat terkait dengan kenyataan bahwa model ini harus diterapkan pada telepon. Di mana tidak ada banyak memori, ada batasan pada operasi yang dapat digunakan, karena tidak mungkin untuk menerapkan dalam bentuk murni apa yang kami lakukan pada TensorFlow. Dan di sini kami harus mengelak, karena ada keputusan bagus, tetapi tanpa kemungkinan pemindahan, dan kami harus berusaha keras. Tetapi lebih sering kita membuat keputusan yang bekerja cepat di suatu tempat di server, tetapi tanpa batasan pada yang lainnya.

Dmitry:Saya bertanya, karena pertanyaan yang sering muncul tentang efisiensi sistem seperti itu tergantung. Beri tahu kami masalah apa yang saat ini Anda hadapi dalam hal evolusi algoritma dan pendekatan teoretis untuk bidang ini? Adakah batas yang telah dicapai bidang ini, atau apakah berkembang pesat sekarang?

Andrew:Pertanyaannya agak rumit, tetapi menarik. Untuk waktu yang lama, semuanya benar-benar terbatas pada besi. Ada algoritma yang cukup kompleks, tetapi tidak selalu berhasil dengan baik. Sekarang banyak yang terhubung dengan jaringan saraf, karena kekuatan komputasi telah muncul yang memungkinkan mereka untuk mengemudi. Meskipun dari beberapa titik daya komputasi menjadi kurang penting, kami selalu berarti bahwa kami akan memiliki biaya tertentu. Jika kita berbicara tentang algoritma klasik, maka tidak ada masalah khusus dengan kapasitas. Pertanyaannya adalah bagaimana dengan cepat dan efisien menemukan solusi terbaik.

Awalnya, karena kapasitasnya terbatas, penting bagi orang yang memecahkan masalah untuk memahami cara kerja algoritma, kebutuhan sumber daya mereka, penerapan tugas ini. Ada masa ketika ini menjadi tidak begitu, karena kapasitas menjadi cukup terjangkau.

Dmitry: Yaitu, ada lompatan yang cukup signifikan dalam pertumbuhan daya dan kemampuan komputasi. Kami sedikit mengangkat tangan dari denyut nadi. Sekarang Anda mengembalikannya.

Andrei: Ya, beberapa tahun terakhir telah terjadi peningkatan pembelajaran mesin otomatis. Dan ada versi bahwa semua keahlian yang ada di pembelajaran mesin dapat digantikan oleh peningkatan seratus kali lipat dalam daya komputasi. Pembelajaran mesin otomatis sebenarnya mencoba menemukan solusi untuk masalah Anda. Dan ini adalah masalah kapasitas, karena ini adalah pencarian, bukan pencarian yang lengkap, tetapi masih sangat kompleks, panjang, skala besar, membutuhkan sejumlah besar sumber daya komputasi. Akibatnya, kami sekali lagi bersandar pada kenyataan bahwa keahlian sedang digantikan oleh sumber daya dan ketersediaannya.


Foto oleh Franki Chamaki (Unsplash.com)

Saya tidak percaya bahwa kita akan pernah menemukan diri kita dalam situasi di mana seorang ahli tidak akan diperlukan, karena masih ada banyak tugas yang tidak dapat diambil dan diotomatisasi seperti ini (mengatur tugas, memahami proses bisnis) sampai kita datang dengan sistem yang kuat kecerdasan buatan. Minimal, itu tidak akan segera. Oleh karena itu, tugas akan dipertahankan, tetapi persyaratan untuk daya komputasi yang akan dimulai kembali menjadi salah satu faktor utama.

Dmitry: Tetapi pada saat yang sama, Anda masih harus mengambil beberapa tindakan untuk "mengejar ketinggalan" dengan pertumbuhan daya komputasi dalam hal efisiensi algoritma itu sendiri. Perusahaan yang dapat memiliki kapasitas besar, tetapi menurut saya, setiap tugas memiliki jangka waktu tertentu, di mana tugas itu harus diselesaikan dan tetap relevan.

Andrew: Ya. Ada kualitas yang diinginkan, ada waktu yang diperlukan untuk mencapainya. Kami terbatas di kedua sisi. Jika ada cukup waktu, maka kualitas hampir selalu dapat dicapai. Meskipun, tentu saja, setiap tugas memiliki batasan mendasar pada kualitas apa yang dapat diperoleh. Secara kasar, kita tidak akan dapat memprediksi karakter dengan lokasi bulan lebih baik daripada koin. Tetapi jika batasan yang dibutuhkan tidak mencapai langit-langit, maka kita dapat mencapai kualitas yang diinginkan untuk beberapa waktu. Terkadang kita dapat mengatakan bahwa dalam waktu yang ditentukan kami menemukan solusi yang cukup baik, kami tidak bisa mendapatkan yang terbaik untuk saat ini. Selalu ada dua "koordinat" ini.



Studi tentang hasil baru, pemahaman dan adaptasi mereka


Kode waktu ( versi audio ) - 16:41



Dmitry: Dari sudut pandang pengembangan profesional mereka yang bekerja di laboratorium Anda, bagaimana Anda bisa menilai distribusi pengetahuan dasar dan pelatihan teoretis dibandingkan dengan apa yang harus Anda pelajari langsung dalam proses: menganalisis artikel ilmiah, terobosan, perubahan di bidang ini? Berapa banyak dari perubahan ini yang muncul sebagai bagian dari satu minggu atau bulan? Seberapa sulit untuk mengimplementasikannya dalam kegiatan Anda, dalam proyek-proyek yang sedang Anda kerjakan di sini sekarang?

Andrew:Ini pertanyaan yang sangat bagus. Itu semua tergantung daerah. Sebagai contoh, seorang mahasiswa pascasarjana yang mengotomatisasi tugas pengelompokan sekarang melindungi saya. Secara umum, tidak ada aliran hasil baru yang sangat besar. Di sisi lain, ia melakukan AutoML untuk pengelompokan. Di sini tidak begitu mudah untuk melacak aliran hasil baru. Selain itu, sulit untuk dibatasi pada satu area saja.

Seperti yang saya katakan di awal, di bidang pembelajaran mesin, semuanya sangat terhubung. Ide-ide yang awalnya muncul di bidang aliran pemrosesan gambar dalam beberapa langkah di tempat lain. Pengolah kata adalah kandidat terdekat. Salah satu faktor keberhasilan yang paling penting adalah hanya untuk mengetahui apa yang terjadi tidak hanya di ceruk pasar Anda, tetapi juga di bidang pembelajaran mesin secara umum.

Foto oleh Nick Hillier (Unsplash.com)
Ini sulit dilakukan karena banyak hasil yang dihasilkan. Puluhan ribu peserta di konferensi-konferensi besar, sejumlah besar karya, hingga ratusan karya seminggu di arsip. Jumlah seperti itu sulit untuk dibalik. Tetapi tonggak penting untuk diperhatikan.

Untuk melakukan ini, Anda tidak perlu memindai arsip atau membaca koleksi konferensi dari depan ke belakang, tetapi berlangganan ke publik terkait dengan pembelajaran mesin dan melacak apa yang tertulis di sana sangat penting.

Awalnya, ada banyak hasil berbeda dalam pemrosesan bahasa. Begitu Word2vec muncul, semua orang mulai pindah ke embeddings. Ada banyak dari mereka. Ada beberapa tugas dasar, tetapi untuk tugas-tugas khusus yang berbeda mereka memiliki tugas mereka sendiri, dan perlu untuk memantau bagaimana mereka meningkatkannya. Kemudian Google meluncurkan BERT, dan itu memberikan peningkatan yang sangat besar. Pada titik tertentu, ternyata jika Anda mengerti cara kerja BERT, dan jika Anda terlibat dalam pemrosesan bahasa Inggris, maka Anda benar-benar tidak memerlukan apa-apa.

Anda tidak bisa khawatir tentang keberhasilan versi baru fastText dan embeddings berdasarkan itu. BERT sekarang memiliki banyak perubahan. Itu masih mendasar, seperti Word2vec pada satu waktu. Tetapi sudah ada banyak modifikasi yang keluar dengan frekuensi beberapa pekerjaan per bulan atau bahkan tidak kurang kerja per minggu.

Dan dinamika ini berubah sepanjang waktu. Ada tempat di mana semuanya runtuh, dan di sini Anda dapat mengejar sesuatu, lalu mulai mekar dalam warna yang berbeda lagi, dan Anda harus mengikuti ini. Masalahnya adalah bahwa ini terjadi lebih sering, yaitu, kecepatan di mana hasil baru muncul hanya meningkat. Bagaimana cara melacak hal ini adalah salah satu masalah kehidupan mendasar yang saya temui.

Dmitry: Apakah ledakan aktivitas semacam itu lebih banyak muncul di sekitar perusahaan besar yang membuat kerangka kerja mereka sendiri, atau apakah komunitas ilmiah melemparkan sesuatu?

Andrew:Setiap orang terlibat dalam berbagai tingkatan. Saya harus mengakui bahwa perusahaan memiliki hasil lebih banyak daripada universitas. Itu tergantung daerahnya. Skenario tipikal adalah ketika ilmuwan besar bekerja tidak hanya di universitas, tetapi juga di perusahaan. Paling sering mereka merekrut mereka yang terus melakukan kegiatan penelitian. Oleh karena itu, perusahaan mengakumulasi potensi intelektual yang sangat besar. Universitas jarang dapat memberikan kekuatan komputasi yang sama dan kumpulan data, sehingga dadu perusahaan atas artikel (afiliasi) lebih sering ditemukan.

Dmitry: Bahkan pada artikel, meskipun fakta bahwa perusahaan memiliki kemampuan untuk menutup sebagian besar perkembangan dan penelitiannya dari publik? Itu masuk akal. Tetapi universitas tidak memiliki kesempatan seperti itu, karena sifatnya universitas wajib menerbitkan sesuatu.

Andrew:Memang, mungkin ada bias. Universitas menerbitkan dalam hal apa pun, karena ini adalah kekhasan pekerjaan mereka. Alur artikel dari universitas lebih besar, karena ada banyak universitas, orang-orang diterbitkan, dan perusahaan tidak menyambut ini di mana-mana. Tetapi hasil terobosan - perusahaan memiliki lebih dari mereka.

Jadi mereka memanfaatkan ketenaran dan kompetensi mereka, menarik ilmuwan baru, menjelaskan bahwa penelitian dapat dilakukan dengan mereka, dan sangat keren. Misalnya, mereka membuat model baru, itu bisa sangat teoretis. Tetapi lebih sering daripada tidak, ini sangat penting secara praktis, di perusahaan pada awalnya. Mereka dapat ditata dalam sumber terbuka, tetapi, misalnya, seperti Google, itu akan menjadi beberapa versi sebelumnya, yang mereka sendiri anggap sudah ketinggalan zaman.



Pengembangan terbuka, persiapan publikasi dan persyaratan untuk mereka


Kode waktu ( versi audio ) - 23:48



Dmitry: Seberapa pentingkah pengembangan open source dalam bisnis Anda? Bagaimana mereka memengaruhinya? Dalam contoh dengan otomasi pengelompokan, Anda mengatakan bahwa Anda mengambil pengembangan sumber terbuka dan menerapkannya pada beberapa dasar fundamental yang dapat Anda pelajari, kerjakan dengan seksama, yaitu, pergi ke arah yang berlawanan dan tidak menjadi terikat pada perubahan cepat di bidang sempit.

Andrew:Kode yang diposting sangat penting. Hampir selalu muncul pertanyaan standar - apakah yang dikerjakan berhasil. Masih - pertanyaan perbandingan dengan hasil. Ketika seseorang menciptakan sesuatu, dia perlu membuktikan bahwa itu lebih baik daripada sebelumnya. Sayangnya, cukup sering muncul situasi ketika orang membandingkan dengan apa yang datang sebelum mereka, menurut angka yang diterbitkan dalam artikel. Ini tidak terlalu benar. Tidak ada jaminan bahwa seseorang mereproduksi percobaan seperti yang dilakukan orang lain. Karena itu, penting untuk mengambil keputusan yang berbeda dan menjalankannya sendiri, memeriksa cara kerjanya, dan memastikan bahwa Anda melakukan yang lebih baik dalam pengaturan eksperimental yang sama.

Anda hanya dapat membandingkan dengan benar jika memiliki kode. Headway


Foto (Unsplash.com)

Kedua, jika seseorang tidak mengembangkan sesuatu yang baru dari sudut pandang kompetisi, tetapi ingin menerapkan metode ini, akan menyenangkan untuk memilikinya di GitHub, dan itu dapat digunakan. Tetapi bahkan ketika sesuatu diletakkan, dokumentasi tidak selalu tersedia. Jarang mempublikasikan pekerjaan dengan dokumentasi yang baik. Kebetulan mereka tidak mengunggah kode sama sekali, dan Anda harus mengimplementasikan semuanya seperti yang dijelaskan dalam artikel. Ini masalah. Situasi ini menciptakan kesulitan dengan reproduktifitas hasil pembelajaran mesin. Dan ini hampir merupakan masalah utama di lingkungan kita.

Mudah untuk mempublikasikan hasil pelatihan ulang, tetapi sulit untuk memeriksa apakah tidak ada kode. Kami membandingkan AutoML kami dengan solusi yang ada. Untungnya, ada perpustakaan yang diterbitkan yang aktif digunakan. Ada lebih banyak solusi bermodel baru, tetapi kode mereka tidak ditata. Jelas bahwa mereka lebih buruk - apa yang mereka paparkan adalah kasus khusus dari keputusan kami.

Dmitry: Apakah mungkin untuk membayangkan beberapa pendekatan yang akan menghilangkan masalah ini, setidaknya dalam kerangka kerja Anda dan menjamin kemungkinan mereproduksi hasil?

Andrew:Anda dapat menautkan ke repositori terbuka dan memberikan dokumentasi. Saya mencoba membuat semuanya dalam semua artikel. Sayangnya, ini tidak selalu terjadi. Ini terjadi pada hampir semua orang: seseorang menulis kode, itu berhasil, tetapi orang malu untuk membaginya dengan orang lain, karena mereka malu akan beberapa elemennya. Tetapi saya mencoba menyebarkan gagasan bahwa ketika menulis sebuah artikel, Anda perlu menambahkannya dengan tautan ke GitHub. Repositori dengan kode harus disiapkan terlebih dahulu.

Dmitry: Di sini Anda perlu menghabiskan waktu untuk mendokumentasikannya.

Andrew: Setidaknya minimal. Ini diperlukan agar apa yang ditulis dalam artikel membantu memahami apa yang sedang terjadi, walaupun kodenya tidak didokumentasikan sama sekali. Meski sulit. Semakin besar proyek, semakin sedikit artikel yang membantu.



Pekerjaan spesialis laboratorium dan frekuensi keluaran


Kode waktu ( versi audio ) - 28:37



Dmitry: Jika Anda mengevaluasi waktu persiapan artikel ilmiah dan proyek praktis, dalam jangka waktu berapa seseorang dapat menyadari sesuatu di bidang aktivitas Anda? Secara konvensional, setiap enam bulan atau setahun ia menerbitkan sebuah artikel, dan beberapa proyek besar memakan waktu, katakanlah, dua tahun.

Andrei: Ada masalah signifikan dengan kenyataan bahwa itu sangat tergantung pada hipotesis itu sendiri. Sangat sulit untuk menjawab pertanyaan ini. Saya bisa melukis proyek itu agar bisa dilakukan dalam dua bulan dan dalam dua tahun. Dalam hal ini, hasil yang serupa akan tercapai.

Ini tidak berarti bahwa Anda dapat mengambil dua bulan ini dan lakukan setiap hari dua belas kali lebih sedikit. Sini dengan sembilan ibu. Kami terikat dengan kekuatan komputasi, tetapi banyak hal dapat diparalelkan. Banyak hal dapat diselesaikan tergantung pada apa proyek tersebut.

Begitu pula dengan persiapan artikel. Ada hal-hal di mana model belajar satu jam, ada hal-hal di mana model belajar sehari. Dalam AutoML, percobaan dapat berlangsung dari seminggu. Kebetulan eksperimen tidak dilakukan pada tugas yang masuk akal, karena tidak dihitung. Oleh karena itu, ada banyak tugas di mana semuanya dipertimbangkan pada beberapa CIFAR. Setidaknya beberapa set data yang masuk akal, lebih seperti latihan, tidak ada yang mencoba menyentuh, karena artikel akan dirilis dalam dua tahun, modelnya akan, tetapi sudah ketinggalan zaman.

Kriteria kedua yang mempengaruhi keadaan hubungan adalah apa yang sudah Anda ketahui tentang bidang subjek. Jika Anda memiliki pemahaman tentang model apa yang ada, percobaan disiapkan, Anda menguji hipotesis tertentu, maka semuanya baik-baik saja. Namun biasanya tugas tersebut dapat berubah dalam proses. Tidak terlalu banyak.

Photo Science dalam HD (Unsplash.com)
Tapi sekarang telah berubah sedikit ke beberapa arah, dan perlu untuk membuktikan kebaruan dari apa yang Anda usulkan. Perlu untuk melihat apa yang telah dilakukan sebelumnya, untuk membandingkan.

Ternyata keputusan Anda baru, tetapi bukan yang paling keren. Anda mencoba memperbaikinya, hasilnya berubah. Perlu untuk membuktikan bahwa hasilnya baru. Dan juga, seorang pria mengacaukan pelatihan penguatan di suatu tempat, dan sekarang kita harus melihat ke arah ini.

Proses ini bisa sangat melar. Ada artikel jangka panjang, mereka ditulis untuk waktu yang lama, karena semuanya berubah sedikit. Poin lain adalah platform di mana publikasi artikel direncanakan. Di tempat yang bagus mereka membutuhkan pembenaran mengapa hasil Anda bagus. Terjadi penjelasan ini yang paling memakan waktu. Yaitu, model itu bekerja, dan memahami mengapa itu bekerja adalah tugas yang terpisah, bahkan lebih rumit daripada membuat model ini.

Akhirnya, penulisan artikel itu sendiri. Sayangnya, semua tempat yang layak diterbitkan untuk berkontribusi pada sains adalah berbahasa Inggris. Ini memaksakan keterbatasannya. Menulis artikel berbahasa Inggris tidaklah mudah. Jika seorang karyawan lab menulis artikel pertamanya, ia akan melakukannya untuk waktu yang sangat lama. Jika ini adalah artikelnya yang kedua puluh, cepat. Selain itu, jika saya tidak secara aktif menendang seseorang, dia akan menulis beberapa bulan, jika saya mau, lagi pula beberapa minggu. Tentu saja, itu semua tergantung pada seberapa kompleks subjek yang ia pertimbangkan.



Pilihan area untuk pengembangan dan prasyarat


Kode waktu ( versi audio ) - 33:04



Dmitry: Bagaimana pilihan awal arah mempengaruhi pembangunan? Misalnya, seseorang baru mulai melakukan semua ini pada tingkat yang serius dan, misalnya, mengambil area yang terlalu luas untuk dirinya sendiri. Dan di sini kruk mulai memanjat dengan perubahan berkala dan memperoleh hasil dari industri terkait, dan seseorang terjebak di dalamnya seperti di rawa. Bagaimana cara fokus pada tahap awal?

Andrew: Kisah-kisah seperti itu muncul jika seseorang membayangkan berbagai teknik yang dapat dia gunakan. Jika dia baru memulai, kemungkinan besar tidak akan ada masalah seperti itu.

Dmitry: Karena basis asli, yang kita bicarakan, menarik dengan hasil yang ada, dan seseorang tidak membawa sesuatu yang baru?

Andrew:Ya, bisa dibilang begitu. Membaca dengan baik penting di sini. Semakin banyak artikel yang Anda baca, semakin mudah untuk menulisnya. Bahasa artikel adalah bahasa yang terpisah. Ini bahasa Inggris ilmiah. Selain itu, bahasa Inggris ilmiah dalam pembelajaran mesin berbeda dari bahasa Inggris ilmiah dalam biologi. Jika seseorang membaca banyak artikel, menjadi lebih mudah baginya untuk merumuskan pemikiran dan menyusun artikel tersebut.

Dmitry: Beri tahu kami tentang fitur yang Anda harapkan pada pendatang baru - mereka yang baru saja bersiap untuk bergabung dengan Anda.

Andrew:Pertama-tama, ini adalah kemampuan untuk memprogram. Bidang diterapkan, tanpa itu di mana pun. Jika kami melakukan penelitian di bidang yang sepenuhnya mendasar, kami tidak bisa memikirkannya - pelatihan matematika sudah cukup. Tapi yang kita lakukan hanyalah berasumsi bahwa itu akan diimplementasikan dengan Python, misalnya. Keterampilan pemrograman sangat penting.


Foto oleh Hitesh Choudhary (Unsplash.com)

Yang kedua adalah kompetensi inti di bidang pembelajaran mesin. Adalah penting bahwa orang tersebut secara keseluruhan memahami apa itu pembelajaran mesin, bagaimana hal itu diatur, bahkan jika ia terlibat dalam tugasnya yang sempit. Misalnya, ia mulai berlatih dengan bala bantuan, tetapi di sini Anda masih perlu memahami bagaimana pembelajaran mesin terstruktur secara umum, apa itu pelatihan ulang. Penting juga untuk mengetahui model dan ide apa yang ada untuk mencoba menerapkannya di rumah. Faktor yang lebih penting adalah motivasi, keinginan untuk menyelam, dan minat internal. Jika seseorang memiliki pikiran yang baik membaca, pemahaman tentang bidang, kehadiran ide-idenya sendiri, dia akan lebih mampu menulis artikel dan memposisikan dirinya di bidang kita.

Dmitry:Apa yang Anda lakukan selain mengelola laboratorium dan berpartisipasi dalam pekerjaan di bangsal? Dengan satu atau lain cara, Anda harus mempelajari, memahami, menyarankan solusi, memperbaiki kesalahan. Apakah Anda memiliki proyek pihak ketiga pribadi? Mungkin harimu terlihat spesial? Atau apakah semua upaya hanya untuk kegiatan profil, dan apakah itu hobi Anda?

Andrei: Setiap hari saya tidak seperti yang lain. Sebagai contoh, pada bulan November saya cenderung berada di St. Petersburg daripada di St. Petersburg. Tidak mungkin untuk mengatakan bahwa saya memiliki aktivitas rutin yang konsisten pada satu waktu atau yang lain. Saya mencoba menulis apa yang ingin saya lakukan dalam sebulan. Misalnya, untuk membaca begitu banyak artikel, berbicara dengan mahasiswa pascasarjana Anda, menyebarkan tugas tergantung di mana saya berada, apa yang saya lakukan, dan faktor-faktor apa yang mempengaruhinya.

Sejak kecil, saya ingin melakukan sains, saya suka mencurahkannya sepanjang waktu. Benar, manajemen laboratorium bukanlah ilmu. Aktivitas organisasi dan aktivitas ilmiah adalah dua hal yang berbeda. Biasanya, para ilmuwan tidak terlalu tertarik pada organisasi dan birokrasi. Jika seseorang berhasil mengelola dengan baik, maka dia tidak punya waktu untuk melakukan perendaman yang mendalam dalam tugas tersebut. Sayangnya, saya tidak dapat menggabungkannya secara efektif: apakah saya mulai menggali kepemimpinan dan keluar dari konteks, atau saya memulai penelitian, dan proses organisasi sedang berjalan. Jadi sekarang saya mencoba untuk mempertimbangkan kembali pendekatannya. Laboratorium kami memiliki manajer, Ivan Smetannikov, kami memiliki staf administrasi, tetapi masih belum cukup staf.

Kepemimpinan adalah proses yang kompleks dan menegangkan, butuh banyak waktu. Ini adalah kejahatan yang diperlukan untuk terlibat dalam kegiatan ilmiah dan menyelesaikan lebih dari satu masalah spesifik. Saya bisa menjadi peneliti senior dan menangani satu atau beberapa tugas, tetapi dengan cara ini Anda dapat menangani sejumlah besar topik, dan selalu lebih menarik - untuk menyelam, membongkar, mencari solusi. Lebih menarik bagi saya untuk menemukan solusi daripada menerapkan dan memverifikasinya. Orang lain melakukan ini, tetapi ini bukan pendelegasian rutin.

Dalam sebuah penelitian, Anda hampir tidak pernah bisa mengatakan: "Lakukan ini!" Sebaliknya, mereka berkata: "Cobalah untuk melakukan ini dan pikirkan ini." Anda dapat mengatur arah seseorang, memberikan petunjuk, dia sama sekali tidak memiliki pekerjaan rutin. Jika Anda mengatakan: "Cobalah untuk menyelesaikan masalah ini", maka seseorang akan berhasil, tetapi seseorang tidak akan berhasil. Tidak selalu jelas dari mana harus memulai dan ke mana harus mencari. Di suatu tempat saya hanya mengarahkan, di suatu tempat saya menetapkan tugas, di suatu tempat saya hampir menggelar solusi.

Dmitry: Dan apakah Anda memilih mereka yang akan terlibat dalam berbagai bidang?

Andrei: Kami berdiskusi dengan semua orang tentang apa yang ingin ia lakukan dan tentang penelitiannya.

Dmitry: Pendekatan pribadi seperti itu?

Andrew:Tentu saja. Banyak studi dalam pembelajaran mesin adalah hal yang sangat individual. Jelas bahwa orang-orang berkolaborasi dalam kelompok dan melakukan sesuatu bersama, tetapi memaksa seseorang untuk melakukan sesuatu adalah pendekatan yang tidak efektif. Kebetulan dia tidak memiliki preferensi, dan dia dapat diundang untuk melakukan sesuatu. Dia bisa terlibat. Tetapi jika seseorang tidak tertarik, ia tidak memiliki motivasi intrinsik, ia tidak akan membaca, ia tidak akan berkembang. Dia akan menjadi pemain yang baik, tetapi ini tidak cukup untuk melakukan penelitian yang baik. Butuh minat pribadi. Oleh karena itu, perlu untuk memilih studi untuk seseorang.

Dmitry: Sumber atau literatur apa yang Anda rekomendasikan untuk mereka yang ingin beralih dari pemrograman dalam arti luas ke topik pembelajaran mesin?

Andrew: Rekomendasi utama - kursuson Coursera oleh Andrew Eun (Andrew Ng). Ada kursus yang lebih dalam di Sekolah Tinggi Ekonomi. Penting bahwa ada praktik. Pembelajaran mesin adalah tentang bagaimana algoritma bekerja dengan data. Ini jauh dari matematika, karena data memengaruhi apa yang perlu Anda lakukan dengannya. Anda dapat merasakan ini ketika belajar, ada banyak jebakan dan spesifik dalam kode. Saya dapat merekomendasikan buku-buku: Pembelajaran Jauh oleh Sergei Nikolenko, Hesti yang lebih klasik , Tibshirani, Friedman atau Uskup yang sepenuhnya klasik . Tentu saja, ini agak ketinggalan jaman, tetapi Anda bisa membuat ide yang bagus.



Podcast memasak dan memimpin dmitrykabanov.

Bacaan tambahan:




Startups of ITMO University (materi berbahasa Inggris kami di Habré):




All Articles