Pilihan artikel tentang pembelajaran mesin: studi kasus, panduan dan penelitian untuk Januari 2020
Pekerjaan penelitian di bidang pembelajaran mesin secara bertahap meninggalkan laboratorium universitas dan dari disiplin ilmu menjadi diterapkan. Namun, masih sulit untuk menemukan artikel yang relevan yang ditulis dalam bahasa sederhana dan tanpa satu miliar catatan kaki.Posting ini berisi daftar bahan berbahasa Inggris untuk bulan Januari, yang ditulis tanpa akademikisme yang tidak semestinya. Di dalamnya Anda akan menemukan contoh kode dan tautan ke repositori yang tidak kosong . Teknologi yang disebutkan dalam domain publik dan tidak memerlukan besi tugas berat untuk pengujian.Artikel dibagi menjadi empat jenis: pengumuman alat open source, kasus menggunakan pembelajaran mesin dalam pengembangan komersial, penelitian ML, dan pedoman praktis untuk menggunakan PyTorch dan TensorFlow.
Pengumuman teknologi sumber terbuka untuk pembelajaran mesin
LaserTaggerArtikel ini membahas secara singkat fungsionalitas dan arsitektur LaserTagger ; alat yang memungkinkan Anda membuat teks dengan berbagai cara - untuk menggabungkan dan membagi kalimat, serta menceritakannya kembali dengan kata lain. Tidak seperti model seq2seq, ia menggunakan kembali kata-kata, yang memastikan kecepatan tinggi pembuatan teks.ReformatorUntuk memproses data serial - teks, musik, atau video - memerlukan sumber daya memori yang besar, karena data ini tergantung pada konteks sekitarnya. Tidak seperti Transformer, model arsitektur populer untuk jaringan saraf, Reformermengkonsumsi lebih sedikit memori untuk menyimpan konteks - hanya 16GB. Ini cukup untuk bekerja dengan set data teks besar - Reformer, misalnya, dapat memproses teks "Kejahatan dan Hukuman". Anda juga dapat menggunakan Alat untuk "menyelesaikan" fragmen gambar yang hilang.Wav2letter @ dimanapun
Kerangka kerja pengenalan suara real-time menggunakan jaringan saraf berulang, sedangkan Wav2letter @ dimanapunmenggunakan model akustik convolutional. Kerangka kerja ini ditulis dalam C ++, dan mudah diintegrasikan ke dalam bahasa pemrograman lain. Pencipta berhasil meningkatkan throughput tiga kali dan memberikan efisiensi komputasi pada prosesor yang tidak terlalu kuat. Artikel ini memberikan tolok ukur dan tautan ke model yang akan membantu mengulang hasil pembelajaran.PolygamesKerangka kerja yang mengajarkan kecerdasan buatan untuk bermain game strategi, bahkan yang sama sekali tidak dikenal. Tidak seperti teknologi serupa lainnya, model ini tidak belajar dari banyak contoh manajemen game yang sukses, karena itu, tidak memerlukan set data. AlatHiPlot
untuk memvisualisasikan data penelitian. Memungkinkan Anda untuk mengevaluasi efektivitas hyperparameters, seperti kecepatan belajar, regularisasi, dan arsitektur. Artikel ini memberikan potongan kode python dan contoh visualisasi mereka. HiPlot didukung oleh Jupiter Notebook.Panduan Pembelajaran Mesin
TensorFlow.jsPustaka sumber terbuka memungkinkan Anda untuk menjalankan model pembelajaran mesin tanpa meninggalkan ekosistem JS. Ini bekerja di semua browser saat ini, sisi server di Node.js, dan platform seluler di React Native.Membuat komponen TFX tersuai.Siapa pun dapat menggunakan platform TFX untuk membuat jalur pipa pembelajaran mesin yang siap pakai. Platform ini menawarkan banyak komponen standar, tetapi ada kalanya mereka tidak cocok. Artikel ini membahas tentang cara membuat pipa sepenuhnya kustom untuk bekerja dengan TensorFlow.Mempercepat NVIDIA Dali dengan PyTorchArtikel ini membahas beberapa cara untuk mengoptimalkan penggunaan DALI dan membuat proses yang hanya menggunakan CPU (tanpa GPU) dan mempercepat proses pembelajaran mesin di PyTorch sebanyak 4 kali.Kontrol Versi Data dan Model untuk Eksperimen Cepat dalam Pembelajaran MesinArtikel ini menjelaskan cara membuat dan menggunakan kumpulan data versi untuk proses pembelajaran mesin yang dapat direproduksi. Sebagai contoh, menggunakan Git, Docker, dan Quilt, jaringan saraf yang dalam dibuat untuk pengenalan objek menggunakan Detectron2, sistem berbasis PyTorch yang menggunakan algoritma untuk pengenalan objek.Pelatihan Transfer Aktif di PyTorchPelatihan transfer adalah proses ketika model pembelajaran mesin yang dibuat untuk satu tugas spesifik beradaptasi dengan tugas lain. Biasanya cukup untuk melatih kembali beberapa layer terakhir dalam model yang ada. Keuntungannya adalah ini membutuhkan pelabelan data minimal oleh manusia. Artikel ini memberikan panduan tentang penerapan transfer belajar ke pembelajaran aktif, yang bertujuan untuk mengidentifikasi pola data yang perlu diberi label oleh orang-orang.Kasus dari pengembangan komersial
Membuat perpustakaan musik yang cerdas dengan TensorFlowDevelopers dari platform streaming musik terkemuka Tiongkok membagikan pengalaman mereka menggunakan framework. Mereka memberi tahu secara rinci instrumen apa yang digunakan, bagaimana mereka melatih model untuk menentukan genre dan gaya musik untuk rekomendasi selanjutnya. Pisahkan suara dari musik, misalnya, untuk menghasilkan lirik lagu menggunakan pengenalan teks. Karena beberapa konten pada platform direkam oleh pengguna tanpa peralatan rekaman suara khusus, penulis belajar untuk menghilangkan gangguan dan kebisingan latar belakang.Pelatihan Anjing dengan Pembelajaran MesinAnjing yang taat yang mengetahui tim lebih cenderung menemukan pemilik baru dan meninggalkan tempat berlindung. Namun, tidak semua tempat perlindungan memiliki kemampuan untuk melatih anjing. Tujuan proyek ini adalah untuk melatih mobil untuk memahami apakah anjing telah menyelesaikan perintah "Duduk", anjing menggonggong atau merengek, dll.Pelatihan penyedot debu Seorangprodusen pembersih vakum pintar dari Cina telah melatih perangkat untuk mengenali kaus kaki dan kabel yang tersebar di lantai. Case berbicara tentang kesulitan membuat set data unik dari foto dan menggunakan berbagai algoritma pembelajaran mesin.Buat kamera pintar menggunakan TensorFlow Lite di Raspberry PiKamera dapat mendeteksi senyum di wajah seseorang dan secara otomatis mengambil gambar. Dia dapat dikendalikan oleh perintah suara. Untuk pengembangan, kami memilih Raspberry Pi 3B +, dengan satu gigabyte RAM dan sistem operasi 32-bit. TensorFlow Light telah memantapkan dirinya sebagai kerangka kerja untuk perangkat seluler dan IoT. Artikel tersebut menunjukkan algoritma sistem pengenalan untuk senyum dan perintah suara.Penelitian
Jaringan saraf untuk menyelesaikan persamaan matematikaFacebook telah mengembangkan jaringan saraf pertama yang menggunakan logika simbolik untuk menyelesaikan persamaan integral dan diferensial dari jenis pertama dan kedua. Dulu pembelajaran mesin tidak cocok untuk tugas seperti itu, karena matematika membutuhkan akurasi absolut, bukan perkiraan. Para penulis penelitian menggunakan terjemahan mesin saraf. Persamaan dianggap oleh mesin sebagai kalimat teks, dan solusi sebagai terjemahannya. Untuk ini, perlu mengkompilasi sintaksis dan menyiapkan satu set data pelatihan dari lebih dari 100 juta persamaan pasangan dan solusinya. Dengan demikian, penelitian menunjukkan bahwa jaringan saraf dapat digunakan tidak hanya untuk membedakan pola.AI Habitat: navigasi ultra-presisi AI di ruangFacebook telah mengembangkan algoritma pembelajaran penguatan DD-PPO skala besar yang secara efektif mengatasi navigasi di ruang tempat tinggal dan kantor menggunakan data dari kamera RGB-D, GPS, dan kompas. Robot yang dilatih dengan DD-PPO mencapai tujuannya dengan akurasi 99,9%. Artikel tersebut berisi video yang mengesankan.Bisakah Anda memercayai ketidakpastian model Anda? Kode yangdipublikasikan dan hasil penelitian, yang berfokus pada masalah pergeseran kovarian, ketika data untuk pelatihan model tidak sesuai dengan sampel uji. Para penulis melakukan analisis komparatif yang luas dari model-model paling canggih, memberikan mereka set data dari teks, gambar, iklan online, dan genomik. Tujuannya adalah untuk menentukan akurasi metode populer. Dalam tolok ukur, metode ensemble terbukti paling andal.Terimakasih atas perhatiannya!Sebelum Anda rilis uji coba, semua rekomendasi dipersilahkan. Source: https://habr.com/ru/post/undefined/
All Articles