Pilihan artikel tentang pembelajaran mesin: studi kasus, panduan dan penelitian untuk Januari 2020

Pekerjaan penelitian di bidang pembelajaran mesin secara bertahap meninggalkan laboratorium universitas dan dari disiplin ilmu menjadi diterapkan. Namun, masih sulit untuk menemukan artikel yang relevan yang ditulis dalam bahasa sederhana dan tanpa satu miliar catatan kaki.

Posting ini berisi daftar bahan berbahasa Inggris untuk bulan Januari, yang ditulis tanpa akademikisme yang tidak semestinya. Di dalamnya Anda akan menemukan contoh kode dan tautan ke repositori yang tidak kosong . Teknologi yang disebutkan dalam domain publik dan tidak memerlukan besi tugas berat untuk pengujian.

Artikel dibagi menjadi empat jenis: pengumuman alat open source, kasus menggunakan pembelajaran mesin dalam pengembangan komersial, penelitian ML, dan pedoman praktis untuk menggunakan PyTorch dan TensorFlow.



Pengumuman teknologi sumber terbuka untuk pembelajaran mesin


LaserTagger

Artikel ini membahas secara singkat fungsionalitas dan arsitektur LaserTagger ; alat yang memungkinkan Anda membuat teks dengan berbagai cara - untuk menggabungkan dan membagi kalimat, serta menceritakannya kembali dengan kata lain. Tidak seperti model seq2seq, ia menggunakan kembali kata-kata, yang memastikan kecepatan tinggi pembuatan teks.

Reformator

Untuk memproses data serial - teks, musik, atau video - memerlukan sumber daya memori yang besar, karena data ini tergantung pada konteks sekitarnya. Tidak seperti Transformer, model arsitektur populer untuk jaringan saraf, Reformermengkonsumsi lebih sedikit memori untuk menyimpan konteks - hanya 16GB. Ini cukup untuk bekerja dengan set data teks besar - Reformer, misalnya, dapat memproses teks "Kejahatan dan Hukuman". Anda juga dapat menggunakan Alat untuk "menyelesaikan" fragmen gambar yang hilang.

Wav2letter @ dimanapun

Kerangka kerja pengenalan suara real-time menggunakan jaringan saraf berulang, sedangkan Wav2letter @ dimanapunmenggunakan model akustik convolutional. Kerangka kerja ini ditulis dalam C ++, dan mudah diintegrasikan ke dalam bahasa pemrograman lain. Pencipta berhasil meningkatkan throughput tiga kali dan memberikan efisiensi komputasi pada prosesor yang tidak terlalu kuat. Artikel ini memberikan tolok ukur dan tautan ke model yang akan membantu mengulang hasil pembelajaran.

Polygames

Kerangka kerja yang mengajarkan kecerdasan buatan untuk bermain game strategi, bahkan yang sama sekali tidak dikenal. Tidak seperti teknologi serupa lainnya, model ini tidak belajar dari banyak contoh manajemen game yang sukses, karena itu, tidak memerlukan set data. Alat

HiPlot

untuk memvisualisasikan data penelitian. Memungkinkan Anda untuk mengevaluasi efektivitas hyperparameters, seperti kecepatan belajar, regularisasi, dan arsitektur. Artikel ini memberikan potongan kode python dan contoh visualisasi mereka. HiPlot didukung oleh Jupiter Notebook.

Panduan Pembelajaran Mesin



TensorFlow.js

Pustaka sumber terbuka memungkinkan Anda untuk menjalankan model pembelajaran mesin tanpa meninggalkan ekosistem JS. Ini bekerja di semua browser saat ini, sisi server di Node.js, dan platform seluler di React Native.

Membuat komponen TFX tersuai.

Siapa pun dapat menggunakan platform TFX untuk membuat jalur pipa pembelajaran mesin yang siap pakai. Platform ini menawarkan banyak komponen standar, tetapi ada kalanya mereka tidak cocok. Artikel ini membahas tentang cara membuat pipa sepenuhnya kustom untuk bekerja dengan TensorFlow.

Mempercepat NVIDIA Dali dengan PyTorch

Artikel ini membahas beberapa cara untuk mengoptimalkan penggunaan DALI dan membuat proses yang hanya menggunakan CPU (tanpa GPU) dan mempercepat proses pembelajaran mesin di PyTorch sebanyak 4 kali.

Kontrol Versi Data dan Model untuk Eksperimen Cepat dalam Pembelajaran Mesin

Artikel ini menjelaskan cara membuat dan menggunakan kumpulan data versi untuk proses pembelajaran mesin yang dapat direproduksi. Sebagai contoh, menggunakan Git, Docker, dan Quilt, jaringan saraf yang dalam dibuat untuk pengenalan objek menggunakan Detectron2, sistem berbasis PyTorch yang menggunakan algoritma untuk pengenalan objek.

Pelatihan Transfer Aktif di PyTorch

Pelatihan transfer adalah proses ketika model pembelajaran mesin yang dibuat untuk satu tugas spesifik beradaptasi dengan tugas lain. Biasanya cukup untuk melatih kembali beberapa layer terakhir dalam model yang ada. Keuntungannya adalah ini membutuhkan pelabelan data minimal oleh manusia. Artikel ini memberikan panduan tentang penerapan transfer belajar ke pembelajaran aktif, yang bertujuan untuk mengidentifikasi pola data yang perlu diberi label oleh orang-orang.

Kasus dari pengembangan komersial


Membuat perpustakaan musik yang cerdas dengan TensorFlow

Developers dari platform streaming musik terkemuka Tiongkok membagikan pengalaman mereka menggunakan framework. Mereka memberi tahu secara rinci instrumen apa yang digunakan, bagaimana mereka melatih model untuk menentukan genre dan gaya musik untuk rekomendasi selanjutnya. Pisahkan suara dari musik, misalnya, untuk menghasilkan lirik lagu menggunakan pengenalan teks. Karena beberapa konten pada platform direkam oleh pengguna tanpa peralatan rekaman suara khusus, penulis belajar untuk menghilangkan gangguan dan kebisingan latar belakang.

Pelatihan Anjing dengan Pembelajaran Mesin

Anjing yang taat yang mengetahui tim lebih cenderung menemukan pemilik baru dan meninggalkan tempat berlindung. Namun, tidak semua tempat perlindungan memiliki kemampuan untuk melatih anjing. Tujuan proyek ini adalah untuk melatih mobil untuk memahami apakah anjing telah menyelesaikan perintah "Duduk", anjing menggonggong atau merengek, dll.

Pelatihan penyedot debu Seorang

produsen pembersih vakum pintar dari Cina telah melatih perangkat untuk mengenali kaus kaki dan kabel yang tersebar di lantai. Case berbicara tentang kesulitan membuat set data unik dari foto dan menggunakan berbagai algoritma pembelajaran mesin.

Buat kamera pintar menggunakan TensorFlow Lite di Raspberry Pi

Kamera dapat mendeteksi senyum di wajah seseorang dan secara otomatis mengambil gambar. Dia dapat dikendalikan oleh perintah suara. Untuk pengembangan, kami memilih Raspberry Pi 3B +, dengan satu gigabyte RAM dan sistem operasi 32-bit. TensorFlow Light telah memantapkan dirinya sebagai kerangka kerja untuk perangkat seluler dan IoT. Artikel tersebut menunjukkan algoritma sistem pengenalan untuk senyum dan perintah suara.

Penelitian


Jaringan saraf untuk menyelesaikan persamaan matematika

Facebook telah mengembangkan jaringan saraf pertama yang menggunakan logika simbolik untuk menyelesaikan persamaan integral dan diferensial dari jenis pertama dan kedua. Dulu pembelajaran mesin tidak cocok untuk tugas seperti itu, karena matematika membutuhkan akurasi absolut, bukan perkiraan. Para penulis penelitian menggunakan terjemahan mesin saraf. Persamaan dianggap oleh mesin sebagai kalimat teks, dan solusi sebagai terjemahannya. Untuk ini, perlu mengkompilasi sintaksis dan menyiapkan satu set data pelatihan dari lebih dari 100 juta persamaan pasangan dan solusinya. Dengan demikian, penelitian menunjukkan bahwa jaringan saraf dapat digunakan tidak hanya untuk membedakan pola.

AI Habitat: navigasi ultra-presisi AI di ruang

Facebook telah mengembangkan algoritma pembelajaran penguatan DD-PPO skala besar yang secara efektif mengatasi navigasi di ruang tempat tinggal dan kantor menggunakan data dari kamera RGB-D, GPS, dan kompas. Robot yang dilatih dengan DD-PPO mencapai tujuannya dengan akurasi 99,9%. Artikel tersebut berisi video yang mengesankan.

Bisakah Anda memercayai ketidakpastian model Anda? Kode yang

dipublikasikan dan hasil penelitian, yang berfokus pada masalah pergeseran kovarian, ketika data untuk pelatihan model tidak sesuai dengan sampel uji. Para penulis melakukan analisis komparatif yang luas dari model-model paling canggih, memberikan mereka set data dari teks, gambar, iklan online, dan genomik. Tujuannya adalah untuk menentukan akurasi metode populer. Dalam tolok ukur, metode ensemble terbukti paling andal.

Terimakasih atas perhatiannya!

Sebelum Anda rilis uji coba, semua rekomendasi dipersilahkan.

Source: https://habr.com/ru/post/undefined/


All Articles