Pilihan artikel tentang pembelajaran mesin: kasus, panduan dan studi untuk Februari 2020



Setelah posting Januari, temui edisi kedua intisari. Di sini Anda akan menemukan daftar bahan berbahasa Inggris untuk bulan Februari, yang ditulis tanpa akademikisme yang tidak semestinya. Publikasi berisi contoh kode dan tautan ke repositori yang tidak kosong. Teknologi yang disebutkan dalam domain publik dan banyak dari mereka tidak memerlukan besi tugas berat untuk pengujian.

Artikel-artikel dibagi menjadi empat jenis:
Pengumuman alat open source dan dataset
Panduan praktis untuk PyTorch dan TensorFlow
Studi kasus pembelajaran mesin
ML research


Pengumuman alat sumber terbuka


ClearGrasp

Algoritma ini dirancang untuk memecahkan masalah pengenalan objek transparan yang secara tidak merata memantulkan dan membiaskan cahaya. Kamera RGB-D standar apa pun cocok untuk bekerja. Facebook

PyTorch3D

telah mengumumkan perpustakaan yang sangat modular dan dioptimalkan untuk PyTorch , yang menyederhanakan pelatihan mendalam model dalam gambar tiga dimensi.

Hydra Kerangka kerja

baru dari sistem ekologi PyTorch, yang dirancang untuk menyelesaikan masalah yang terkait dengan kompleksitas proyek. Memberikan kemampuan manajemen proyek melalui baris perintah dan file konfigurasi. TensorFlow.js untuk Bereaksi Asli



Alat ini tidak menggunakan tampilan web untuk rendering dan tidak bergantung pada API platform web yang digunakan dalam browser. Dengan demikian, ini adalah platform integrasi baru dengan backend yang cocok untuk lingkungan ini.

Matrix Kompresi Operator

Operator memungkinkan Anda untuk menggunakan fungsi kompresi matriks didefinisikan sebagai faktorisasi dan menciptakan API aliran tensor untuk secara dinamis menerapkan kompresi ini sambil belajar setiap variabel aliran tensor.

Torchmeta Meta-Learning

Library menyediakan antarmuka tunggal untuk kumpulan data yang berbeda untuk menyederhanakan pembuatan algoritma baru.

AutoFlip

Seringkali Anda ingin mengubah orientasi layar dari horizontal (16: 9 atau 4: 3) menjadi vertikal. Akhirnya, kerangka itu muncul, yang membantu memotong bingkai secara dinamis dengan kehilangan minimal. Alat ini menentukan batas bingkai dan objek bergerak, hanya menyisakan yang paling penting di layar. Alat



Pustaka Pengoptimalan

Terkini untuk TensorFlow , yang memungkinkan Anda untuk mengurangi tingkat hasil yang tidak jujur ​​ketika memecahkan masalah dari dunia nyata, ketika banyak parameter tambahan diperhitungkan (misalnya, ketika menerbitkan pinjaman bank). Alat ini secara algoritmik mengubah batasan pengambilan sampel data menjadi permainan zero-sum untuk dua pemain.

Peta Poincare

Menggunakan Alat Geometri Hiperbolikmengungkapkan hubungan hierarkis kesamaan berpasangan dari berbagai sel. Ini memungkinkan penggunaan pembelajaran mesin untuk memetakan dan menganalisis perkembangan sel-sel organisme.

PyTorch Lightning + Torchbearer

Pencipta abstraksi tingkat tinggi Torchbearer telah bergabung dengan semakin populernya PyTorch Lightning dan sekarang sedang mengerjakan tim mereka. Abstraksi mengotomatiskan pengembangan, membuat kode terstandarisasi, dipelihara, dan dapat diskalakan. Dengan demikian, agar para peneliti dapat lebih fokus pada sains, daripada bekerja dengan basis kode.

Buka gambar v6

Versi keenam dari dataset Gambar Terbuka dirilis, di mana jenis penandaan dan komentar pada gambar diperluas secara signifikan. Tangkapan untuk foto sangat rinci sehingga juga akan memengaruhi pengembangan penelitian interdisipliner, di mana visi komputer dikombinasikan dengan pemrosesan bahasa alami.

CCMatrix: dataset untuk model terjemahan pelatihan Kumpulan

data terdiri dari 4,5 miliar kalimat bittext dalam 576 pasangan bahasa dan akan membantu dalam menciptakan model NMT yang lebih maju.

Panduan


Metode komponen utama terdistribusi menggunakan TFX

How TensorFlow Transform memungkinkan Anda menerapkan metode komponen utama dalam bentuk yang dapat diukur menggunakan sumber daya gugus komputasi, dan cara mengaktifkan pemrosesan transformasi dalam pipa TFX.

Mempercepat jaringan saraf menggunakan TensorNetwork di Keras.

Bahan tentang cara menggunakan perpustakaan TensorNetwork untuk memproses jaringan tensor dalam konteks pembelajaran mesin.

TensorFlow Lattice: Flexible, Controlled, and Interpreted Machine Learning Gambaran

pengantar tentang kemampuan perpustakaan untuk mengajar model-model kisi yang terbatas dan diinterpretasikan.

Kasing


Masker AR dengan TensorFlow.js yang

dibeli Startup Loreal ModiFace membagikan pengalamannya menggunakan pembelajaran mesin dalam konteks masker AR. Contoh merek kecantikan menunjukkan bagaimana pembelajaran mesin dapat diterapkan dalam e-niaga.

Pengakuan plat nomor waktu nyata

Kasus selangkah demi selangkah membuktikan bahwa pembelajaran mesin kini tersedia untuk semua orang. Penulis memberi tahu cara memasang perangkat anggaran di rumah, membuat model, melatihnya, meletakkannya di AWS, dan juga mengembangkan bagian klien.

Menentukan polusi udara menggunakan telepon

Kasing untuk membuat aplikasi yang menentukan tingkat polusi udara dari foto dari kamera ponsel. Masalah yang perlu dipecahkan adalah melakukan crowdsource data dari pengguna yang berbeda untuk pelatihan lebih lanjut dari model, tetapi pada saat yang sama memastikan keamanan data pengguna.

Menambahkan efek volume ke gambar dua dimensi

Facebook berbagi pengalamannya dalam mengembangkan
program jaringan saraf convolutional yang menciptakan efek gambar tiga dimensi untuk gambar dua dimensi. Saat membuat, perlu untuk memecahkan banyak masalah, baik dalam melatih model dan dalam mengoptimalkan sistem untuk mendukung ponsel.



Bagaimana tidak bangkrut dengan pesatnya pertumbuhan pengguna

Bagaimana pencipta Dungeon AI ditingkatkan untuk mendukung 1 juta pengguna, dan dengan Cortex mereka membuat layanan mikro berdasarkan pada model pembelajaran mesin.

Penelitian


Menggunakan "Data Radioaktif"

Metode "Data Radioaktif" memungkinkan Anda untuk menentukan bahwa model pembelajaran mesin telah dilatih menggunakan set data tertentu. Ini dapat membantu peneliti dan insinyur melacak dataset mana yang digunakan untuk melatih model sehingga mereka dapat lebih memahami bagaimana dataset yang berbeda mempengaruhi kinerja jaringan saraf yang berbeda.

TyDi QA: kumpulan pertanyaan dan jawaban dalam berbagai bahasa

Google telah menerbitkan studi dan kumpulan data yang terdiri dari 200.000 pasangan pertanyaan dan jawaban dari 11 bahasa yang mewakili berbagai fenomena linguistik. Peserta studi diminta untuk mengajukan pertanyaan terkait berdasarkan teks, jawaban yang tidak terkandung dalam teks, setelah itu diusulkan untuk menemukan jawaban atas pertanyaan dalam artikel Wikipedia. Dan data ini menyusun dataset.

Pembuatan data buatan untuk uji klinis

Karena berbagai keterbatasan, sangat sulit untuk membuat dataset dengan foto-foto lesi kulit. Sekarang ada alat yang menghasilkan data yang diperlukan untuk pelatihan lebih lanjut. DermGAN mengambil sebagai input gambar nyata dan peta semantik pra-dihasilkan yang sesuai dengan karakteristik utama gambar nyata (jenis kulit, kondisi kulit, lokasi neoplasma), dari mana ia menghasilkan contoh sintetis baru dengan karakteristik yang diminta.

Pemindaian MRI yang Dipercepat

Tujuan dari proyek ini adalah untuk mempercepat pemindaian MRI pasien dengan 10 kali menggunakan AI. Snapshots dihasilkan menggunakan DNN dari data mentah, dan artefak sering muncul dalam proses. Studi ini menceritakan bagaimana pembelajaran mesin jahat telah membantu mengurangi jumlah mereka.

Optimalisasi infrastruktur untuk rekomendasi berdasarkan DNN

Studi ini menganalisis berbagai infrastruktur yang digunakan untuk mengeluarkan rekomendasi yang dipersonalisasi untuk produk, video, dll. Menggunakan DNN. Alat-alat juga disediakan untuk memverifikasi seberapa baik rekomendasi skala produksi berbasis-DNN bekerja. Misalnya, benchmark server Intel yang digunakan di pusat data (Broadwell, Haswell, Skylake) dilakukan.

Txt2Ο€

Tinjauan pendekatan pembelajaran penguatan baru. Ini dirancang untuk membantu menyelesaikan tugas sulit di mana agen perlu mengambil beberapa langkah berdasarkan tujuan dan pengetahuan lingkungan, yang dapat berubah. Model harus belajar bermain game di mana Anda harus mengalahkan monster berdasarkan aturan tertentu (Read to Fight Monsters).

Pelatihan CNN tentang gambar resolusi sangat tinggi

Paralelisme data dan model yang ada memungkinkan pelatihan jaringan saraf dengan miliaran parameter, tetapi pelatihan data yang terdiri dari gambar resolusi tinggi, seperti gambar CT, tetap menjadi masalah. Dalam makalah ini, kami mempertimbangkan penerapan jaringan saraf convolutional dalam gambar resolusi sangat tinggi (ada kode proyek).

Pelatihan Orientasi Peta Street View

Google mengumpulkan aplikasi dari para peneliti yang siap membantu membuat kumpulan data untuk pelatihan jaringan saraf orientasi spasial berikutnya.

T5: Alat Baru untuk Pembelajaran Transfer

Sebagai hasil dari survei skala besar, para peneliti mengidentifikasi teknik pembelajaran transfer terbaik dan menerapkan ide-ide ini untuk membuat model T5 yang telah dilatih sebelumnya , serta dataset yang menjadi tempat pelatihannya.

Dalam pemilihan bulan Maret, perkirakan artikel tentang penggunaan ML dalam perang melawan COVID-19: menentukan suhu orang secara real time oleh radiasi infra merah, mendiagnosis virus, melacak wabah epidemi, dan banyak lagi. Sementara itu, itu saja. Terimakasih atas perhatiannya!

All Articles