Buku “Pembelajaran mendalam generatif. Potensi kreatif dari jaringan saraf ”

gambarHalo, habrozhiteli! Pemodelan generatif adalah salah satu topik yang paling banyak dibahas di bidang kecerdasan buatan. Mesin dapat diajarkan untuk menggambar, menulis, dan menulis musik. Anda sendiri dapat menempatkan kecerdasan buatan di meja Anda atau kuda-kuda, untuk ini cukup berkenalan dengan contoh yang paling relevan dari model pembelajaran mendalam generatif: auto-encoder variasional, jaringan kompetitif generatif, model seperti encoder-decoder dan banyak lagi.

David Foster membuat arsitektur dan metode pemodelan generatif dapat dipahami dan diakses, tips dan triknya akan membuat model Anda lebih kreatif dan efektif dalam pelatihan. Anda akan mulai dengan dasar-dasar pelatihan mendalam berdasarkan Keras, dan kemudian beralih ke algoritma yang paling canggih.

  • Memahami bagaimana variasi penyandi otomatis mengubah emosi dalam foto.
  • Buat GAN dari awal.
  • Pelajari cara bekerja dengan model pembuatan teks generatif.
  • Temukan bagaimana model generatif membantu agen menyelesaikan tugas pembelajaran yang diperkuat.
  • Jelajahi BERT, GPT-2, ProGAN, StyleGAN, dan banyak lagi.

Tujuan dan pendekatan


Buku ini membahas metode utama yang telah mendominasi lanskap pemodelan generatif dalam beberapa tahun terakhir dan telah membuat kemajuan yang mengesankan dalam tugas-tugas kreatif. Selain mengeksplorasi teori dasar pemodelan generatif, dalam buku ini kami akan membuat contoh kerja dari beberapa model utama yang dipinjam dari literatur, dan langkah demi langkah kami akan mempertimbangkan implementasi masing-masing.

Di sepanjang buku ini, Anda akan menjumpai kisah-kisah instruktif pendek yang menjelaskan mekanisme beberapa model. Mungkin salah satu cara terbaik untuk mempelajari teori abstrak baru adalah dengan terlebih dahulu mengubahnya menjadi sesuatu yang kurang abstrak, seperti cerita, dan baru kemudian terjun ke deskripsi teknis. Bagian-bagian terpisah dari teori akan lebih dimengerti dalam konteks yang mencakup orang, tindakan dan emosi, dan tidak dalam konteks konsep yang agak abstrak seperti, katakanlah, jaringan saraf, perbanyakan punggung, atau fungsi kehilangan.

Cerita dan deskripsi model adalah metode umum untuk menjelaskan hal yang sama dari dua sudut pandang. Karena itu, ketika mempelajari suatu model, kadang-kadang akan berguna untuk kembali ke cerita yang sesuai. Jika Anda sudah terbiasa dengan trik tertentu, maka bersenang-senanglah menemukan persamaan di setiap cerita dengan setiap elemen model!

Bagian pertama buku ini menyajikan metode kunci untuk membangun model generatif, termasuk tinjauan mendalam tentang pembelajaran, autocoder variasional, dan jaringan kompetitif generatif. Pada bagian kedua, metode ini digunakan untuk memecahkan beberapa masalah kreatif (menggambar, menulis cerita dan musik) menggunakan model seperti CycleGAN, model seperti codec dan decoder dan MuseGAN. Kita akan melihat bagaimana pemodelan generatif dapat digunakan untuk mengoptimalkan strategi kemenangan gim (World Models), pertimbangkan arsitektur generatif paling canggih yang tersedia saat ini: StyleGAN, BigGAN, BERT, GPT-2 dan MuseNet.

Model Parametrik Naif Bayes


Model parametrik Bayesian yang naif menggunakan asumsi sederhana untuk secara drastis mengurangi jumlah parameter untuk dievaluasi. Kami secara naif berasumsi bahwa setiap karakteristik xj tidak tergantung pada karakteristik lain apa pun. gambarSehubungan dengan set data yang diperoleh pada Irma, ini berarti, misalnya, bahwa pilihan warna rambut tidak mempengaruhi pilihan jenis pakaian, dan pilihan jenis kacamata tidak mempengaruhi pilihan gaya rambut. Lebih formal, untuk semua tandagambar

gambar

Ini dikenal sebagai tebakan Bayesian yang naif. Untuk menerapkannya, pertama-tama kita menggunakan aturan probabilitas rantai untuk menulis fungsi kerapatan sebagai produk dari probabilitas bersyarat:

gambar

di mana K adalah jumlah total tanda (yaitu, lima dalam contoh dengan planet Irm).

Sekarang terapkan asumsi Bayesian yang naif untuk menyederhanakan baris terakhir:

gambar

Ini adalah model Bayesian yang naif. Tugasnya adalah mengevaluasi parameter gambaruntuk setiap fitur secara individual dan melipatgandakannya untuk menentukan kemungkinan kombinasi yang memungkinkan.

Berapa banyak parameter yang perlu dievaluasi dalam tugas kita? Untuk setiap karakteristik, Anda perlu mengevaluasi parameter untuk setiap nilai yang dapat diambil karakteristik ini. Oleh karena itu, dalam contoh dengan planet Irm, model ini hanya ditentukan oleh 7 + 6 + 3 + 4 + 8 - 5 = 23 parameter. Skor

kemungkinan maksimum gambardihitung sebagai

gambar

di mana gambaradalah berapa kali ketika atribut k mengambil nilai l dalam kumpulan data, dan N = 50 adalah jumlah total pengamatan.

Di meja. 1.2 menunjukkan parameter yang dihitung untuk dataset dari planet Irm. Untuk menemukan probabilitas dengan mana model akan menghasilkan beberapa pengamatan x, cukup untuk melipatgandakan probabilitas fitur individu. Contohnya:
gambar

Harap perhatikan: kombinasi ini tidak ada dalam kumpulan data asli, tetapi model kami menentukan probabilitas bukan nol untuknya, yang berarti dapat menghasilkannya. Selain itu, kemungkinan kombinasi ini lebih tinggi daripada, misalnya, (potongan rambut panjang, rambut lurus; rambut merah; kacamata bundar; kaos leher-kru; biru01), karena warna putih pakaian muncul dalam set pengamatan lebih sering daripada biru.

Artinya, model Bayesian yang naif mampu mengidentifikasi beberapa struktur data dan menggunakannya untuk membuat sampel baru yang tidak ada di set asli. Model memperkirakan probabilitas untuk memenuhi setiap nilai atribut secara independen dari yang lain, oleh karena itu, menggunakan asumsi Bayesian yang naif, probabilitas ini dapat dikalikan untuk membangun fungsi kepadatan penuhgambar

gambar

Dalam gbr. 1.8 menunjukkan 10 pengamatan yang dipilih oleh model.

Untuk tugas sederhana ini, asumsi Bayesian yang naif tentang independensi atribut adalah masuk akal dan karenanya memberikan model generatif yang baik.

Sekarang mari kita lihat apa yang terjadi jika asumsi ini ternyata salah.

gambar

Hai, Irm! Kelanjutan


Anda merasakan rasa bangga ketika melihat sepuluh kreasi baru yang diciptakan oleh model Bayesian yang naif. Didorong oleh kesuksesan Anda, Anda memperhatikan sisi lain dari tugas itu, dan kali ini tidak terlihat sederhana.

Kumpulan data dengan nama langsung Planet Pixel yang disediakan untuk Anda tidak berisi lima fitur tingkat tinggi yang Anda lihat di atas (warna rambut, jenis aksesori, dll.), Tetapi hanya 32 × 32 piksel yang membentuk setiap gambar. Artinya, setiap pengamatan sekarang memiliki 32 × 32 = 1024 tanda dan setiap tanda dapat mengambil salah satu dari 256 nilai (masing-masing warna dalam palet).

Gambar dari dataset baru ditunjukkan pada Gambar. 1.9, dan sampel nilai piksel untuk sepuluh pengamatan pertama ditunjukkan pada Tabel. 1.3.

Anda memutuskan untuk mencoba model Bayesian yang naif lagi, kali ini dilatih pada kumpulan data piksel. Model akan mengevaluasi parameter kemungkinan maksimum yang menentukan distribusi warna setiap piksel untuk menghasilkan pengamatan baru berdasarkan distribusi ini. Namun, setelah menyelesaikan model, Anda memahami bahwa ada yang salah. Alih-alih sampel mode baru, model ini mengeluarkan sepuluh gambar serupa, yang tidak dapat dibedakan antara aksesori atau tanda-tanda gaya rambut atau pakaian yang jelas (Gbr. 1.10). Kenapa bisa begitu?

gambar

gambar


tentang Penulis


David Foster adalah salah satu pendiri Applied Data Science, sebuah perusahaan konsultan data yang mengembangkan solusi khusus untuk pelanggan. Ia menerima gelar master dalam bidang matematika dari Trinity College, Cambridge, UK, dan gelar magister dalam riset operasional dari University of Warwick.

Memenangkan beberapa kontes pembelajaran mesin internasional, termasuk InnoCentive Predicting Product Purchase. Dia dianugerahi penghargaan visualisasi pertama yang memungkinkan perusahaan farmasi di Amerika Serikat untuk mengoptimalkan pilihan lokasi untuk uji klinis.

Anggota aktif komunitas online yang tertarik pada ilmu data dan penulis beberapa artikel blog pembelajaran yang sukses, termasuk"Cara Membangun AlphaZero AI Anda Sendiri Menggunakan Python dan Keras . "

»Informasi lebih lanjut tentang buku ini dapat ditemukan di situs web penerbit
» Isi
» Kutipan

Untuk Khabrozhiteley Diskon 25% pada kupon - Pembelajaran mendalam

Setelah pembayaran versi kertas buku, sebuah e-book dikirim melalui email.

All Articles