「ジェネレーティブディープラーニング。ニューラルネットワークの創造的な可能性」

画像こんにちは、habrozhiteli!生成モデリングは、人工知能の分野で最も議論されているトピックの1つです。機械は、音楽を描いたり、書いたり、作ったりするように教えることができます。自分で机やイーゼルに人工知能を置くことができます。これは、生成ディープラーニングモデルの最も関連性の高い例(変分オートエンコーダー、生成競合ネットワーク、エンコーダーデコーダーなどのモデルなど)に慣れるのに十分です。

デビッドフォスターは生成モデリングのアーキテクチャと方法を理解しやすく、アクセスしやすくします。彼のヒントとコツは、モデルをより創造的で効果的なトレーニングにしてくれます。Kerasに基づく詳細なトレーニングの基本から始め、次に最も高度なアルゴリズムに進みます。

  • バリエーションオートエンコーダーが写真の感情をどのように変化させるかを理解します。
  • 最初からGANを作成します。
  • 生成テキスト生成モデルの操作方法を学びます。
  • 生成モデルがエージェントが強化された学習タスクを完了するのをどのように支援するかを発見してください。
  • BERT、GPT-2、ProGAN、StyleGANなどを探索します。

目標とアプローチ


この本は、近年の生成モデリングの状況を支配し、創造的なタスクにおいて印象的な進歩を遂げた主要な方法について説明しています。この本では、生成モデリングの基本理論を探求することに加えて、文献から借用したいくつかの主要なモデルの実例を作成し、段階的にそれらのそれぞれの実装を検討します。

本を通して、あなたはいくつかのモデルの力学を説明する短い有益な物語に出くわすでしょう。おそらく、新しい抽象理論を研究する最良の方法の1つは、まずそれをストーリーなどの抽象的なものに変換してから、技術的な説明に突入することです。理論の個別のセクションは、人、行動、および感情を含むコンテキストでは理解しやすくなります。たとえば、ニューラルネットワーク、逆伝播、損失関数などの比較的抽象的な概念のコンテキストでは理解できません。

モデルのストーリーと説明は、同じことを2つの観点から説明する一般的な方法です。したがって、モデルを学習するとき、対応するストーリーに戻ると役立つ場合があります。特定のトリックにすでに慣れている場合は、モデルの各要素を持つ各ストーリーの類似点を見つけてください。

この本の最初の部分では、ディープラーニング、変分オートコーダー、生成的競争ネットワークの概要など、生成的モデルを構築するための主要な方法を紹介しています。第2部では、これらの方法は、CycleGANなどのモデル、コーデックやデコーダなどのモデル、MuseGANを使用して、いくつかの創造的な問題(描画、ストーリーや音楽の作成)を解決するために使用されます。ジェネレーティブモデリングを使用してゲームの勝利戦略(世界モデル)を最適化する方法を確認し、現在利用可能な最も先進的なジェネレーティブアーキテクチャ(StyleGAN、BigGAN、BERT、GPT-2、MuseNet)を検討します。

単純ベイズパラメトリックモデル


単純なベイジアンパラメトリックモデルは、単純な仮定を使用して、評価するパラメーターの数を大幅に減らします。各特性xjは画像、Irmaで取得されたデータセットに関して他の特性に依存しないと単純に仮定します。これは、たとえば、髪の色の選択が衣類の種類の選択に影響せず、眼鏡の種類の選択が髪型の選択に影響しないことを意味します。より正式には、すべての標識画像

画像

これは、単純ベイズ推定として知られています。これを適用するには、まずチェーン確率ルールを使用して、密度関数を条件付き確率の積として記述します。

画像

ここで、Kは標識の総数です(つまり、惑星Irmの例では5)。

次に、単純なベイズ仮定を適用して、最後の行を簡略化します。

画像

これは単純なベイジアンモデルです。タスクは画像、各機能のパラメーターを個別に評価し、それらを乗算して、可能な組み合わせの確率を決定することです。

タスクでいくつのパラメータを評価する必要がありますか?各特性について、この特性が取り得る各値のパラメータを評価する必要があります。したがって、惑星Irmの例では、このモデルは7 + 6 + 3 + 4 + 8-5 = 23のパラメーターのみで決定されます。

最尤画像スコアは次のように計算されます

画像

ここで、画像属性kはデータセット内の値Lをとり、N = 50で観測の総数である回数です。

テーブルの中。 1.2は、惑星Irmからのデータセットの計算されたパラメーターを示しています。モデルが観測値xを生成する確率を見つけるには、個々の特徴の確率を乗算するだけで十分です。例えば:
画像

注:この組み合わせは元のデータセットにはありませんが、モデルではそれをゼロ以外の確率で決定するため、生成できます。さらに、この組み合わせの確率は、たとえば(長い髪のカット、ストレートの髪、赤毛、丸いメガネ、クルーネックのTシャツ、blue01)よりも高くなります。これは、服の色が青よりも観測セットに現れる頻度が高いためです。

つまり、単純なベイジアンモデルは、いくつかのデータ構造を識別し、それを使用して、元のセットにない新しいサンプルを作成できます。モデルは、他の属性値とは無関係に各属性値を満たす確率を推定しました。したがって、単純なベイジアン仮定を使用して、これらの確率を乗算して完全な密度関数を構築できます。画像

画像

図では 1.8は、モデルによって選択された10個の観測値を示しています。

この単純なタスクでは、属性の独立性の素朴なベイズ仮定は合理的であり、したがって、優れた生成モデルを提供します。

次に、この仮定が誤っていることが判明した場合にどうなるかを見てみましょう。

画像

こんにちは!継続


素朴なベイジアンモデルによって作成された10個の新しい作品を見ると、ある程度の誇りを感じます。あなたの成功に勇気づけられて、あなたは仕事の反対側に注意を払います、そして今度はそれはそれほど単純に見えません。

提供された単純な名前Planet Pixelのデータセットには、上記で見た5つの高度な機能(髪の色、アクセサリーのタイプなど)は含まれていませんが、各画像を構成する32×32ピクセルの値のみが含まれています。つまり、各観測には32×32 = 1024の符号があり、各符号は256の値のいずれかを取ることができます(パレットの個々の色)。

新しいデータセットの画像を図5に示します。 1.9、および最初の10個の観測のピクセル値のサンプルを表に示します。 1.3。

単純なベイジアンモデルをもう一度試すことにしました。今回はピクセルデータセットでトレーニングしました。モデルは、この分布に基づいて新しい観測を生成するために、各ピクセルの色分布を決定する最尤パラメーターを評価します。ただし、モデルを完了すると、問題が発生したことがわかります。新しいファッションサンプルの代わりに、モデルは10の類似した画像を作成しましたが、髪型や衣服のアクセサリーや明確な兆候は区別できません(図1.10)。なぜそうなったのですか?

画像

画像


著者について


David Fosterは、顧客向けにカスタマイズされたソリューションを開発するデータコンサルティング会社であるApplied Data Scienceの共同創設者です。イギリスのケンブリッジにあるトリニティカレッジで数学の修士号を取得し、ウォリック大学で運用研究の修士号を取得しています。

InnoCentive Predicting Product Purchaseなど、いくつかの国際的な機械学習コンテストで優勝しました。彼は、米国の製薬会社が臨床試験の場所の選択を最適化できる最初の視覚化賞を受賞しました。

データサイエンスに関心のあるオンラインコミュニティのアクティブなメンバーであり、ディープラーニングに関する成功したブログ記事をいくつか執筆しています。"PythonとKerasを使用して独自のAlphaZero AIを構築する方法"

»本の詳細については、出版社のWebサイトを参照してください。
» 目次
» 抜粋

ハブロジテリーの場合クーポンの25%割引- ディープラーニング

紙の本を支払うと、電子メールが電子メールで送信されます。

All Articles