O livro “Aprendizagem profunda generativa. O potencial criativo das redes neurais ”

imagemOlá, habrozhiteli! A modelagem generativa é um dos tópicos mais discutidos no campo da inteligência artificial. As máquinas podem ser ensinadas a desenhar, escrever e compor música. Você mesmo pode colocar inteligência artificial em sua mesa ou em um cavalete, para isso é suficiente para se familiarizar com os exemplos mais relevantes de modelos de aprendizado profundo generativos: auto-codificadores variacionais, redes competitivas entre gerações, modelos como codificador-decodificador e muito mais.

David Foster torna a arquitetura e os métodos de modelagem generativa compreensíveis e acessíveis; suas dicas e truques tornarão seus modelos mais criativos e eficazes no treinamento. Você começará com o básico do treinamento detalhado baseado no Keras e depois seguirá para os algoritmos mais avançados.

  • Entenda como os codificadores automáticos de variação alteram as emoções nas fotografias.
  • Crie uma GAN do zero.
  • Aprenda a trabalhar com modelos de geração de texto generativo.
  • Descubra como os modelos generativos ajudam os agentes a concluir tarefas de aprendizado reforçadas.
  • Explora BERT, GPT-2, ProGAN, StyleGAN e outros.

Objetivos e abordagens


Este livro discute os principais métodos que dominaram o cenário da modelagem generativa nos últimos anos e fizeram um progresso impressionante nas tarefas criativas. Além de explorar a teoria básica da modelagem generativa, neste livro, criaremos exemplos práticos de alguns modelos-chave emprestados da literatura e, passo a passo, consideraremos a implementação de cada um deles.

Ao longo do livro, você encontrará pequenas histórias instrutivas que explicam a mecânica de alguns modelos. Talvez uma das melhores maneiras de estudar uma nova teoria abstrata seja primeiro transformá-la em algo menos abstrato, como uma história, e só então mergulhar em uma descrição técnica. Seções separadas da teoria serão mais compreensíveis em um contexto que inclui pessoas, ações e emoções, e não no contexto de conceitos bastante abstratos, como, por exemplo, redes neurais, retropropagação ou funções de perda.

A história e a descrição do modelo são um método comum de explicar a mesma coisa de dois pontos de vista. Portanto, ao estudar um modelo, às vezes será útil retornar à história correspondente. Se você já conhece um truque específico, divirta-se descobrindo paralelos em cada história com cada elemento do modelo!

A primeira parte do livro apresenta os principais métodos para a construção de modelos generativos, incluindo uma visão geral do aprendizado profundo, autocoders variacionais e redes competitivas entre gerações. Na segunda parte, esses métodos são usados ​​para resolver vários problemas criativos (desenho, composição de histórias e música) usando modelos como o CycleGAN, modelos como codec e decodificador e MuseGAN. Veremos como a modelagem generativa pode ser usada para otimizar a estratégia vencedora do jogo (World Models), considerando as arquiteturas generativas mais avançadas disponíveis hoje: StyleGAN, BigGAN, BERT, GPT-2 e MuseNet.

Modelo Paramétrico Naive Bayes


O modelo paramétrico bayesiano ingênuo usa uma suposição simples para reduzir drasticamente o número de parâmetros a serem avaliados. Ingenuamente, assumimos que cada característica xj não depende de nenhuma outra característica. imagemCom relação ao conjunto de dados obtido no Irma, isso significa, por exemplo, que a escolha da cor do cabelo não afeta a escolha do tipo de roupa, e a escolha do tipo de óculos não afeta a escolha do penteado. Mais formalmente, para todos os sinaisimagem

imagem

Isso é conhecido como um palpite bayesiano ingênuo. Para aplicá-lo, primeiro usamos a regra de probabilidade da cadeia para escrever a função de densidade como um produto de probabilidades condicionais:

imagem

onde K é o número total de sinais (ou seja, cinco no exemplo do planeta Irm).

Agora aplique a premissa bayesiana ingênua para simplificar a última linha:

imagem

Este é um modelo bayesiano ingênuo. A tarefa é avaliar os parâmetros imagempara cada recurso individualmente e multiplicá-los para determinar a probabilidade de qualquer combinação possível.

Quantos parâmetros precisam ser avaliados em nossa tarefa? Para cada característica, é necessário avaliar o parâmetro para cada valor que essa característica pode assumir. Portanto, no exemplo do planeta Irm, esse modelo é determinado por apenas 7 + 6 + 3 + 4 + 8 - 5 = 23 parâmetros.

A imagempontuação máxima de verossimilhança é calculada como

imagem

onde imagemé o número de vezes que o atributo k assume o valor l no conjunto de dados e N = 50 é o número total de observações.

Na mesa. 1.2 mostra os parâmetros calculados para um conjunto de dados do planeta Irm. Para encontrar a probabilidade com a qual o modelo irá gerar alguma observação x, basta multiplicar as probabilidades de características individuais. Por exemplo:
imagem

Observe: essa combinação está ausente no conjunto de dados original, mas nosso modelo determina uma probabilidade diferente de zero, o que significa que pode gerá-lo. Além disso, a probabilidade dessa combinação é maior do que, por exemplo, (corte de cabelo longo, cabelos lisos; ruiva; óculos redondos; camiseta com gola alta; blue01), porque a cor branca da roupa aparece na observação mais frequentemente do que o azul.

Ou seja, o ingênuo modelo bayesiano é capaz de identificar alguma estrutura de dados e usá-la para criar novas amostras que não estão no conjunto original. O modelo estimou a probabilidade de atingir cada valor de atributo independentemente dos outros, portanto, usando a ingênua Bayesiana, essas probabilidades podem ser multiplicadas para construir a função de densidade total,imagem

imagem

Na fig. 1.8 mostra 10 observações selecionadas pelo modelo.

Para esta tarefa simples, a ingênua bayesiana ingênua de independência de atributos é razoável e, portanto, fornece um bom modelo generativo.

Agora vamos ver o que acontece se essa suposição for errada.

imagem

Oi Irmão! Continuação


Você sente certo orgulho quando olha para dez novas criações criadas por seu ingênuo modelo bayesiano. Encorajados pelo seu sucesso, você presta atenção ao outro lado da tarefa e, desta vez, não parece tão simples.

O conjunto de dados com o nome direto de Planet Pixel fornecido a você não contém os cinco recursos de alto nível que você viu acima (cor do cabelo, tipo de acessório etc.), mas apenas os 32 × 32 pixels que compõem cada imagem. Ou seja, cada observação agora possui 32 × 32 = 1024 sinais e cada sinal pode assumir qualquer um dos 256 valores (cores individuais na paleta).

As imagens do novo conjunto de dados são mostradas na Fig. 1.9, e uma amostra dos valores de pixel para as dez primeiras observações é mostrada na Tabela. 1.3

Você decide tentar o modelo Bayesiano ingênuo novamente, desta vez treinado em um conjunto de dados de pixel. O modelo avaliará os parâmetros de probabilidade máxima que determinam a distribuição de cores de cada pixel para gerar novas observações com base nessa distribuição. No entanto, depois de concluir o modelo, você entende que algo deu errado. Em vez de novas amostras de moda, o modelo trouxe dez imagens semelhantes, nas quais nem acessórios nem sinais claros de penteado ou roupa podem ser distinguidos (Fig. 1.10). Por que isso aconteceu?

imagem

imagem


Sobre o autor


David Foster é co-fundador da Applied Data Science, uma empresa de consultoria em dados que desenvolve soluções personalizadas para os clientes. Ele obteve um mestrado em matemática pelo Trinity College, Cambridge, Reino Unido, e um mestrado em pesquisa operacional pela Universidade de Warwick.

Ganhou vários concursos internacionais de aprendizado de máquina, incluindo o InnoCentive Predicting Product Purchase. Ele recebeu o primeiro prêmio de visualização que permitiu a uma empresa farmacêutica nos Estados Unidos otimizar a escolha do local para os ensaios clínicos.

Membro ativo de comunidades online interessadas em ciência de dados e autor de vários artigos bem-sucedidos do blog de aprendizado profundo, incluindo"Como criar sua própria IA AlphaZero usando Python e Keras . "

»Mais informações sobre o livro podem ser encontradas no site da editora
» Conteúdo
» Trecho

Para Khabrozhiteley desconto de 25% no cupom - Aprendizado profundo

Após o pagamento da versão impressa do livro, um e-livro é enviado por e-mail.

All Articles