Uma seleção de artigos sobre aprendizado de máquina: estudos de caso, guias e pesquisas para janeiro de 2020

O trabalho de pesquisa no campo do aprendizado de máquina está gradualmente saindo dos laboratórios da universidade e a partir da disciplina científica é aplicada. No entanto, ainda é difícil encontrar artigos relevantes escritos em linguagem simples e sem um bilhão de notas de rodapé.

Este post contém uma lista de materiais em inglês para janeiro, escritos sem acadêmicos indevidos. Neles, você encontrará exemplos de código e links para repositórios não vazios . As tecnologias mencionadas são de domínio público e não requerem ferro pesado para testes.

Os artigos são divididos em quatro tipos: anúncios de ferramentas de código aberto, casos de uso de aprendizado de máquina no desenvolvimento comercial, pesquisa de ML e diretrizes práticas para o uso do PyTorch e TensorFlow.



Anúncios de tecnologia de código aberto para aprendizado de máquina


LaserTagger

O artigo discute brevemente a funcionalidade e a arquitetura do LaserTagger ; uma ferramenta que permite gerar texto de várias maneiras - para combinar e dividir frases, além de recontá-las em outras palavras. Ao contrário dos modelos seq2seq, ele reutiliza palavras, o que garante alta velocidade de geração de texto.

Reformador

Para processar dados seriais - texto, música ou vídeo - é necessário um grande recurso de memória, pois esses dados dependem do contexto circundante. Ao contrário do Transformer, um modelo de arquitetura popular para redes neurais, o Reformerconsome muito menos memória para manter o contexto - apenas 16 GB. Isso é suficiente para trabalhar com grandes conjuntos de dados de texto - o Reformer, por exemplo, conseguiu processar o texto "Crime e Castigo". Você também pode usar a ferramenta para "finalizar" os fragmentos de imagem ausentes.

Wav2letter @ qualquer lugar

A maioria das estruturas de reconhecimento de fala em tempo real usa redes neurais recorrentes, enquanto Wav2letter @ qualquer lugarusa modelo acústico convolucional. A estrutura é escrita em C ++ e é facilmente integrada a outras linguagens de programação. Os criadores conseguiram aumentar a taxa de transferência três vezes e fornecer eficiência computacional em processadores não muito potentes. O artigo fornece referências e links para modelos que ajudarão a repetir os resultados da aprendizagem.

Polygames Uma

estrutura que ensina inteligência artificial a jogar jogos de estratégia, mesmo os completamente desconhecidos. Ao contrário de outras tecnologias semelhantes, este modelo não aprende com vários exemplos de gerenciamento bem-sucedido de jogos, portanto, não requer conjuntos de dados. Ferramenta

HiPlot

para visualizar dados de pesquisa. Permite avaliar a eficácia dos hiperparâmetros, como velocidade de aprendizado, regularização e arquitetura. O artigo fornece trechos de código python e exemplos de suas visualizações. O HiPlot é suportado pelo Jupiter Notebook.

Guias de aprendizado de máquina



TensorFlow.js A

biblioteca de código aberto permite executar modelos de aprendizado de máquina sem sair do ecossistema JS. Ele funciona em todos os navegadores atuais, no lado do servidor no Node.js e nas plataformas móveis no React Native.

Criando um componente TFX personalizado

Qualquer pessoa pode usar a plataforma TFX para criar pipelines de aprendizado de máquina prontos para uso. A plataforma oferece uma tonelada de componentes padrão, mas há momentos em que eles não são adequados. Este artigo fala sobre como criar um pipeline totalmente personalizado para trabalhar com o TensorFlow.

Acelere o NVIDIA Dali com o PyTorch

O artigo discute algumas maneiras de otimizar o uso do DALI e criar um processo que usa apenas a CPU (sem uma GPU) e acelera o processo de aprendizado de máquina no PyTorch em quatro vezes.

Controle de versão de dados e modelos para experimentação rápida no aprendizado de máquina Este

artigo descreve como criar e usar conjuntos de dados com versão para um processo de aprendizado de máquina reproduzível. Como exemplo, usando Git, Docker e Quilt, uma rede neural profunda é criada para reconhecimento de objetos usando o Detectron2, um sistema baseado em PyTorch que usa algoritmos para reconhecimento de objetos.

Treinamento de transferência ativa no PyTorch

O treinamento de transferência é um processo quando um modelo de aprendizado de máquina criado para uma tarefa específica se adapta a outra tarefa. Geralmente, basta treinar novamente as últimas camadas em um modelo existente. A vantagem é que isso requer rotulagem mínima de dados por seres humanos. Este artigo fornece orientações sobre a aplicação de transferência de aprendizado para aprendizado ativo, que visa identificar padrões de dados que precisam ser rotulados por pessoas.

Casos de desenvolvimento comercial


Criando uma biblioteca de música inteligente com o TensorFlow Os

desenvolvedores da principal plataforma de streaming de música da China compartilham sua experiência usando a estrutura. Eles contam em detalhes quais instrumentos foram usados, como treinaram o modelo para determinar o gênero e o estilo da música para recomendações subsequentes. Separe a voz da música, por exemplo, para produzir a letra de uma música usando o reconhecimento de texto. Como parte do conteúdo da plataforma foi gravada por usuários sem equipamento especial de gravação de som, os autores aprenderam a eliminar a interferência e o ruído de fundo.

Treinamento de cães com aprendizado de máquina

Cães obedientes que conhecem a equipe têm maior probabilidade de encontrar novos donos e deixar o abrigo. No entanto, nem todos os abrigos têm a capacidade de treinar cães. O objetivo do projeto é treinar o carro para entender se o cão completou o comando "Sentar-se", latir ou lamentar-se, etc.

Treinamento de um aspirador de pó Um

fabricante chinês de aspiradores de pó inteligentes treinou dispositivos para reconhecer meias e fios espalhados pelo chão. Case fala sobre as dificuldades de criar um conjunto de dados exclusivo a partir de fotografias e usar vários algoritmos de aprendizado de máquina.

Crie uma câmera inteligente usando o TensorFlow Lite no Raspberry Pi

A câmera pode detectar um sorriso no rosto de uma pessoa e tirar uma foto automaticamente. Ela pode ser controlada por comandos de voz. Para o desenvolvimento, escolhemos o Raspberry Pi 3B +, com um gigabyte de RAM e um sistema operacional de 32 bits. O TensorFlow Light se estabeleceu como uma estrutura para dispositivos móveis e IoT. O artigo demonstra os algoritmos do sistema de reconhecimento de sorrisos e comandos de voz.

Pesquisa


Rede neural para resolver equações matemáticas O

Facebook desenvolveu a primeira rede neural que usa lógica simbólica para resolver equações integrais e diferenciais do primeiro e do segundo tipo. Antes, o aprendizado de máquina não era adequado para essa tarefa, pois a matemática exige precisão absoluta, não aproximada. Os autores do estudo utilizaram tradução automática neural. As equações foram percebidas pela máquina como sentenças de texto e soluções como sua tradução. Para isso, foi necessário compilar a sintaxe e preparar um conjunto de dados de treinamento de mais de 100 milhões de equações de pares e suas soluções. Assim, o estudo mostra que as redes neurais podem ser usadas não apenas para distinguir entre padrões.

Habitat de IA: navegação ultra-precisa A IA no espaço do

Facebook desenvolveu um algoritmo de aprendizado de reforço de DD-PPO em larga escala que lida efetivamente com a navegação no espaço de residências e escritórios, usando dados da câmera RGB-D, GPS e bússola. Os robôs treinados com DD-PPO atingem seu objetivo com precisão de 99,9%. O artigo contém vídeos impressionantes.

Você pode confiar nas incertezas do seu modelo? Código

publicado e resultados de pesquisa, que enfoca o problema do deslocamento covariante, quando os dados para o treinamento do modelo não coincidem com a amostra de teste. Os autores realizaram uma extensa análise comparativa dos modelos mais avançados, fornecendo a eles conjuntos de dados de texto, imagens, publicidade on-line e genômica. O objetivo era determinar a precisão dos métodos populares. Nos benchmarks, o método ensemble provou ser o mais confiável.

Obrigado pela atenção!

Antes de você ter uma versão de avaliação, todas as recomendações são bem-vindas.

Source: https://habr.com/ru/post/undefined/


All Articles