Uma seleção de artigos sobre aprendizado de máquina: casos, guias e estudos para fevereiro de 2020



Após o post de janeiro, conheça a segunda edição do resumo. Aqui você encontrará uma lista de materiais em inglês para fevereiro, escritos sem acadêmicos indevidos. As publicações contêm exemplos de código e links para repositórios não vazios. As tecnologias mencionadas são de domínio público e muitas delas não requerem ferro para serviços pesados ​​para testes.

Os artigos estão divididos em quatro tipos:
Anúncios de ferramentas de código aberto e conjuntos de dados
Guias práticos para PyTorch e TensorFlow
Estudos de caso de pesquisa de ML de aprendizado de máquina



Anúncios de ferramentas de código aberto


ClearGrasp

O algoritmo foi projetado para resolver o problema de reconhecimento de objetos transparentes que refletem e refratam de maneira desigual. Qualquer câmera RGB-D padrão é adequada para o trabalho.

O

Facebook do PyTorch3D anunciou uma biblioteca altamente modular e otimizada para o PyTorch , que simplifica o treinamento profundo dos modelos em imagens tridimensionais.

Hydra A

nova estrutura do ecossistema PyTorch, projetada para resolver problemas associados à complexidade dos projetos. Fornece recursos de gerenciamento de projetos por meio da linha de comando e dos arquivos de configuração.

TensorFlow.js para React Native

A ferramenta não usa a visualização da web para renderização e não depende da API das plataformas da web usadas no navegador. Portanto, é uma nova plataforma de integração com um back-end adequado para esse ambiente.

Operador de compactação de matriz

O operador permite que você use qualquer função de compactação de matriz definida como fatoração e crie uma API de fluxo tensorial para aplicar dinamicamente essa compactação enquanto aprende qualquer variável de fluxo tensorial.

A Torchmeta Meta-Learning

Library fornece uma interface única para diferentes conjuntos de dados para simplificar a criação de novos algoritmos.

Fluxo automático

Muitas vezes você deseja alterar a orientação da tela de horizontal (16: 9 ou 4: 3) para vertical. Finalmente, o quadro apareceu, o que ajuda a cortar quadros dinamicamente com perda mínima. A ferramenta determina os limites do quadro e dos objetos em movimento, deixando apenas o mais importante na tela. Ferramenta de



biblioteca de otimização restrita

para TensorFlow , que permite reduzir o grau de resultados desonestos ao solucionar problemas do mundo real, quando muitos parâmetros adicionais são levados em consideração (por exemplo, ao emitir empréstimos bancários). A ferramenta converte algoritmicamente as restrições de amostragem de dados em um jogo de soma zero para dois jogadores.

Mapas de Poincare

usando a ferramenta de geometria hiperbólicarevela as relações hierárquicas das semelhanças aos pares de várias células. Isso permite o uso de aprendizado de máquina para mapear e analisar o desenvolvimento de células de organismos.

PyTorch Lightning + Torchbearer

Os criadores da abstração de alto nível Torchbearer uniram forças com a crescente popularidade do PyTorch Lightning e agora estão trabalhando em sua equipe. A abstração automatiza o desenvolvimento, torna o código padronizado, mantido e escalável. Assim, para que os pesquisadores possam se concentrar mais na ciência, em vez de trabalhar com uma base de código.

Imagens abertas v6

Foi lançada a sexta versão do conjunto de dados Open Images, na qual o tipo de marcação e comentário nas imagens foi significativamente expandido. As capturas de fotografias são tão detalhadas que também afetam o desenvolvimento de pesquisas interdisciplinares, onde a visão por computador é combinada com o processamento de linguagem natural.

CCMatrix: um conjunto de dados para o treinamento de modelos de tradução O

conjunto de dados consiste em 4,5 bilhões de frases bittext em 576 pares de idiomas e ajudará na criação de modelos NMT mais avançados.

Guias


Método de componente principal distribuído usando TFX

Como o TensorFlow Transform permite aplicar o método de componente principal em um formato escalável usando os recursos de clusters de computação e como habilitar o processamento de transformações em um pipeline TFX.

Acelerando as redes neurais usando o TensorNetwork em Keras

Material sobre como usar a biblioteca TensorNetwork para processar redes de tensores no contexto do aprendizado de máquina.

Estrutura TensorFlow: Aprendizado de Máquina Flexível, Controlado e Interpretado Uma

visão geral introdutória dos recursos da biblioteca para ensinar modelos de estrutura limitados e interpretados.

Estojos


Máscaras de AR com TensorFlow.js

Comprado pela Loreal, a inicialização do ModiFace compartilha sua experiência de usar o aprendizado de máquina no contexto de máscaras de AR. O exemplo de uma marca de beleza mostra como o aprendizado de máquina pode ser aplicado no comércio eletrônico.

Reconhecimento de placas em tempo real Um

caso passo a passo prova que o aprendizado de máquina está agora disponível para todos. O autor explica como montar um dispositivo de orçamento em casa, criar um modelo, treiná-lo, colocá-lo na AWS e também desenvolver uma peça do cliente.

Determinando a poluição do ar usando um telefone

Caso para criar um aplicativo que determina o nível de poluição do ar de uma foto da câmera do telefone. O problema que precisava ser resolvido era o crowdsource de dados de diferentes usuários para treinamento adicional do modelo, mas ao mesmo tempo garantir a segurança dos dados do usuário.

Adicionando um efeito de volume às imagens bidimensionais O

Facebook compartilha sua experiência no desenvolvimento de um
programa de rede neural convolucional que cria um efeito de imagem tridimensional para imagens bidimensionais. Ao criar, foi necessário resolver muitos problemas, tanto no treinamento do modelo quanto na otimização do sistema para suportar telefones celulares.



Como não ir à falência com o rápido crescimento dos usuários

Como os criadores do Dungeon AI evoluíram para dar suporte a 1 milhão de usuários e, com o Cortex, eles fizeram um microsserviço baseado em um modelo de aprendizado de máquina.

Pesquisa


Utilizando “Dados Radioativos”

O método “Dados Radioativos” permite determinar que um modelo de aprendizado de máquina foi treinado usando um conjunto de dados específico. Isso pode ajudar pesquisadores e engenheiros a acompanhar qual conjunto de dados foi usado para treinar o modelo, para que eles possam entender melhor como diferentes conjuntos de dados afetam o desempenho de diferentes redes neurais.

Controle de qualidade do TyDi: um conjunto de dados de perguntas e respostas em diferentes idiomas

O Google publicou um estudo e conjuntos de dados que consistem em 200.000 pares de perguntas e respostas de 11 idiomas, representando uma ampla variedade de fenômenos linguísticos. Os participantes do estudo foram convidados a fazer uma pergunta relacionada com base no texto, cuja resposta não está contida no texto, após o que foi proposto encontrar a resposta para a pergunta no artigo da Wikipedia. E esses dados compilaram um conjunto de dados.

Criação artificial de conjuntos de dados para ensaios clínicos

Devido a várias limitações, é muito difícil criar conjuntos de dados com fotografias de lesões de pele. Agora, existe uma ferramenta que gera os dados necessários para treinamento adicional. O DermGAN toma como entrada a imagem real e o mapa semântico pré-gerado correspondente, com as principais características da imagem real (tipo de pele, condição da pele, localização da neoplasia), a partir da qual gera um novo exemplo sintético com as características solicitadas.

Ressonância Magnética Acelerada

O objetivo do projeto é acelerar a ressonância magnética de pacientes em 10 vezes usando IA. As capturas instantâneas são geradas usando DNN a partir de dados brutos, e os artefatos geralmente aparecem no processo. O estudo mostra como o aprendizado de máquina malicioso ajudou a reduzir seus números.

Otimização da infraestrutura para recomendações baseadas no DNN O

estudo analisa várias infraestruturas usadas para emitir recomendações personalizadas para produtos, vídeos etc. usando o DNN. Também são fornecidas ferramentas para verificar se as recomendações de escala de produção baseadas em DNN funcionam. Por exemplo, é realizada uma referência dos servidores Intel usados ​​em data centers (Broadwell, Haswell, Skylake).

Txt2π

Uma revisão da nova abordagem de aprendizado por reforço. Ele foi projetado para ajudar a resolver uma tarefa difícil na qual o agente precisa executar várias etapas com base no objetivo e no conhecimento do ambiente, que pode mudar. O modelo deve aprender a jogar um jogo em que você precisa derrotar monstros com base em certas regras (Leia para combater monstros).

Treinamento da CNN em imagens de resolução ultra-alta

Os métodos existentes de paralelismo de dados e modelos treinam redes neurais com bilhões de parâmetros, mas o treinamento em dados que consistem em imagens de alta resolução, como imagens de TC, continua sendo um problema. Neste artigo, consideramos a aplicabilidade de redes neurais convolucionais em imagens de resolução ultra-alta (existe um código de projeto).

Street View Map Treinamento de Orientação

O Google coleta aplicativos de pesquisadores que estão prontos para ajudar a criar um conjunto de dados para o treinamento subsequente de redes neurais de orientação espacial.

T5: Uma nova ferramenta para aprendizado de transferência

Como resultado de uma pesquisa em larga escala, os pesquisadores identificaram as melhores técnicas de aprendizado de transferência e aplicaram essas idéias para criar o modelo T5 pré- treinado , bem como o conjunto de dados no qual ele foi treinado.

Na seleção de março, espere artigos sobre o uso de ML na luta contra o COVID-19: determinando a temperatura das pessoas em tempo real por radiação infravermelha, diagnosticando o vírus, rastreando surtos da epidemia e muito mais. Enquanto isso, é tudo. Obrigado pela atenção!

All Articles