Uma seleção de artigos sobre aprendizado de máquina: casos, guias e estudos para maio de 2020


Continuamos a coletar para você as notícias e ferramentas mais interessantes do campo de aprendizado de máquina, escritas em um idioma acessível.

Jukebox

No início deste mês, o OpenAI despertou grande interesse na comunidade de ML ao publicar o código-fonte do seu projeto chamado Jukebox. Essa ferramenta usando algoritmos de aprendizado de máquina permite gerar composições de artistas populares. Na rede você já pode encontrar exemplos de faixas geradas pelos usuários, existem combinações muito incomuns.

AR Copy paste

O desenvolvedor francês Cyril Diagne introduziu um aplicativo de AR que tira fotos de objetos, remove todo o fundo desnecessário das imagens e (usando U ^ 2-Net) transfere o resultado para programas em execução no computador. Por exemplo, o autor mostra como, usando o aplicativo, você pode selecionar e adicionar ilustrações rapidamente a uma apresentação. Você já pode ver o código e se inscrever para acessar antecipadamente o aplicativo, que está atualmente em desenvolvimento.



Pose Animator

Uma ferramenta de código aberto para animações da web com a qual você pode animar caracteres desenhados no SVG. A ferramenta é baseada em duas outras bibliotecas Facemesh e PoseNet , que usam uma webcam para capturar movimentos. O artigo mostra como a ferramenta foi criada e demonstra como usá-la.



Galaxy zoo

Um estudo de caso sobre como combinar com sucesso o crowdsourcing e o aprendizado de máquina para processar rapidamente informações complexas. A plataforma Galaxy Zoo combinou essas duas abordagens para estudar a evolução das galáxias, classificando milhões de imagens. O material descreve como marcar apenas os dados que melhor ajudarão a melhorar o modelo existente.

O DistilBERT

Startup Hugging Face compartilha sua experiência na criação de uma API pública com a qual você pode otimizar o desempenho dos modelos de PNL no Node.js.

Analisador de Ensaios Clínicos

A maioria dos ensaios clínicos falha ao recrutar participantes suficientes. Isto é devido ao fato de que as pessoas sem mel. A educação nem sempre entende os critérios de seleção e os detalhes da pesquisa. Introduzido no Facebookferramenta de código aberto que visa solucionar esse problema.

O

Facebook da GrokNet anunciou um sistema universal de visão computacional projetado para comércio eletrônico. Ela é capaz de identificar os atributos dos produtos em diferentes categorias, do automóvel à decoração da casa. O artigo descreve como o modelo foi treinado em sete conjuntos de dados e quais as dificuldades encontradas. Uma série de vídeos também mostra como esse modelo ajudará a plataforma a mudar o comércio on-line.

S2IGAN

Parece que prometemos não incluir materiais que contenham links para repositórios vazios na coleção, mas quero fazer uma exceção. S2IGAN é uma estrutura que traduz fala em imagens. Usando um codificador duplo, foi criado um modelo que gera imagens usando uma descrição de voz. Os autores do estudo prometem publicar o código em breve, mas, por enquanto, devem se contentar com exemplos de aves geradas.



Estimativa consistente da profundidade do vídeo

É apresentado um algoritmo que, usando uma rede neural convolucional, determina a profundidade de quadros individuais e restaura uma profundidade geometricamente consistente para todo o vídeo. Isso ajuda a lidar com várias limitações, por exemplo, quando a imagem é instável devido a trepidação. Você pode aplicar uma tecnologia semelhante em vários campos, para efeitos de RA ou carros de piloto automático. O repositório ainda está vazio, mas os autores prometem compartilhar o código-fonte.

Isso é tudo, obrigado por assistir!

All Articles