Une sélection d'articles sur l'apprentissage automatique: cas, guides et études pour mai 2020


Nous continuons à collecter pour vous les nouvelles et les outils les plus intéressants du domaine de l'apprentissage automatique, écrits dans un langage accessible.

Jukebox

Plus tôt ce mois-ci, OpenAI a suscité un grand intérêt dans la communauté ML en publiant le code source de son projet appelé Jukebox. Cet outil utilisant des algorithmes d'apprentissage automatique vous permet de générer des compositions d'artistes populaires. Sur le réseau, vous pouvez déjà trouver des exemples de pistes générées par les utilisateurs, il existe des combinaisons très inhabituelles.

AR Copy paste

Le développeur français Cyril Diagne a présenté une application AR qui prend des photos d'objets, supprime tout arrière-plan inutile des images et (en utilisant U ^ 2-Net) transfère le résultat aux programmes exécutés sur l'ordinateur. Par exemple, l'auteur montre comment, en utilisant l'application, vous pouvez rapidement sélectionner et ajouter des illustrations à une présentation. Vous pouvez déjà consulter le code et vous inscrire pour un accès anticipé à l'application, qui est actuellement en cours de développement.



Pose Animator

Un outil open source pour les animations Web avec lequel vous pouvez animer des personnages dessinés en SVG. L'outil est basé sur deux autres bibliothèques Facemesh et PoseNet , qui utilisent une webcam pour capturer les mouvements. L'article montre comment l'outil a été créé et montre comment l'utiliser.



Zoo Galaxy

Une étude de cas sur la façon de combiner avec succès le crowdsourcing et l'apprentissage automatique pour traiter rapidement des informations complexes. La plateforme Galaxy Zoo a combiné ces deux approches pour étudier l'évolution des galaxies en classant des millions d'images. Le matériel décrit comment marquer uniquement les données qui aideront le mieux à améliorer le modèle existant.

DistilBERT

Startup Hugging Face partage son expérience dans la création d'une API publique avec laquelle vous pouvez optimiser les performances des modèles NLP sur Node.js.

Analyseur

d'essais cliniques La plupart des essais cliniques ne recrutent pas suffisamment de participants. Cela est dû au fait que les personnes sans miel. L'éducation ne comprend pas toujours les critères de sélection et les détails de la recherche. Facebook a introduitoutil open source qui vise à résoudre ce problème.

GrokNet

Facebook a annoncé un système de vision par ordinateur universel conçu pour le commerce électronique. Elle est capable d'identifier les attributs des produits dans différentes catégories, de l'automobile à la décoration intérieure. L'article décrit comment le modèle a été formé sur sept ensembles de données et quelles difficultés il a rencontrées. Une série de vidéos montre également comment ce modèle aidera la plateforme à changer le trading en ligne.

S2IGAN

Il semble que nous ayons promis de ne pas inclure de matériaux contenant des liens vers des référentiels vides dans la collection, mais je veux faire une exception. S2IGAN est un framework qui traduit la parole en images. À l'aide d'un double encodeur, un modèle a été créé qui génère des images à l'aide d'une description vocale. Les auteurs de l'étude promettent de publier le code prochainement, mais pour l'instant ils doivent se contenter d'exemples d'oiseaux générés.



Estimation cohérente de la profondeur vidéo

Un algorithme est présenté qui, à l'aide d'un réseau de neurones convolutionnels, détermine la profondeur des images individuelles et restaure une profondeur géométriquement cohérente pour la vidéo entière. Cela permet de faire face à un certain nombre de limitations, par exemple lorsque l'image est instable en raison de tremblements. Vous pouvez appliquer une technologie similaire dans divers domaines, pour les effets AR ou les voitures à pilote automatique. Le référentiel est toujours vide, mais les auteurs promettent de partager le code source.

C'est tout, merci d'avoir regardé!

All Articles