Une sélection d'articles sur l'apprentissage automatique: études de cas, guides et recherches pour janvier 2020

Les travaux de recherche dans le domaine de l'apprentissage automatique quittent progressivement les laboratoires universitaires et de la discipline scientifique sont appliqués. Cependant, il est toujours difficile de trouver des articles pertinents rédigés dans un langage simple et sans un milliard de notes de bas de page.

Ce message contient une liste de documents en anglais pour janvier, qui sont écrits sans académisme excessif. Vous y trouverez des exemples de code et des liens vers des référentiels non vides . Les technologies mentionnées sont du domaine public et ne nécessitent pas de fer robuste pour les tests.

Les articles sont divisés en quatre types: annonces d'outils open source, cas d'utilisation de l'apprentissage automatique dans le développement commercial, recherche ML et directives pratiques pour l'utilisation de PyTorch et TensorFlow.



Annonces de technologie open source pour l'apprentissage automatique


LaserTagger

L'article traite brièvement des fonctionnalités et de l'architecture de LaserTagger ; un outil qui vous permet de générer du texte de différentes manières - pour combiner et fractionner des phrases, ainsi que les redire en d'autres termes. Contrairement aux modèles seq2seq, il réutilise les mots, ce qui garantit une vitesse élevée de génération de texte.

Réformateur

Pour traiter des données série - texte, musique ou vidéo - nécessite une grande mémoire, car ces données dépendent du contexte environnant. Contrairement à Transformer, un modèle architectural populaire pour les réseaux de neurones, Reformerconsomme beaucoup moins de mémoire pour contenir le contexte - seulement 16 Go. Cela suffit pour travailler avec de grands ensembles de données de texte - Reformer, par exemple, a pu traiter le texte «Crime and Punishment». Vous pouvez également utiliser l'outil pour «terminer» les fragments d'image manquants.

Wav2letter @ Anywhere

La plupart des frameworks de reconnaissance vocale en temps réel utilisent des réseaux de neurones récurrents, tandis que Wav2letter @ Anywhereutilise un modèle acoustique convolutif. Le framework est écrit en C ++ et s'intègre facilement dans d'autres langages de programmation. Les créateurs ont réussi à augmenter le débit trois fois et à fournir une efficacité de calcul sur des processeurs peu puissants. L'article fournit des repères et des liens vers des modèles qui aideront à répéter les résultats d'apprentissage.

Polygames Un

framework qui apprend à l'intelligence artificielle à jouer à des jeux de stratégie, même totalement inconnus. Contrairement à d'autres technologies similaires, ce modèle n'apprend pas de nombreux exemples de gestion de jeu réussie, par conséquent, il ne nécessite pas de jeux de données. Outil

HiPlot

pour visualiser les données de recherche. Vous permet d'évaluer l'efficacité des hyperparamètres, tels que la vitesse d'apprentissage, la régularisation et l'architecture. L'article fournit des extraits de code python et des exemples de leurs visualisations. HiPlot est pris en charge par Jupiter Notebook.

Guides d'apprentissage automatique



TensorFlow.js La

bibliothèque open source vous permet d'exécuter des modèles d'apprentissage automatique sans quitter l'écosystème JS. Il fonctionne dans tous les navigateurs actuels, côté serveur sur Node.js et plates-formes mobiles sur React Native.

Création d'un composant TFX personnalisé

N'importe qui peut utiliser la plateforme TFX pour créer des pipelines d' apprentissage automatique prêts à l'emploi. La plate-forme propose une tonne de composants standard, mais il y a des moments où ils ne conviennent pas. Cet article explique comment créer un pipeline entièrement personnalisé pour travailler avec TensorFlow.

Accélérez NVIDIA Dali avec PyTorch

L'article explique certaines façons d'optimiser l'utilisation de DALI et de créer un processus qui utilise uniquement le processeur (sans GPU) et accélère le processus d'apprentissage automatique sur PyTorch de 4 fois.

Contrôle de version des données et des modèles pour une expérimentation rapide dans l'apprentissage automatique Cet

article explique comment créer et utiliser des ensembles de données versionnés pour un processus d'apprentissage automatique reproductible. Par exemple, à l'aide de Git, Docker et Quilt, un réseau neuronal profond est créé pour la reconnaissance d'objets à l'aide de Detectron2, un système basé sur PyTorch qui utilise des algorithmes pour la reconnaissance d'objets.

Formation de transfert actif chez PyTorch

La formation au transfert est un processus lorsqu'un modèle d'apprentissage automatique créé pour une tâche spécifique s'adapte à une autre tâche. Habituellement, il suffit de recycler les dernières couches d'un modèle existant. L'avantage est que cela nécessite un étiquetage minimal des données par les humains. Cet article fournit des conseils sur l'application de l'apprentissage par transfert à l'apprentissage actif, qui vise à identifier les modèles de données qui doivent être étiquetés par les personnes.

Cas de développement commercial


Création d'une bibliothèque musicale intelligente avec TensorFlow Les

développeurs de la principale plate-forme de streaming musical en Chine partagent leur expérience en utilisant le framework. Ils expliquent en détail quels instruments ont été utilisés, comment ils ont formé le modèle pour déterminer le genre et le style de musique pour les recommandations ultérieures. Séparez la voix de la musique, par exemple, pour sortir les paroles d'une chanson en utilisant la reconnaissance de texte. Étant donné qu'une partie du contenu de la plate-forme a été enregistrée par des utilisateurs sans équipement d'enregistrement sonore spécial, les auteurs ont appris à éliminer les interférences et le bruit de fond.

Dressage de chiens avec apprentissage automatique

Les chiens obéissants qui connaissent l'équipe sont plus susceptibles de trouver de nouveaux propriétaires et de quitter le refuge. Cependant, tous les refuges n'ont pas la capacité d'entraîner des chiens. L'objectif est de former la voiture du projet pour comprendre si le chien a terminé la « Asseyez - vous » commande, le chien aboie ou couine, etc. La

formation d' un aspirateur Un

fabricant chinois d'aspirateurs intelligents a des dispositifs formés pour reconnaître des chaussettes et des fils éparpillés sur le sol. Case parle des difficultés de créer un ensemble de données unique à partir de photographies et d'utiliser divers algorithmes d'apprentissage automatique.

Créez une caméra intelligente à l'aide de TensorFlow Lite sur le Raspberry Pi

L'appareil photo peut détecter un sourire sur le visage d'une personne et prendre automatiquement une photo. Elle peut être contrôlée par des commandes vocales. Pour le développement, nous avons choisi le Raspberry Pi 3B +, avec un gigaoctet de RAM et un système d'exploitation 32 bits. TensorFlow Light s'est imposé comme un cadre pour les appareils mobiles et IoT. L'article présente les algorithmes du système de reconnaissance des sourires et des commandes vocales.

Recherche


Réseau de neurones pour résoudre des équations mathématiques

Facebook a développé le premier réseau de neurones qui utilise une logique symbolique pour résoudre des équations intégrales et différentielles du premier et du deuxième type. Auparavant, l'apprentissage automatique n'était pas adapté à une telle tâche, car les mathématiques nécessitent une précision absolue, pas approximative. Les auteurs de l'étude ont utilisé la traduction automatique neuronale. Les équations ont été perçues par la machine comme des phrases de texte et les solutions comme leur traduction. Pour cela, il a été nécessaire de compiler la syntaxe et de préparer un ensemble de données d'apprentissage à partir de plus de 100 millions d'équations de paires et leurs solutions. Ainsi, l'étude montre que les réseaux de neurones peuvent être utilisés non seulement pour distinguer les modèles.

AI Habitat: navigation ultra-précise L'IA dans l'espace de

Facebook a développé un algorithme d'apprentissage par renforcement DD-PPO à grande échelle qui gère efficacement la navigation dans l'espace des locaux résidentiels et des bureaux en utilisant les données de la caméra RGB-D, du GPS et de la boussole. Les robots formés avec DD-PPO atteignent leur objectif avec une précision de 99,9%. L'article contient des vidéos impressionnantes.

Pouvez-vous faire confiance aux incertitudes de votre modèle? Code

publié et résultats de recherche, qui se concentre sur le problème du décalage covariant, lorsque les données pour la formation du modèle ne coïncident pas avec l'échantillon de test. Les auteurs ont effectué une analyse comparative approfondie des modèles les plus avancés, en leur fournissant des ensembles de données à partir de texte, d'images, de publicité en ligne et de génomique. L'objectif était de déterminer la précision des méthodes populaires. Dans les benchmarks, la méthode d'ensemble s'est avérée la plus fiable.

Merci pour l'attention!

Avant votre version d'essai, toutes les recommandations sont les bienvenues.

Source: https://habr.com/ru/post/undefined/


All Articles