Une sélection d'articles sur l'apprentissage automatique: cas, guides et études pour février 2020



Après le post de janvier, retrouvez le deuxième numéro du condensé. Vous trouverez ici une liste de documents en anglais pour février, qui sont rédigés sans académisme excessif. Les publications contiennent des exemples de code et des liens vers des référentiels non vides. Les technologies mentionnées sont du domaine public et nombre d'entre elles ne nécessitent pas de fer à repasser pour les tests.

Les articles sont divisés en quatre types:
Annonces d'outils et de jeux de données open source
Guides pratiques pour PyTorch et TensorFlow
Études de cas de l'apprentissage machine
Recherche ML


Annonces d'outils open source


ClearGrasp

L'algorithme est conçu pour résoudre le problème de la reconnaissance des objets transparents qui réfléchissent et réfractent de manière inégale la lumière. N'importe quelle caméra RGB-D standard convient au travail.

PyTorch3D

Facebook a annoncé une bibliothèque hautement modulaire et optimisée pour PyTorch , qui simplifie la formation approfondie des modèles en images tridimensionnelles.

Hydra Le

nouveau cadre de l'écosystème PyTorch, conçu pour résoudre les problèmes liés à la complexité des projets. Fournit des capacités de gestion de projet via la ligne de commande et les fichiers de configuration.

TensorFlow.js pour React Native

L'outil n'utilise pas la vue Web pour le rendu et ne dépend pas de l'API des plates-formes Web utilisées dans le navigateur. Il s'agit donc d'une nouvelle plateforme d'intégration avec un backend adapté à cet environnement.

Opérateur de compression matricielle

L'opérateur vous permet d'utiliser n'importe quelle fonction de compression matricielle définie comme factorisation et de créer une API de flux tensoriel pour appliquer dynamiquement cette compression tout en apprenant toute variable de flux tensoriel.

Torchmeta Meta-Learning

Library fournit une interface unique pour différents ensembles de données pour simplifier la création de nouveaux algorithmes.

AutoFlip

Souvent, vous voulez changer l'orientation de l'écran de l'horizontale (16: 9 ou 4: 3) à la verticale. Enfin, le cadre est apparu, ce qui permet de rogner dynamiquement les images avec une perte minimale. L'outil détermine les limites du cadre et des objets en mouvement, ne laissant que les plus importants à l'écran. Outil de



bibliothèque d'optimisation contrainte

pour TensorFlow , qui vous permet de réduire le degré de résultats malhonnêtes lors de la résolution de problèmes du monde réel, lorsque de nombreux paramètres supplémentaires sont pris en compte (par exemple, lors de l'émission de prêts bancaires). L'outil convertit algorithmiquement les contraintes d'échantillonnage des données en un jeu à somme nulle pour deux joueurs.

Cartes de Poincaré à l'

aide de l' outil de géométrie hyperboliquerévèle les relations hiérarchiques des similitudes par paires de diverses cellules. Cela permet d'utiliser l'apprentissage automatique pour cartographier et analyser le développement des cellules des organismes.

PyTorch Lightning + Torchbearer

Les créateurs de l'abstraction de haut niveau Torchbearer ont uni leurs forces avec la popularité croissante de PyTorch Lightning et travaillent maintenant sur leur équipe. L'abstraction automatise le développement, rend le code standardisé, maintenu et évolutif. Ainsi, afin que les chercheurs puissent se concentrer davantage sur la science, plutôt que de travailler avec une base de code.

Images ouvertes v6

La sixième version du jeu de données Open Images a été publiée, dans laquelle le type de marquage et de commentaire sur les images a été considérablement étendu. Les captures de photographies sont si détaillées qu'elles affecteront également le développement de la recherche interdisciplinaire, où la vision par ordinateur est combinée avec le traitement du langage naturel.

CCMatrix: un ensemble de données pour la formation de modèles de traduction L'

ensemble de données se compose de 4,5 milliards de phrases bittext dans 576 paires de langues et aidera à créer des modèles NMT plus avancés.

Des guides


Méthode du composant principal distribué à l'aide de TFX

Comment TensorFlow Transform vous permet d'appliquer la méthode du composant principal sous une forme évolutive en utilisant les ressources des clusters de calcul, et comment activer le traitement des transformations dans un pipeline TFX.

Accélérer les réseaux de neurones à l'aide de TensorNetwork dans Keras

Matériel sur la façon d'utiliser la bibliothèque TensorNetwork pour traiter les réseaux de tenseurs dans le contexte de l'apprentissage automatique.

Treillis TensorFlow: apprentissage automatique flexible, contrôlé et interprété

Présentation générale des capacités de la bibliothèque à enseigner des modèles de treillis limités et interprétés.

Étuis


Masques AR avec TensorFlow.js

Acheté La startup Loreal ModiFace partage son expérience de l'utilisation de l'apprentissage automatique dans le contexte des masques AR. L'exemple d'une marque de beauté montre comment l'apprentissage automatique peut être appliqué dans le commerce électronique.

Reconnaissance des plaques d'immatriculation en temps réel Un cas

étape par étape prouve que l'apprentissage automatique est désormais accessible à tous. L'auteur explique comment assembler un appareil économique à la maison, créer un modèle, le former, le placer sur AWS et également développer une partie client.

Déterminer la pollution de l'air à l'aide d'un téléphone

Étude de cas pour créer une application qui détermine le niveau de pollution de l'air à partir d'une photo de l'appareil photo du téléphone Le problème qui devait être résolu était d'externaliser les données de différents utilisateurs pour une formation complémentaire du modèle, mais en même temps d'assurer la sécurité des données des utilisateurs.

Ajouter un effet de volume aux images bidimensionnelles

Facebook partage son expérience dans le développement d'un
programme de réseau de neurones convolutionnel qui crée un effet d'image tridimensionnel pour les images bidimensionnelles. Lors de la création, il a fallu résoudre de nombreux problèmes, à la fois dans la formation du modèle et dans l'optimisation du système pour prendre en charge les téléphones portables.



Comment ne pas aller rompre avec la croissance rapide des utilisateurs

Comment les créateurs de Dungeon AI ont évolué pour prendre en charge 1 million d'utilisateurs, et avec Cortex, ils ont créé un microservice basé sur un modèle d'apprentissage automatique.

Recherche


Utilisation de «données radioactives»

La méthode «données radioactives» vous permet de déterminer qu'un modèle d'apprentissage automatique a été formé à l'aide d'un ensemble de données spécifique. Cela peut aider les chercheurs et les ingénieurs à suivre quel ensemble de données a été utilisé pour former le modèle afin qu'ils puissent mieux comprendre comment différents ensembles de données affectent les performances de différents réseaux de neurones.

TyDi QA: un ensemble de données de questions et réponses dans différentes langues

Google a publié une étude et des ensembles de données comprenant 200 000 paires de questions et réponses de 11 langues représentant un large éventail de phénomènes linguistiques. Les participants à l'étude ont été invités à poser une question connexe sur la base du texte, dont la réponse ne figure pas dans le texte, après quoi il a été proposé de trouver la réponse à la question dans l'article Wikipédia. Et ces données ont compilé un ensemble de données.

Création artificielle d'ensembles de données pour les essais cliniques

En raison de diverses limitations, il est très difficile de créer des ensembles de données avec des photographies des lésions cutanées. Il existe maintenant un outil qui génère les données nécessaires à la formation continue. DermGAN prend en entrée l'image réelle et la carte sémantique pré-générée correspondante avec les principales caractéristiques de l'image réelle (type de peau, état de la peau, localisation du néoplasme), à ​​partir de laquelle il génère un nouvel exemple synthétique avec les caractéristiques demandées.

Scanner IRM accéléré

L'objectif du projet est d'accélérer 10 fois l'IRM des patients grâce à l'IA. Les instantanés sont générés à l'aide de DNN à partir de données brutes et des artefacts apparaissent souvent dans le processus. L'étude indique comment l'apprentissage automatique malveillant a contribué à réduire leur nombre.

Optimisation des infrastructures pour les recommandations basées sur DNN L'

étude analyse différentes infrastructures utilisées pour émettre des recommandations personnalisées pour les produits, vidéos, etc. en utilisant DNN. Des outils sont également fournis pour vérifier l'efficacité des recommandations à l'échelle de la production basées sur DNN. Par exemple, un benchmark des serveurs Intel utilisés dans les centres de données (Broadwell, Haswell, Skylake) est réalisé.

Txt2Ď€

Un examen de la nouvelle approche d'apprentissage par renforcement. Il est conçu pour aider à résoudre une tâche difficile dans laquelle l'agent doit prendre plusieurs mesures basées sur l'objectif et la connaissance de l'environnement, qui peuvent changer. Le modèle doit apprendre à jouer à un jeu où vous devez vaincre des monstres en fonction de certaines règles (lire pour combattre les monstres).

Formation CNN sur les images ultra haute résolution

Les données existantes et les méthodes de parallélisme des modèles entraînent des réseaux de neurones avec des milliards de paramètres, mais la formation sur les données consistant en des images haute résolution comme les images CT reste un problème. Dans cet article, nous considérons l'applicabilité des réseaux de neurones convolutionnels dans des images à ultra-haute résolution (il existe un code de projet).

Street View Map Course d'orientation

Google recueille des applications de chercheurs qui sont prêts à aider à créer un ensemble de données pour la formation ultérieure des réseaux de neurones d'orientation spatiale.

T5: un nouvel outil pour l'apprentissage par transfert

À la suite d'une enquête à grande échelle, les chercheurs ont identifié les meilleures techniques d'apprentissage par transfert et appliqué ces idées pour créer le modèle T5 pré- formé , ainsi que l' ensemble de données sur lequel il a été formé.

Dans la sélection de mars, attendez-vous à des articles sur l'utilisation du ML dans la lutte contre le COVID-19: détermination de la température des personnes en temps réel par rayonnement infrarouge, diagnostic du virus, suivi des épidémies de l'épidémie, etc. En attendant, c'est tout. Merci pour l'attention!

All Articles