Eine Auswahl von Artikeln zum maschinellen Lernen: Fälle, Leitfäden und Studien für Februar 2020



Treffen Sie nach der Januar-Post die zweite Ausgabe der Übersicht. Hier finden Sie eine Liste englischsprachiger Materialien für Februar, die ohne übermäßigen Akademismus verfasst wurden. Die Veröffentlichungen enthalten Codebeispiele und Links zu nicht leeren Repositorys. Die genannten Technologien sind gemeinfrei und viele von ihnen benötigen zum Testen kein Hochleistungseisen.

Die Artikel sind in vier Typen unterteilt:
Ankündigungen von Open-Source-Tools und
-Datensätzen Praktische Leitfäden für PyTorch- und TensorFlow-
Fallstudien zur maschinellen
ML-Forschung


Ankündigungen von Open Source Tools


ClearGrasp

Der Algorithmus wurde entwickelt, um das Problem der Erkennung transparenter Objekte zu lösen, die Licht ungleichmäßig reflektieren und brechen. Jede Standard-RGB-D-Kamera ist für die Arbeit geeignet.

PyTorch3D

Facebook hat eine hochmodulare und optimierte Bibliothek für PyTorch angekündigt , die das gründliche Training von Modellen in dreidimensionalen Bildern vereinfacht.

Hydra Das

neue Framework aus dem PyTorch-Ökosystem, mit dem Probleme im Zusammenhang mit der Komplexität von Projekten gelöst werden sollen. Bietet Projektverwaltungsfunktionen über die Befehlszeile und Konfigurationsdateien.

TensorFlow.js für React Native

Das Tool verwendet keine Webansicht zum Rendern und hängt nicht von der API der im Browser verwendeten Webplattformen ab. Somit handelt es sich um eine neue Integrationsplattform mit einem für diese Umgebung geeigneten Backend.

Matrix Compression Operator

Operator können Sie eine beliebige Matrix Komprimierungsfunktion als Faktorisierung definiert verwenden und einen Tensor Flow - API erstellen , um dynamisch diese Kompression während der Ausbildung eines Tensor Flussvariable gelten.

Die Torchmeta Meta-Learning

Library bietet eine einzige Schnittstelle für verschiedene Datensätze, um die Erstellung neuer Algorithmen zu vereinfachen.

AutoFlip

Oft möchten Sie die Bildschirmausrichtung von horizontal (16: 9 oder 4: 3) auf vertikal ändern. Schließlich erschien der RahmenDies hilft, Frames mit minimalem Verlust dynamisch zuzuschneiden. Das Werkzeug bestimmt die Grenzen des Rahmens und der sich bewegenden Objekte und lässt nur die wichtigsten auf dem Bildschirm.



Constrained Optimization Library

Tool für TensorFlow , mit dem Sie den Grad unehrlicher Ergebnisse bei der Lösung von Problemen aus der realen Welt reduzieren können, wenn viele zusätzliche Parameter berücksichtigt werden (z. B. bei der Ausgabe von Bankkrediten). Das Tool konvertiert Datenabtastungsbeschränkungen algorithmisch in ein Nullsummenspiel für zwei Spieler.

Poincare-Karten

mit dem Hyperbolic Geometry Toolzeigt die hierarchischen Beziehungen paarweiser Ähnlichkeiten verschiedener Zellen. Dies ermöglicht den Einsatz von maschinellem Lernen, um die Entwicklung von Zellen von Organismen abzubilden und zu analysieren.

PyTorch Lightning + Torchbearer

Die Entwickler der hochrangigen Abstraktion Torchbearer haben sich mit der wachsenden Popularität von PyTorch Lightning zusammengetan und arbeiten nun in ihrem Team. Abstraction automatisiert die Entwicklung, macht Code standardisiert, gepflegt und skalierbar. So können sich die Forscher mehr auf die Wissenschaft konzentrieren, anstatt mit einer Codebasis zu arbeiten.

Öffnen Sie Bilder v6

Die sechste Version des Open Images-Datensatzes wurde veröffentlicht, in der die Art der Kennzeichnung und des Kommentars zu Bildern erheblich erweitert wurde. Fotos sind so detailliert, dass sie sich auch auf die Weiterentwicklung der interdisziplinären Forschung auswirken, bei der Computer Vision mit der Verarbeitung natürlicher Sprache kombiniert wird.

CCMatrix: Ein Datensatz zum Trainieren von Übersetzungsmodellen Der

Datensatz besteht aus 4,5 Milliarden Bittextsätzen in 576 Sprachpaaren und hilft bei der Erstellung fortgeschrittener NMT-Modelle.

Anleitungen


Verteilte Hauptkomponentenmethode unter Verwendung von TFX

Wie Sie mit TensorFlow Transform die Hauptkomponentenmethode in einer skalierbaren Form unter Verwendung der Ressourcen von Rechenclustern anwenden und die Verarbeitung von Transformationen in einer TFX-Pipeline aktivieren können.

Beschleunigung neuronaler Netze mit TensorNetwork in Keras.

Material zur Verwendung der TensorNetwork-Bibliothek zur Verarbeitung von Tensornetzwerken im Kontext des maschinellen Lernens.

TensorFlow-Gitter: Flexibles, kontrolliertes und interpretiertes maschinelles Lernen Ein

einführender Überblick über die Fähigkeiten der Bibliothek zum Unterrichten begrenzter und interpretierter Gittermodelle.

Fälle


AR-Masken mit TensorFlow.js Das

von Loreal gekaufte ModiFace-Startup teilt seine Erfahrungen mit der Verwendung von maschinellem Lernen im Kontext von AR-Masken. Das Beispiel einer Beauty-Marke zeigt, wie maschinelles Lernen im E-Commerce angewendet werden kann.

Kennzeichenerkennung in Echtzeit Ein

schrittweiser Fall zeigt, dass maschinelles Lernen jetzt für alle verfügbar ist. Der Autor erklärt, wie ein Budget-Gerät zu Hause zusammengebaut, ein Modell erstellt, trainiert, in AWS platziert und ein Client-Teil entwickelt wird.

Bestimmung der Luftverschmutzung mit einem Telefon

Ein Fall zum Erstellen einer Anwendung, die den Grad der Luftverschmutzung anhand eines Fotos von der Kamera des Telefons bestimmt. Das Problem, das gelöst werden musste, bestand darin, Daten von verschiedenen Benutzern für die weitere Schulung des Modells zu sammeln, gleichzeitig aber die Sicherheit der Benutzerdaten zu gewährleisten.

Hinzufügen eines Volumeneffekt zu zweidimensionalen Bildern

teilt Facebook seine Erfahrung ein Faltungs neuronales Netzwerk in
Entwicklungsprogramm , das für zweidimensionale Bilder eines dreidimensionalen Bild - Effekt erzeugt. Bei der Erstellung mussten viele Probleme gelöst werden, sowohl beim Training des Modells als auch bei der Optimierung des Systems zur Unterstützung von Mobiltelefonen.



Wie man nicht mit dem schnellen Wachstum der Benutzer pleite geht

Wie die Entwickler von Dungeon AI skaliert haben, um 1 Million Benutzer zu unterstützen, und mit Cortex einen Microservice erstellt haben, der auf einem maschinellen Lernmodell basiert.

Forschung


Verwenden von „Radioaktiven Daten“

Mit der Methode „Radioaktive Daten“ können Sie feststellen, dass ein maschinelles Lernmodell anhand eines bestimmten Datensatzes trainiert wurde. Auf diese Weise können Forscher und Ingenieure nachverfolgen, welcher Datensatz zum Trainieren des Modells verwendet wurde, um besser zu verstehen, wie sich unterschiedliche Datensätze auf die Leistung verschiedener neuronaler Netze auswirken.

TyDi QA: Ein Datensatz mit Fragen und Antworten in verschiedenen Sprachen

Google hat eine Studie und Datensätze veröffentlicht, die aus 200.000 Fragen- und Antwortpaaren aus 11 Sprachen bestehen, die eine breite Palette sprachlicher Phänomene darstellen. Die Studienteilnehmer wurden gebeten, auf der Grundlage des Textes eine verwandte Frage zu stellen, deren Antwort nicht im Text enthalten ist. Anschließend wurde vorgeschlagen, die Antwort auf die Frage im Wikipedia-Artikel zu finden. Und diese Daten haben einen Datensatz zusammengestellt.

Künstliche Erstellung von Datensätzen für klinische Studien

Aufgrund verschiedener Einschränkungen ist es sehr schwierig, Datensätze mit Fotos von Hautläsionen zu erstellen. Jetzt gibt es ein Tool, das die notwendigen Daten für die Weiterbildung generiert. DermGAN verwendet als Eingabe das reale Bild und die entsprechende vorgenerierte semantische Karte mit den Hauptmerkmalen des realen Bildes (Hauttyp, Hautzustand, Ort des Neoplasmas), aus dem ein neues Synthesebeispiel mit den angeforderten Merkmalen generiert wird.

Beschleunigter MRT-Scan

Ziel des Projekts ist es, den MRT-Scan von Patienten mit AI um das Zehnfache zu beschleunigen. Snapshots werden mithilfe von DNN aus Rohdaten generiert, und dabei treten häufig Artefakte auf. Die Studie zeigt, wie böswilliges maschinelles Lernen dazu beigetragen hat, ihre Anzahl zu reduzieren.

Infrastrukturoptimierung für Empfehlungen basierend auf DNN Die

Studie analysiert verschiedene Infrastrukturen, die verwendet werden, um personalisierte Empfehlungen für Produkte, Videos usw. mithilfe von DNN abzugeben. Es werden auch Tools bereitgestellt, mit denen überprüft werden kann, wie gut DNN-basierte Empfehlungen im Produktionsmaßstab funktionieren. Beispielsweise wird ein Benchmark von Intel-Servern durchgeführt, die in Rechenzentren (Broadwell, Haswell, Skylake) verwendet werden.

Txt2π

Eine Überprüfung des neuen Ansatzes des verstärkten Lernens. Es soll helfen, eine schwierige Aufgabe zu lösen, bei der der Agent mehrere Schritte ausführen muss, basierend auf dem Ziel und dem Wissen der Umgebung, die sich ändern können. Das Modell muss lernen, ein Spiel zu spielen, in dem Sie Monster nach bestimmten Regeln besiegen müssen (Read to Fight Monsters).

CNN-Training für Bilder mit ultrahoher Auflösung Die

vorhandene Parallelität von Daten und Modellen ermöglicht das Training neuronaler Netze mit Milliarden von Parametern. Das Training für Daten, die aus hochauflösenden Bildern wie CT-Bildern bestehen, bleibt jedoch ein Problem. In diesem Artikel betrachten wir die Anwendbarkeit von Faltungs-Neuronalen Netzen in Bildern mit ultrahoher Auflösung (es gibt einen Projektcode).

Street View Map Orientierungslauf-Training

Google sammelt Anwendungen von Forschern, die bereit sind, einen Datensatz für das anschließende Training von neuronalen Netzen mit räumlicher Orientierung zu erstellen.

T5: Ein neues Werkzeug für das Transferlernen

Als Ergebnis einer groß angelegten Umfrage identifizierten die Forscher die besten Transferlerntechniken und verwendeten diese Ideen, um das vorab trainierte T5- Modell sowie den Datensatz zu erstellen , auf dem es trainiert wurde.

Erwarten Sie in der März-Auswahl Artikel über den Einsatz von ML im Kampf gegen COVID-19: Bestimmung der Temperatur von Menschen in Echtzeit durch Infrarotstrahlung, Diagnose des Virus, Verfolgung von Epidemieausbrüchen und mehr. In der Zwischenzeit ist das alles. Vielen Dank für Ihre Aufmerksamkeit!

All Articles