Eine Auswahl von Artikeln zum maschinellen Lernen: Fallstudien, Leitfäden und Forschungsergebnisse für Januar 2020

Die Forschungsarbeit auf dem Gebiet des maschinellen Lernens verlässt allmählich die Universitätslabors und wird aus der wissenschaftlichen Disziplin angewendet. Es ist jedoch immer noch schwierig, relevante Artikel zu finden, die im Klartext und ohne eine Milliarde Fußnoten verfasst sind.

Dieser Beitrag enthält eine Liste englischsprachiger Materialien für Januar, die ohne übermäßigen Akademismus verfasst wurden. In ihnen finden Sie Codebeispiele und Links zu nicht leeren Repositorys . Die genannten Technologien sind gemeinfrei und erfordern zum Testen kein Hochleistungseisen.

Die Artikel sind in vier Typen unterteilt: Ankündigungen von Open-Source-Tools, Fälle von maschinellem Lernen in der kommerziellen Entwicklung, ML-Forschung und praktische Richtlinien für die Verwendung von PyTorch und TensorFlow.



Ankündigungen von Open Source-Technologie für maschinelles Lernen


LaserTagger

Der Artikel beschreibt kurz die Funktionalität und Architektur von LaserTagger . Ein Tool, mit dem Sie Text auf verschiedene Arten generieren können - um Sätze zu kombinieren, zu teilen und mit anderen Worten nacherzählen zu können. Im Gegensatz zu seq2seq-Modellen werden Wörter wiederverwendet, was eine hohe Geschwindigkeit der Texterzeugung gewährleistet.

Reformer

Für die Verarbeitung serieller Daten - Text, Musik oder Video - ist eine große Speicherressource erforderlich, da diese Daten vom umgebenden Kontext abhängen. Im Gegensatz zu Transformer, einem beliebten Architekturmodell für neuronale Netze, ist Reformerverbraucht viel weniger Speicher, um den Kontext zu halten - nur 16 GB. Dies reicht aus, um mit großen Textdatensätzen zu arbeiten - Reformer konnte beispielsweise den Text „Verbrechen und Bestrafung“ verarbeiten. Sie können das Tool auch verwenden, um die fehlenden Bildfragmente zu „beenden“.

Wav2letter @ überall

Die meisten Echtzeit-Spracherkennungs-Frameworks verwenden wiederkehrende neuronale Netze, während Wav2letter @ überallverwendet ein Faltungsmodell. Das Framework ist in C ++ geschrieben und lässt sich problemlos in andere Programmiersprachen integrieren. Den Entwicklern gelang es, den Durchsatz um das Dreifache zu erhöhen und auf nicht sehr leistungsfähigen Prozessoren Recheneffizienz zu erzielen. Der Artikel enthält Benchmarks und Links zu Modellen, mit denen sich die Lernergebnisse wiederholen lassen.

Polygames Ein

Framework , das künstliche Intelligenz lehrt, Strategiespiele zu spielen, auch völlig unbekannte. Im Gegensatz zu anderen ähnlichen Technologien lernt dieses Modell nicht aus zahlreichen Beispielen für erfolgreiches Spielmanagement, daher sind keine Datensätze erforderlich.

HiPlot-

ToolForschungsdaten zu visualisieren. Ermöglicht die Bewertung der Wirksamkeit von Hyperparametern wie Lerngeschwindigkeit, Regularisierung und Architektur. Der Artikel enthält Ausschnitte aus Python-Code und Beispiele für deren Visualisierungen. HiPlot wird von Jupiter Notebook unterstützt.

Leitfäden für maschinelles Lernen



TensorFlow.js Mit der Open

Source-Bibliothek können Sie Modelle für maschinelles Lernen ausführen, ohne das JS-Ökosystem zu verlassen. Es funktioniert in allen aktuellen Browsern, auf der Serverseite unter Node.js und auf mobilen Plattformen unter React Native.

Erstellen einer benutzerdefinierten TFX-Komponente

Jeder kann die TFX- Plattform verwenden , um gebrauchsfertige Pipelines für maschinelles Lernen zu erstellen. Die Plattform bietet eine Menge Standardkomponenten, aber manchmal sind sie nicht geeignet. In diesem Artikel wird erläutert, wie Sie eine vollständig benutzerdefinierte Pipeline für die Arbeit mit TensorFlow erstellen.

Beschleunigen Sie NVIDIA Dali mit PyTorch

Der Artikel beschreibt einige Möglichkeiten, um DALI optimaler zu nutzen und einen Prozess zu erstellen, der nur die CPU (ohne GPU) verwendet und den maschinellen Lernprozess auf PyTorch um das Vierfache beschleunigt.

Versionskontrolle von Daten und Modellen für schnelles Experimentieren beim maschinellen Lernen In diesem

Artikel wird beschrieben, wie versionierte Datensätze für einen reproduzierbaren maschinellen Lernprozess erstellt und verwendet werden. Mit Git, Docker und Quilt wird beispielsweise ein tiefes neuronales Netzwerk für die Objekterkennung mit Detectron2 erstellt, einem PyTorch-basierten System, das Algorithmen zur Objekterkennung verwendet.

Aktives Transfer-Training bei PyTorch

Transfer-Training ist ein Prozess, bei dem sich ein für eine bestimmte Aufgabe erstelltes maschinelles Lernmodell an eine andere Aufgabe anpasst. Normalerweise reicht es aus, die letzten Ebenen eines vorhandenen Modells neu zu trainieren. Der Vorteil ist, dass dies eine minimale Kennzeichnung von Daten durch Menschen erfordert. Dieser Artikel enthält Anleitungen zur Anwendung von Transferlernen auf aktives Lernen, mit denen Datenmuster identifiziert werden sollen, die von Personen gekennzeichnet werden müssen.

Fälle aus der kommerziellen Entwicklung


Erstellen einer intelligenten Musikbibliothek mit TensorFlow

Entwickler von Chinas führender Musik-Streaming-Plattform teilen ihre Erfahrungen mit dem Framework. Sie erzählen detailliert, welche Instrumente verwendet wurden, wie sie das Modell trainierten, um das Genre und den Musikstil für spätere Empfehlungen zu bestimmen. Trennen Sie beispielsweise die Stimme von der Musik, um die Texte eines Songs mithilfe der Texterkennung auszugeben. Da einige Inhalte auf der Plattform von Benutzern ohne spezielle Tonaufzeichnungsgeräte aufgezeichnet wurden, lernten die Autoren, Interferenzen und Hintergrundgeräusche zu beseitigen.

Hundetraining mit maschinellem Lernen

Gehorsame Hunde, die das Team kennen, finden eher neue Besitzer und verlassen das Tierheim. Allerdings können nicht alle Tierheime Hunde trainieren. Ziel des Projekts ist es, das Auto so zu trainieren, dass es versteht, ob der Hund den Befehl „Sitzen“ ausgeführt hat, der Hund bellt oder jammert usw.

Schulung eines Staubsaugers Ein

chinesischer Hersteller von intelligenten Staubsaugern hat Geräte geschult, um über den Boden verstreute Socken und Drähte zu erkennen. Case spricht über die Schwierigkeiten, aus Fotos einen eindeutigen Datensatz zu erstellen und verschiedene Algorithmen für maschinelles Lernen zu verwenden.

Erstellen Sie eine intelligente Kamera mit TensorFlow Lite auf dem Raspberry Pi

Die Kamera kann ein Lächeln im Gesicht einer Person erkennen und automatisch ein Bild aufnehmen. Sie kann durch Sprachbefehle gesteuert werden. Für die Entwicklung haben wir den Raspberry Pi 3B + mit einem Gigabyte RAM und einem 32-Bit-Betriebssystem ausgewählt. TensorFlow Light hat sich als Framework für mobile und IoT-Geräte etabliert. Der Artikel demonstriert die Algorithmen des Erkennungssystems für Lächeln und Sprachbefehle.

Forschung


Neuronales Netzwerk zur Lösung mathematischer Gleichungen

Facebook hat das erste neuronale Netzwerk entwickelt, das mithilfe symbolischer Logik Integral- und Differentialgleichungen der ersten und zweiten Art löst . Früher war maschinelles Lernen für eine solche Aufgabe nicht geeignet, da Mathematik absolute Genauigkeit erfordert, nicht annähernd. Die Autoren der Studie verwendeten neuronale maschinelle Übersetzung. Die Gleichungen wurden maschinell als Textsätze und Lösungen als ihre Übersetzung wahrgenommen. Dazu war es notwendig, die Syntax zu kompilieren und einen Satz von Trainingsdaten aus mehr als 100 Millionen Paargleichungen und deren Lösungen vorzubereiten. Somit zeigt die Studie, dass neuronale Netze nicht nur zur Unterscheidung zwischen Mustern verwendet werden können.

KI-Lebensraum: Ultrapräzise Navigation KI im Raum von

Facebook hat einen groß angelegten Lernalgorithmus für die DD-PPO-Verstärkung entwickelt, der die Navigation im Raum von Wohn- und Büroräumen mithilfe von Daten von RGB-D-Kamera, GPS und Kompass effektiv bewältigt. Mit DD-PPO trainierte Roboter erreichen ihr Ziel mit einer Genauigkeit von 99,9%. Der Artikel enthält beeindruckende Videos.

Können Sie den Unsicherheiten Ihres Modells vertrauen?

Veröffentlichter Code und Forschungsergebnisse, das sich auf das Problem der kovarianten Verschiebung konzentriert, wenn die Daten für das Training des Modells nicht mit der Testprobe übereinstimmen. Die Autoren führten eine umfassende vergleichende Analyse der fortschrittlichsten Modelle durch und versorgten sie mit Datensätzen aus Text, Bildern, Online-Werbung und Genomik. Ziel war es, die Genauigkeit gängiger Methoden zu bestimmen. In Benchmarks erwies sich die Ensemble-Methode als die zuverlässigste.

Vielen Dank für Ihre Aufmerksamkeit!

Bevor Sie eine Testversion veröffentlicht haben, sind alle Empfehlungen willkommen.

Source: https://habr.com/ru/post/undefined/


All Articles