Eine Auswahl von Artikeln zum maschinellen Lernen: Fälle, Leitfäden und Studien für Mai 2020


Wir sammeln weiterhin für Sie die interessantesten Nachrichten und Tools aus dem Bereich des maschinellen Lernens, die in einer zugänglichen Sprache verfasst sind.

Jukebox

Anfang dieses Monats hat OpenAI großes Interesse an der ML-Community geweckt, indem der Quellcode für sein Projekt namens Jukebox veröffentlicht wurde. Mit diesem Tool, das Algorithmen für maschinelles Lernen verwendet, können Sie Kompositionen bekannter Künstler erstellen. Im Netzwerk finden Sie bereits Beispiele für von Benutzern generierte Tracks, es gibt sehr ungewöhnliche Kombinationen.

AR Copy Paste Der

französische Entwickler Cyril Diagne hat eine AR-Anwendung eingeführt, die Bilder von Objekten aufnimmt, unnötigen Hintergrund aus Bildern entfernt und (mit U ^ 2-Net)) überträgt das Ergebnis an Programme, die auf dem Computer ausgeführt werden. Der Autor zeigt beispielsweise, wie Sie mit der Anwendung schnell Illustrationen auswählen und zu einer Präsentation hinzufügen können. Sie können sich bereits den Code ansehen und sich für den frühen Zugriff auf die Anwendung anmelden, die derzeit entwickelt wird.



Pose Animator

Ein Open Source-Tool für Webanimationen, mit dem Sie in SVG gezeichnete Zeichen animieren können. Das Tool basiert auf zwei weiteren Bibliotheken, Facemesh und PoseNet , die eine Webcam zum Erfassen von Bewegungen verwenden. Der Artikel zeigt, wie das Tool erstellt wurde und wie es verwendet wird.



Galaxy Zoo

Eine Fallstudie zur erfolgreichen Kombination von Crowdsourcing und maschinellem Lernen zur schnellen Verarbeitung komplexer Informationen. Die Galaxy Zoo-Plattform hat diese beiden Ansätze kombiniert, um die Entwicklung von Galaxien durch Klassifizierung von Millionen von Bildern zu untersuchen. Das Material beschreibt, wie nur die Daten markiert werden, die am besten zur Verbesserung des vorhandenen Modells beitragen.

Das DistilBERT

Startup Hugging Face teilt seine Erfahrungen bei der Erstellung einer öffentlichen API, mit der Sie die Leistung von NLP-Modellen auf Node.js optimieren können.

Parser für

klinische Studien Die meisten klinischen Studien rekrutieren nicht genügend Teilnehmer. Dies liegt an der Tatsache, dass Menschen ohne Honig. Bildung versteht nicht immer die Auswahlkriterien und die Details der Forschung. Facebook vorgestelltOpen Source Tool , das dieses Problem lösen soll.

GrokNet

Facebook hat ein universelles Computer-Vision-System für den E-Commerce angekündigt . Sie ist in der Lage, die Attribute von Waren in verschiedenen Kategorien zu identifizieren, von Auto bis Wohnkultur. Der Artikel beschreibt, wie das Modell an sieben Datensätzen trainiert wurde und auf welche Schwierigkeiten es stieß. Eine Reihe von Videos zeigt auch, wie dieses Modell der Plattform helfen wird, den Online-Handel zu ändern.

S2IGAN

Es scheint, dass wir versprochen haben, keine Materialien, die Links zu leeren Repositories enthalten, in die Sammlung aufzunehmen, aber ich möchte eine Ausnahme machen. S2IGAN ist ein Framework, das Sprache in Bilder übersetzt. Mit einem Doppelcodierer wurde ein Modell erstellt, das mithilfe einer Sprachbeschreibung Bilder generiert. Die Autoren der Studie versprechen, den Code bald zu veröffentlichen, müssen sich jedoch vorerst mit Beispielen für erzeugte Vögel zufrieden geben.



Konsistente Schätzung der Videotiefe

Es wird ein Algorithmus vorgestellt, der unter Verwendung eines Faltungs-Neuronalen Netzwerks die Tiefe einzelner Frames bestimmt und eine geometrisch konsistente Tiefe für das gesamte Video wiederherstellt. Dies hilft, eine Reihe von Einschränkungen zu bewältigen, beispielsweise wenn das Bild aufgrund von Verwacklungen instabil ist. Sie können eine ähnliche Technologie in verschiedenen Bereichen anwenden, für AR-Effekte oder Autopilot-Autos. Das Repository ist noch leer, aber die Autoren versprechen, den Quellcode zu teilen.

Das ist alles, danke fürs Zuschauen!

All Articles