機械学習に関する一連の記事:2020年5月の事例、ガイド、および研究


アクセス可能な言語で記述された、機械学習の分野からの最も興味深いニュースとツールを引き続き収集します。

ジュークボックス

今月初め、OpenAIは、ジュークボックスと呼ばれるプロジェクトのソースコードを投稿することにより、MLコミュニティへの大きな関心を呼び起こしました。機械学習アルゴリズムを使用するこのツールを使用すると、人気のあるアーティストの構成を生成できます。ネットワークでは、ユーザーが生成したトラックの例をすでに見つけることができますが、非常に珍しい組み合わせがあります。

ARコピーペースト

フランスの開発者Cyril Diagneは、オブジェクトの写真を撮り、写真からすべての不要な背景を削除し、(U ^ 2-Netを使用して)ARアプリケーションを導入しました)結果をコンピュータで実行中のプログラムに転送します。たとえば、作成者は、アプリケーションを使用して、イラストをすばやく選択し、プレゼンテーションに追加する方法を示しています。すでにコードを確認して、現在開発中のアプリケーションに早期アクセスするためにサインアップできます。



Pose Animator Webアニメーション用

のオープンソースツールで、SVGで描かれたキャラクターをアニメーション化できます。このツールは、Webカメラを使用して動きをキャプチャする他の2つのライブラリFacemeshPoseNetに基づいています。この記事では、ツールの作成方法とその使用方法を示します。



銀河動物園

クラウドソーシングと機械学習をうまく組み合わせて複雑な情報をすばやく処理する方法に関するケーススタディ。 Galaxy Zooプラットフォームは、これらの2つのアプローチを組み合わせて、何百万もの画像を分類することで銀河の進化を研究しています。この資料では、既存のモデルの改善に最も役立つデータのみをマークする方法について説明しています。

DistilBERT

Startup Hugging Faceは、Node.jsのNLPモデルのパフォーマンスを最適化できるパブリックAPIを作成した経験を共有しています。

臨床試験パーサー

ほとんどの臨床試験では、十分な参加者を募集できません。これは蜂蜜のない人がいるという事実によるものです。教育は、選択基準や研究の詳細を常に理解しているわけではありません。 Facebook紹介この問題の解決を目的としたオープンソースツール

GrokNet

Facebookは、eコマース用に設計されたユニバーサルコンピュータービジョンシステムを発表しました。彼女は、自動車から室内装飾まで、さまざまなカテゴリーの商品の属性を識別することができます。この記事では、7つのデータセットでモデルがどのようにトレーニングされ、どのような問題が発生したかについて説明します。一連のビデオでは、このモデルがプラットフォームがオンライン取引を変えるのをどのように支援するかも示しています。

S2IGAN

空のリポジトリへのリンクを含む資料をコレクションに含めないと約束したようですが、例外を設けたいと思います。 S2IGANは、音声を画像に変換するフレームワークです。デュアルエンコーダーを使用して、音声説明を使用して画像を生成するモデルが作成されました。研究の著者はコードをすぐに投稿することを約束しますが、今のところ、彼らは生成された鳥の例で満足している必要があります。



一貫したビデオ深度推定

畳み込みニューラルネットワークを使用して、個々のフレームの深度を決定し、ビデオ全体の幾何学的に一貫した深度を復元するアルゴリズムが提示されます。これは、揺れのために画像が不安定になる場合など、多くの制限に対処するのに役立ちます。ARエフェクトや自動操縦車など、さまざまな分野で同様の技術を適用できます。リポジトリはまだ空ですが、作者はソースコードを共有することを約束します。

ご覧いただきありがとうございます。

All Articles