مجموعة مختارة من المقالات حول التعلم الآلي: الحالات والأدلة والدراسات لشهر مايو 2020


نواصل جمع الأخبار والأدوات الأكثر إثارة للاهتمام من مجال التعلم الآلي ، المكتوبة بلغة يسهل الوصول إليها.

Jukebox في

وقت سابق من هذا الشهر ، أثارت OpenAI اهتمامًا كبيرًا بمجتمع ML من خلال نشر شفرة المصدر لمشروعها المسمى Jukebox. تتيح لك هذه الأداة التي تستخدم خوارزميات التعلم الآلي إنشاء تركيبات للفنانين المشهورين. على الشبكة ، يمكنك بالفعل العثور على أمثلة للمسارات التي تم إنشاؤها بواسطة المستخدمين ، هناك مجموعات غير عادية للغاية.

عجّل AR Copy لصق

المطور الفرنسي Cyril Diagne تطبيقًا للواقع المعزز يأخذ صورًا للأشياء ، ويزيل كل الخلفية غير الضرورية من الصور و (باستخدام U ^ 2-Net) ينقل النتيجة إلى البرامج التي تعمل على الكمبيوتر. على سبيل المثال ، يوضح المؤلف كيف ، باستخدام التطبيق ، يمكنك بسرعة تحديد الرسوم التوضيحية وإضافتها إلى العرض التقديمي. يمكنك بالفعل الاطلاع على الرمز والاشتراك للوصول المبكر إلى التطبيق ، الذي هو قيد التطوير حاليًا.



Pose Animator

أداة Pose Animator أداة مفتوحة المصدر للرسوم المتحركة على الويب يمكنك من خلالها تحريك الشخصيات المرسومة بتنسيق SVG. تعتمد الأداة على مكتبتين أخريين Facemesh و PoseNet اللتين تستخدمان كاميرا ويب لالتقاط الحركات. توضح المقالة كيفية إنشاء الأداة وتوضح كيفية استخدامها.



حديقة حيوانات المجرة

دراسة حالة حول كيفية الجمع بنجاح بين التعهيد الجماعي والتعلم الآلي لمعالجة المعلومات المعقدة بسرعة. جمعت منصة Galaxy Zoo بين هذين النهجين لدراسة تطور المجرات من خلال تصنيف ملايين الصور. تصف المادة كيفية وضع علامة على البيانات التي ستساعد بشكل أفضل على تحسين النموذج الحالي فقط.

يشارك DistilBERT

Startup Hugging Face تجربته في إنشاء واجهة برمجة تطبيقات عامة يمكنك من خلالها تحسين أداء نماذج NLP على Node.js.

محلل

التجارب السريرية تفشل معظم التجارب السريرية في توظيف عدد كاف من المشاركين. هذا يرجع إلى حقيقة أن الناس بدون عسل. لا يفهم التعليم دائمًا معايير الاختيار وتفاصيل البحث. قدم الفيسبوكأداة مفتوحة المصدر تهدف إلى حل هذه المشكلة. أعلنت

GrokNet

Facebook عن نظام رؤية عالمي للكمبيوتر مصمم للتجارة الإلكترونية. إنها قادرة على تحديد سمات البضائع في فئات مختلفة ، من السيارات إلى ديكور المنزل. تصف المقالة كيفية تدريب النموذج على سبع مجموعات بيانات ، وما الصعوبات التي واجهتها. تُظهر سلسلة من مقاطع الفيديو أيضًا كيف سيساعد هذا النموذج المنصة على تغيير التداول عبر الإنترنت.

S2IGAN

يبدو أننا وعدنا بعدم تضمين المواد التي تحتوي على روابط إلى مستودعات فارغة في المجموعة ، لكني أريد استثناءً. S2IGAN هو إطار عمل يترجم الكلام إلى صور. باستخدام برنامج تشفير مزدوج ، تم إنشاء نموذج يقوم بإنشاء صور باستخدام وصف صوتي. يعد مؤلفو الدراسة بنشر الرمز قريبًا ، ولكن في الوقت الحالي يجب أن يكونوا راضيين بأمثلة للطيور المولدة.



تقدير متناسق لعمق الفيديو

يتم تقديم خوارزمية ، باستخدام شبكة عصبية تلافيفية ، تحدد عمق الإطارات الفردية وتستعيد عمقًا متناسقًا هندسيًا للفيديو بأكمله. هذا يساعد على التعامل مع عدد من القيود ، على سبيل المثال ، عندما تكون الصورة غير مستقرة بسبب الاهتزاز. يمكنك تطبيق تقنية مماثلة في مختلف المجالات ، لتأثيرات الواقع المعزز أو سيارات الطيار الآلي. لا يزال المستودع فارغًا ، لكن المؤلفين يعدون بمشاركة شفرة المصدر.

هذا كل شيء ، شكرا للمشاهدة!

All Articles