مجموعة مختارة من المقالات حول التعلم الآلي: الحالات والأدلة والدراسات لشهر فبراير 2020



بعد نشر يناير ، واجه العدد الثاني من الملخص. ستجد هنا قائمة بمواد اللغة الإنجليزية لشهر فبراير ، والتي تمت كتابتها بدون أكاديمية غير ضرورية. تحتوي المنشورات على أمثلة برموز وروابط إلى مستودعات غير فارغة. التقنيات المذكورة هي في المجال العام وكثير منها لا يتطلب الحديد الثقيل للاختبار.

تنقسم المقالات إلى أربعة أنواع:
إعلانات أدوات ومجموعات بيانات مفتوحة المصدر
أدلة عملية لدراسات
حالة PyTorch و TensorFlow لبحوث التعلم الآلي
ML


إعلانات أدوات مفتوحة المصدر


ClearGrasp

تم تصميم الخوارزمية لحل مشكلة التعرف على الأشياء الشفافة التي تعكس الضوء بشكل غير متساوٍ وتكسره. أي كاميرا RGB-D قياسية مناسبة للعمل. أعلنت

PyTorch3D

Facebook عن مكتبة معيارية ومحسنة للغاية لـ PyTorch ، والتي تبسط التدريب العميق للنماذج في الصور ثلاثية الأبعاد.

Hydra الإطار

الجديد من النظام البيئي PyTorch ، والذي تم تصميمه لحل المشاكل المرتبطة بتعقيد المشاريع. يوفر إمكانات إدارة المشروع من خلال سطر الأوامر وملفات التكوين. TensorFlow.js لـ React Native



لا تستخدم الأداة عرض الويب للعرض ولا تعتمد على واجهة برمجة التطبيقات الخاصة بمنصات الويب التي يتم استخدامها في المتصفح. وبالتالي ، فهي عبارة عن منصة تكامل جديدة مع خلفية مناسبة لهذه البيئة.

مشغل ضغط المصفوفة يسمح لك

عامل التشغيل باستخدام أي وظيفة ضغط مصفوفة محددة على أنها عوامل إنشاء وإنشاء واجهة برمجة تطبيقات تدفق الموتر لتطبيق هذا الضغط ديناميكيًا أثناء تعلم أي متغير تدفق موتر.

توفر Torchmeta Meta-Learning

Library واجهة واحدة لمجموعات البيانات المختلفة لتبسيط إنشاء خوارزميات جديدة.

AutoFlip

كثيرا ما كنت ترغب في تغيير اتجاه الشاشة من أفقي (16: 9 أو 4: 3) إلى عمودي. أخيرا ، ظهر الإطار، مما يساعد على اقتصاص الإطارات ديناميكيًا بأقل خسارة. تحدد الأداة حدود الإطار والكائنات المتحركة ، مع ترك أهمها فقط على الشاشة.



مكتبة التحسين المقيدة

هي أداة لـ TensorFlow ، والتي تسمح لك بتقليل درجة النتائج غير النزيهة عند حل المشاكل من العالم الحقيقي ، عندما يتم أخذ العديد من المعلمات الإضافية في الاعتبار (على سبيل المثال ، عند إصدار القروض المصرفية). تحول الأداة خوارزميًا قيود جمع البيانات إلى لعبة محصلتها صفر للاعبين.

خرائط Poincare

باستخدام أداة الهندسة الزائديةيكشف العلاقات الهرمية للتشابه الزوجي للخلايا المختلفة. وهذا يسمح باستخدام التعلم الآلي لرسم خرائط تطور خلايا الكائنات الحية وتحليلها.

PyTorch Lightning + Torchbearer قام مبدعو تجريد Torchbearer

عالي المستوى بتوحيد قواهم مع تزايد شعبية PyTorch Lightning ويعملون الآن على فريقهم. يعمل التجريد على أتمتة عملية التطوير ويجعل الكود موحدًا وصيانته وقابلًا للتطوير. وهكذا ، حتى يتمكن الباحثون من التركيز بشكل أكبر على العلوم ، بدلاً من العمل باستخدام قاعدة الكود.

افتح الصور v6

تم إصدار الإصدار السادس من مجموعة بيانات Open Images ، حيث تم توسيع نوع التعليم والتعليق على الصور بشكل كبير. يتم التقاط الصور الفوتوغرافية بالتفصيل بحيث تؤثر أيضًا على التطوير الإضافي للبحوث متعددة التخصصات ، حيث يتم الجمع بين رؤية الكمبيوتر ومعالجة اللغة الطبيعية.

CCMatrix: مجموعة بيانات لنماذج الترجمة التدريبية تتكون

مجموعة البيانات من 4.5 مليار جملة نصية في 576 زوجًا من اللغات وستساعد في إنشاء نماذج NMT أكثر تقدمًا.

خطوط إرشاد


طريقة المكون الأساسي الموزع باستخدام TFX

كيف يسمح لك TensorFlow Transform بتطبيق طريقة المكون الرئيسي في شكل قابل للتطوير باستخدام موارد المجموعات الحسابية ، وكيفية تمكين معالجة التحويلات في خط أنابيب TFX.

تسريع الشبكات العصبية باستخدام TensorNetwork في Keras

مادة حول كيفية استخدام مكتبة TensorNetwork لمعالجة شبكات الموتر في سياق التعلم الآلي.

TensorFlow Lattice: التعلم الآلي المرن الخاضع للتحكم والمفسر

نظرة عامة تمهيدية على إمكانات المكتبة لتدريس نماذج شعرية محدودة ومفسرة.

الحالات


أقنعة الواقع المعزز مع TensorFlow.js التي تم

شراؤها لوريال ، يبدأ ModiFace تجربته في استخدام التعلم الآلي في سياق أقنعة الواقع المعزز. يوضح مثال العلامة التجارية للتجميل كيف يمكن تطبيق التعلم الآلي في التجارة الإلكترونية.

التعرف على لوحة الترخيص في الوقت

الفعلي تثبت الحالة خطوة بخطوة أن التعلم الآلي متاح الآن للجميع. يخبر المؤلف كيفية تجميع جهاز الميزانية في المنزل ، وإنشاء نموذج ، وتدريبه ، ووضعه على AWS ، وكذلك تطوير جزء من العميل.

تحديد تلوث الهواء باستخدام الهاتف

حالة لإنشاء تطبيق يحدد مستوى تلوث الهواء من صورة من كاميرا الهاتف. كانت المشكلة التي تحتاج إلى حل هي نقل البيانات من مستخدمين مختلفين للحصول على مزيد من التدريب للنموذج ، ولكن في نفس الوقت ضمان سلامة بيانات المستخدم.

إضافة تأثير حجم إلى صور ثنائية الأبعاد

يشارك Facebook تجربته في تطوير
برنامج شبكة عصبية تلافيفية يخلق تأثير صورة ثلاثي الأبعاد للصور ثنائية الأبعاد. عند الإنشاء ، كان من الضروري حل الكثير من المشاكل ، سواء في تدريب النموذج أو في تحسين النظام لدعم الهواتف المحمولة.



كيف لا يذهب كسر مع النمو السريع للمستخدمين

كيف استطاع مبدعو Dungeon AI توسيع نطاقهم لدعم مليون مستخدم ، ومع Cortex ، قاموا بتقديم خدمة صغيرة تستند إلى نموذج التعلم الآلي.

ابحاث


استخدام "البيانات المشعة"

تتيح لك طريقة "البيانات المشعة" تحديد أن نموذج التعلم الآلي قد تم تدريبه باستخدام مجموعة بيانات محددة. يمكن أن يساعد ذلك الباحثين والمهندسين على تتبع مجموعة البيانات التي تم استخدامها لتدريب النموذج حتى يتمكنوا من فهم أفضل لكيفية تأثير مجموعات البيانات المختلفة على أداء الشبكات العصبية المختلفة.

TyDi QA: مجموعة بيانات من الأسئلة والأجوبة بلغات مختلفة

نشرت Google دراسة ومجموعات بيانات تتكون من 200000 سؤال وإجابة من 11 لغة تمثل مجموعة واسعة من الظواهر اللغوية. طُلب من المشاركين في الدراسة طرح سؤال ذي صلة على أساس النص ، والذي لم يرد الجواب عليه في النص ، وبعد ذلك تم اقتراحه للعثور على إجابة السؤال في مقالة ويكيبيديا. وجمعت هذه البيانات مجموعة بيانات.

إنشاء مجموعات بيانات اصطناعية للتجارب السريرية

بسبب القيود المختلفة ، من الصعب جدًا إنشاء مجموعات بيانات تحتوي على صور لآفات الجلد. الآن هناك أداة تولد البيانات اللازمة لمزيد من التدريب. تأخذ DermGAN الصورة الحقيقية والخريطة الدلالية المقابلة مسبقًا التي تم إنشاؤها مسبقًا مع الخصائص الرئيسية للصورة الحقيقية (نوع الجلد ، حالة الجلد ، موقع الورم) ، والتي تولد منها مثالًا اصطناعيًا جديدًا بالخصائص المطلوبة.

فحص التصوير بالرنين المغناطيسي المعجل

الهدف من المشروع هو تسريع فحص التصوير بالرنين المغناطيسي للمرضى 10 مرات باستخدام الذكاء الاصطناعي. يتم إنشاء اللقطات باستخدام DNN من البيانات الأولية ، وغالبًا ما تظهر القطع الأثرية في العملية. توضح الدراسة كيف ساعد التعلم الآلي الضار على تقليل أعدادهم.

تحسين البنية التحتية للتوصيات بناءً على DNN

تحلل الدراسة العديد من البنى التحتية المستخدمة لإصدار توصيات مخصصة للمنتجات ومقاطع الفيديو وما إلى ذلك باستخدام DNN. يتم توفير الأدوات أيضًا للتحقق من مدى جودة عمل توصيات نطاق الإنتاج المستندة إلى DNN. على سبيل المثال ، يتم تنفيذ معيار لخوادم Intel المستخدمة في مراكز البيانات (Broadwell ، Haswell ، Skylake).

Txt2π

مراجعة لمنهج التعلم التعزيزي الجديد. تم تصميمه للمساعدة في حل مهمة صعبة يحتاج فيها الوكيل إلى اتخاذ العديد من الخطوات بناءً على الهدف والمعرفة بالبيئة ، والتي يمكن أن تتغير. يجب أن يتعلم النموذج لعب لعبة حيث تحتاج إلى هزيمة الوحوش بناءً على قواعد معينة (اقرأ لمحاربة الوحوش).

تدريب CNN على الصور عالية الدقة يسمح

التوازي الحالي للبيانات والنماذج بتدريب الشبكات العصبية بمليارات المعلمات ، ولكن التدريب على البيانات التي تتكون من صور عالية الدقة ، مثل صور الأشعة المقطعية ، لا يزال يمثل مشكلة. في هذه الورقة ، نعتبر إمكانية تطبيق الشبكات العصبية التلافيفية في الصور عالية الدقة (يوجد رمز المشروع).

التدريب على خريطة الشارع

تجمع Google التطبيقات من الباحثين المستعدين للمساعدة في إنشاء مجموعة بيانات للتدريب اللاحق للشبكات العصبية ذات التوجه المكاني.

T5: أداة جديدة لنقل التعلم

نتيجة لمسح واسع النطاق ، حدد الباحثون أفضل تقنيات تعلم النقل وقاموا بتطبيق هذه الأفكار لإنشاء نموذج T5 المدرب مسبقًا ، بالإضافة إلى مجموعة البيانات التي تم تدريبها عليها.

في اختيار مارس ، توقع مقالات عن استخدام ML في مكافحة COVID-19: تحديد درجة حرارة الأشخاص في الوقت الحقيقي عن طريق الأشعة تحت الحمراء ، وتشخيص الفيروس ، وتتبع تفشي الوباء ، والمزيد. في غضون ذلك ، هذا كل شيء. شكرا للانتباه!

All Articles