مجموعة مختارة من المقالات حول التعلم الآلي: دراسات الحالة والأدلة والبحوث لشهر يناير 2020

العمل البحثي في ​​مجال التعلم الآلي يغادر المختبرات الجامعية تدريجياً ومن التطبيق العلمي. ومع ذلك ، لا يزال من الصعب العثور على المقالات ذات الصلة المكتوبة بلغة بسيطة وبدون مليار حاشية سفلية.

يحتوي هذا المنشور على قائمة بمواد اللغة الإنجليزية لشهر يناير ، والتي تمت كتابتها دون أكاديمية غير ضرورية. ستجد فيها أمثلة برموز وروابط إلى مستودعات غير فارغة . التقنيات المذكورة هي في المجال العام ولا تتطلب الحديد الثقيل للاختبار.

تنقسم المقالات إلى أربعة أنواع: الإعلانات عن أدوات مفتوحة المصدر ، وحالات استخدام التعلم الآلي في التنمية التجارية ، وبحوث ML ، والمبادئ التوجيهية العملية لاستخدام PyTorch و TensorFlow.



إعلانات تقنية مفتوحة المصدر لتعلم الآلة


LaserTagger

تناقش المقالة بإيجاز وظائف وبنية LaserTagger ؛ أداة تسمح لك بإنشاء نص بطرق مختلفة - لدمج الجمل وتقسيمها ، وكذلك إعادة بيعها بكلمات أخرى. على عكس نماذج seq2seq ، فإنه يعيد استخدام الكلمات ، مما يضمن سرعة عالية في توليد النص.

المصلح

لمعالجة البيانات التسلسلية - نص أو موسيقى أو فيديو - يتطلب مورد ذاكرة كبير ، لأن هذه البيانات تعتمد على السياق المحيط. على عكس Transformer ، نموذج معماري شهير للشبكات العصبية ، مصلحيستهلك ذاكرة أقل بكثير للاحتفاظ بالسياق - فقط 16 جيجابايت. هذا يكفي للعمل مع مجموعات بيانات نصية كبيرة - كان المصلح ، على سبيل المثال ، قادرًا على معالجة النص "الجريمة والعقاب". يمكنك أيضًا استخدام الأداة "لإنهاء" أجزاء الصورة المفقودة.

Wav2letter @ في أي مكان تستخدم

معظم أطر التعرف على الكلام في الوقت الفعلي الشبكات العصبية المتكررة ، بينما Wav2letter @ في أي مكانيستخدم النموذج الصوتي التلافيفي. إطار العمل مكتوب بلغة C ++ ، ويمكن دمجه بسهولة في لغات البرمجة الأخرى. تمكن المبدعون من زيادة الإنتاجية ثلاث مرات وتوفير الكفاءة الحسابية على المعالجات غير القوية. تقدم المقالة معايير وروابط للنماذج التي ستساعد في تكرار نتائج التعلم.

Polygames

إطار عمل يعلم الذكاء الاصطناعي للعب الألعاب الإستراتيجية ، حتى الألعاب غير المألوفة تمامًا. بخلاف التقنيات المماثلة الأخرى ، لا يتعلم هذا النموذج من العديد من الأمثلة على إدارة اللعبة الناجحة ، وبالتالي لا يتطلب مجموعات بيانات. أداة

HiPlot

لتصور بيانات البحث. يسمح لك بتقييم فعالية المعلمات الفائقة ، مثل سرعة التعلم والتنظيم والهندسة المعمارية. تقدم المقالة مقتطفات من كود بايثون وأمثلة على تصوراتهم. يتم دعم HiPlot بواسطة دفتر ملاحظات المشتري.

أدلة التعلم الآلي



TensorFlow.js تسمح لك

مكتبة المصادر المفتوحة بتشغيل نماذج التعلم الآلي دون مغادرة النظام البيئي JS. يعمل في جميع المتصفحات الحالية ، وجانب الخادم على Node.js ، والأنظمة الأساسية للجوّال على React Native.

إنشاء مكون TFX مخصص

يمكن لأي شخص استخدام منصة TFX لإنشاء خطوط أنابيب تعلم الآلة جاهزة للاستخدام. تقدم المنصة الكثير من المكونات القياسية ، ولكن هناك أوقات تكون فيها غير مناسبة. تتحدث هذه المقالة عن كيفية إنشاء خط أنابيب مخصص بالكامل للعمل مع TensorFlow.

تسريع NVIDIA Dali مع PyTorch

تتناول المقالة بعض الطرق لتحسين استخدام DALI وإنشاء عملية تستخدم وحدة المعالجة المركزية فقط (بدون GPU) وتسريع عملية التعلم الآلي على PyTorch 4 مرات.

التحكم في إصدار البيانات والنماذج للتجربة السريعة في التعلم الآلي

توضح هذه المقالة كيفية إنشاء مجموعات بيانات مُحدثة الإصدارات لاستخدامها في عملية تعلم الآلة القابلة للتكرار. كمثال ، باستخدام Git و Docker و Quilt ، يتم إنشاء شبكة عصبية عميقة للتعرف على الكائنات باستخدام Detectron2 ، وهو نظام قائم على PyTorch يستخدم خوارزميات للتعرف على الكائنات.

التدريب النشط على النقل في PyTorch

التدريب على النقل هو عملية عندما يتكيف نموذج التعلم الآلي الذي تم إنشاؤه لمهمة معينة مع مهمة أخرى. عادة ما يكفي إعادة تدريب الطبقات القليلة الأخيرة في نموذج موجود. الميزة هي أن هذا يتطلب الحد الأدنى من وسم البيانات من قبل البشر. توفر هذه المقالة إرشادات حول تطبيق تعلم النقل على التعلم النشط ، والذي يهدف إلى تحديد أنماط البيانات التي يحتاج الأشخاص إلى تصنيفها.

حالات من التنمية التجارية


إنشاء مكتبة موسيقى ذكية مع TensorFlow

Developers لمنصة تدفق الموسيقى الرائدة في الصين ، يشاركون تجربتهم باستخدام هذا الإطار. يخبرون بالتفصيل عن الأدوات المستخدمة ، وكيف دربوا النموذج على تحديد نوع الموسيقى وأسلوبها للتوصيات اللاحقة. افصل الصوت عن الموسيقى ، على سبيل المثال ، لإخراج كلمات الأغنية باستخدام التعرف على النص نظرًا لأن بعض المحتوى على المنصة تم تسجيله من قبل المستخدمين بدون معدات تسجيل صوتي خاصة ، تعلم المؤلفون التخلص من التداخل وضوضاء الخلفية.

تدريب الكلاب مع التعلم الآلي

من المرجح أن تجد الكلاب المطيعة التي تعرف الفريق مالكين جدد وتترك الملجأ. ومع ذلك ، ليس كل الملاجئ لديها القدرة على تدريب الكلاب. والهدف من المشروع هو تدريب السيارة لفهم ما إذا كان الكلب اكتمال "الجلوس" الأمر، ينبح الكلب أو يئن، الخ

التدريب ومكنسة كهربائية و

الشركة المصنعة الصينية من المكانس الكهربائية الذكية دربت الأجهزة من التعرف على الجوارب والأسلاك المنتشرة في أنحاء الأرض. تتحدث الحالة عن صعوبات إنشاء مجموعة بيانات فريدة من الصور الفوتوغرافية واستخدام العديد من خوارزميات التعلم الآلي.

قم بإنشاء كاميرا ذكية باستخدام TensorFlow Lite على Raspberry Pi

يمكن للكاميرا اكتشاف ابتسامة على وجه الشخص والتقاط صورة تلقائيًا. يمكن التحكم فيها عن طريق الأوامر الصوتية. من أجل التطوير ، اخترنا Raspberry Pi 3B + ، مع غيغابايت من ذاكرة الوصول العشوائي ونظام تشغيل 32 بت. لقد أسس TensorFlow Light نفسه كإطار عمل للأجهزة المحمولة وأجهزة إنترنت الأشياء. توضح المقالة خوارزميات نظام التعرف على الابتسامات والأوامر الصوتية.

ابحاث


الشبكة العصبية لحل المعادلات الرياضية

قام Facebook بتطوير أول شبكة عصبية تستخدم المنطق الرمزي لحل المعادلات التفاضلية والتكاملية من النوع الأول والثاني. كان من المعتاد أن التعلم الآلي لم يكن مناسبًا لمثل هذه المهمة ، لأن الرياضيات تتطلب الدقة المطلقة ، وليست تقريبية. استخدم مؤلفو الدراسة الترجمة الآلية العصبية. تم اعتبار المعادلات بواسطة الآلة كجمل نصية ، والحلول على أنها ترجمتها. لهذا كان من الضروري تجميع بناء الجملة وإعداد مجموعة من بيانات التدريب من أكثر من 100 مليون زوج من المعادلات وحلولها. وهكذا ، أظهرت الدراسة أنه يمكن استخدام الشبكات العصبية ليس فقط للتمييز بين الأنماط.

AI Habitat: الملاحة فائقة الدقة قامت منظمة العفو الدولية في مساحة

Facebook بتطوير خوارزمية تعلم تعزيز DD-PPO واسعة النطاق تتكيف بشكل فعال مع التنقل في مساحة المباني السكنية والمكاتب باستخدام البيانات من كاميرا RGB-D و GPS والبوصلة. الروبوتات المدربة باستخدام DD-PPO تحقق هدفها بدقة 99.9٪. تحتوي المقالة على مقاطع فيديو رائعة.

هل يمكنك الوثوق في عدم اليقين في نموذجك؟

نشرت كود و نتائج البحوث، والتي تركز على مشكلة التحول المتغير ، عندما لا تتطابق البيانات الخاصة بتدريب النموذج مع عينة الاختبار. أجرى المؤلفون تحليلاً مقارنًا شاملاً للنماذج الأكثر تقدمًا ، وزودهم بمجموعات بيانات من النصوص والصور والإعلان عبر الإنترنت وعلم الجينوم. كان الهدف هو تحديد دقة الأساليب الشعبية. في المقاييس ، أثبتت طريقة المجموعة أنها الأكثر موثوقية.

شكرا للانتباه!

قبل أن تقوم بإصدار تجريبي ، نرحب بأي توصيات.

Source: https://habr.com/ru/post/undefined/


All Articles