المرونة والأتمتة في التعلم الآلي

في هذه المقالة ، أود أن أتحدث عن الصعوبات الرئيسية لأتمتة تعلُم الآلة ، وطبيعتها ومزاياها ، وكذلك التفكير في نهج أكثر مرونة يسمح لك بالابتعاد عن بعض أوجه القصور.

صورة

الأتمتة ، بحكم تعريفها ، Mikell P. Groover هي تقنية يتم من خلالها تنفيذ عملية أو إجراء بأقل مشاركة بشرية. تمكنت الأتمتة منذ فترة طويلة من تحقيق إنتاجية متزايدة ، مما يؤدي غالبًا إلى انخفاض التكاليف لكل وحدة من المنتج. تتحسن طرق الأتمتة ، وكذلك مجالات تطبيقها ، بسرعة وقد تطورت عبر القرون الماضية من الآليات البسيطة إلى الروبوتات الصناعية. لا تبدأ الأتمتة في التأثير على العمل البدني فحسب ، بل تؤثر أيضًا على الفكر ، حيث تصل إلى مجالات جديدة نسبيًا ، بما في ذلك التعلم الآلي - التعلم الآلي الآلي (auto ml ، aml). في الوقت نفسه ، وجدت أتمتة تعلُم الآلة تطبيقه بالفعل في عدد من المنتجات التجارية (على سبيل المثال ، Google AutoML و SAP AutoML وغيرها).

صورةصورةصورة

تنصل
لا تدعي هذه المقالة أنها متشددة في هذا المجال وهي رؤية المؤلف.

التعلم الآلي الآلي


ترتبط المهام في مجال معالجة البيانات والتعلم الآلي بالعديد من العوامل التي تنشأ بسبب تعقيد النظام وتعقيد حلها. وهي تشمل ( وفقًا لتشارلز ساتون ):

  • وجود عدم اليقين وعدم اليقين ، مما يؤدي إلى عدم وجود معرفة مسبقة بالبيانات والتبعيات المطلوبة. وبالتالي ، فإن عنصر البحث موجود دائمًا.
  • "الموت من ألف جروح." من الناحية العملية ، عند بناء خط أنابيب لمعالجة البيانات وتحليلها والنمذجة اللاحقة ، يجب عليك اتخاذ العديد من القرارات الكبيرة والصغيرة. على سبيل المثال ، هل من الضروري تطبيع البيانات ، إذا كان الأمر كذلك ، ما هي الطريقة ، وما هي المعلمات التي يجب أن تحتوي عليها هذه الطريقة؟ إلخ.
  • وجود حلقات التغذية المرتدة الناتجة عن عدم اليقين. كلما زاد الانغماس في المهمة والبيانات ، زادت معرفتك بها. وهذا يؤدي إلى الحاجة إلى التراجع وإجراء تغييرات على آليات المعالجة والتحليل الحالية.
  • بالإضافة إلى ذلك ، فإن نتائج النماذج التي تم الحصول عليها بواسطة خوارزميات التعلم الآلي ليست سوى تقريبًا للواقع ، أي من الواضح أنها ليست دقيقة.

صورة

وبالتالي ، يمكن اعتبار عملية الحصول على خط أنابيب كامل لمعالجة البيانات وتحليلها بمثابة نظام معقد (أي نظام معقد).

نظام معقد
Peter Sloot, « » « », . , () , , () , () .. , , .

من ناحية ، يؤدي وجود هذه العوامل إلى تعقيد كل من حل مشاكل التعلم الآلية والعميقة وأتمتتها. من ناحية أخرى ، تسمح لنا قدرات الحوسبة المتزايدة باستمرار والتي يمكن الوصول إليها بإرفاق المزيد من الموارد لهذه المهمة.

صورةوفقًا لمعيار CRISP-DM الشائع ، تتكون دورة حياة المشروع المتعلقة بتحليل البيانات بشكل متكرر من ست مراحل رئيسية: فهم مهمة العمل (فهم الأعمال) ، وفهم ودراسة البيانات (فهم البيانات) ، ومعالجة البيانات (إعداد البيانات) ، والنمذجة ( النمذجة) ، وتقييم الجودة (التقييم) والتطبيق العملي (النشر والتطبيق). من الناحية العملية ، لا يمكن أتمتة جميع هذه الخطوات بشكل فعال اليوم.

تركز معظم الأعمال أو المكتبات الحالية (h2o و auto-sklearn و autokeras) على أتمتة النمذجة وجزئيًا على تقييم الجودة. ومع ذلك ، فإن توسيع النهج نحو أتمتة معالجة البيانات يسمح بتغطية المزيد من المراحل (التي تم تطبيقها ، على سبيل المثال ، في خدمة Google AutoML).

صياغة المشكلة


يمكن حل مهام التعلم الآلي مع المعلم بطرق مختلفة ، يتم تقليل معظمها إلى تقليل وظيفة الخسارة أو تعظيم وظيفة الاحتمالJ ، من أجل الحصول على تقدير للمعلماتLθ^m بناء على عينة بيانات التدريب المتاحة yt:

All Articles