👨🏿 💏 🤗 المرونة والأتمتة في التعلم الآلي 🚣🏽 👩🏾‍🔬 💓

في هذه المقالة ، أود أن أتحدث عن الصعوبات الرئيسية لأتمتة تعلُم الآلة ، وطبيعتها ومزاياها ، وكذلك التفكير في نهج أكثر مرونة يسمح لك بالابتعاد عن بعض أوجه القصور.

الأتمتة ، بحكم تعريفها ، Mikell P. Groover هي تقنية يتم من خلالها تنفيذ عملية أو إجراء بأقل مشاركة بشرية. تمكنت الأتمتة منذ فترة طويلة من تحقيق إنتاجية متزايدة ، مما يؤدي غالبًا إلى انخفاض التكاليف لكل وحدة من المنتج. تتحسن طرق الأتمتة ، وكذلك مجالات تطبيقها ، بسرعة وقد تطورت عبر القرون الماضية من الآليات البسيطة إلى الروبوتات الصناعية. لا تبدأ الأتمتة في التأثير على العمل البدني فحسب ، بل تؤثر أيضًا على الفكر ، حيث تصل إلى مجالات جديدة نسبيًا ، بما في ذلك التعلم الآلي - التعلم الآلي الآلي (auto ml ، aml). في الوقت نفسه ، وجدت أتمتة تعلُم الآلة تطبيقه بالفعل في عدد من المنتجات التجارية (على سبيل المثال ، Google AutoML و SAP AutoML وغيرها).

تنصل

لا تدعي هذه المقالة أنها متشددة في هذا المجال وهي رؤية المؤلف.

التعلم الآلي الآلي

ترتبط المهام في مجال معالجة البيانات والتعلم الآلي بالعديد من العوامل التي تنشأ بسبب تعقيد النظام وتعقيد حلها. وهي تشمل ( وفقًا لتشارلز ساتون ):

وجود عدم اليقين وعدم اليقين ، مما يؤدي إلى عدم وجود معرفة مسبقة بالبيانات والتبعيات المطلوبة. وبالتالي ، فإن عنصر البحث موجود دائمًا.
"الموت من ألف جروح." من الناحية العملية ، عند بناء خط أنابيب لمعالجة البيانات وتحليلها والنمذجة اللاحقة ، يجب عليك اتخاذ العديد من القرارات الكبيرة والصغيرة. على سبيل المثال ، هل من الضروري تطبيع البيانات ، إذا كان الأمر كذلك ، ما هي الطريقة ، وما هي المعلمات التي يجب أن تحتوي عليها هذه الطريقة؟ إلخ.
وجود حلقات التغذية المرتدة الناتجة عن عدم اليقين. كلما زاد الانغماس في المهمة والبيانات ، زادت معرفتك بها. وهذا يؤدي إلى الحاجة إلى التراجع وإجراء تغييرات على آليات المعالجة والتحليل الحالية.
بالإضافة إلى ذلك ، فإن نتائج النماذج التي تم الحصول عليها بواسطة خوارزميات التعلم الآلي ليست سوى تقريبًا للواقع ، أي من الواضح أنها ليست دقيقة.

وبالتالي ، يمكن اعتبار عملية الحصول على خط أنابيب كامل لمعالجة البيانات وتحليلها بمثابة نظام معقد (أي نظام معقد).

نظام معقد

Peter Sloot, « » « », . , () , , () , () .. , , .

من ناحية ، يؤدي وجود هذه العوامل إلى تعقيد كل من حل مشاكل التعلم الآلية والعميقة وأتمتتها. من ناحية أخرى ، تسمح لنا قدرات الحوسبة المتزايدة باستمرار والتي يمكن الوصول إليها بإرفاق المزيد من الموارد لهذه المهمة.

وفقًا لمعيار CRISP-DM الشائع ، تتكون دورة حياة المشروع المتعلقة بتحليل البيانات بشكل متكرر من ست مراحل رئيسية: فهم مهمة العمل (فهم الأعمال) ، وفهم ودراسة البيانات (فهم البيانات) ، ومعالجة البيانات (إعداد البيانات) ، والنمذجة ( النمذجة) ، وتقييم الجودة (التقييم) والتطبيق العملي (النشر والتطبيق). من الناحية العملية ، لا يمكن أتمتة جميع هذه الخطوات بشكل فعال اليوم.

تركز معظم الأعمال أو المكتبات الحالية (h2o و auto-sklearn و autokeras) على أتمتة النمذجة وجزئيًا على تقييم الجودة. ومع ذلك ، فإن توسيع النهج نحو أتمتة معالجة البيانات يسمح بتغطية المزيد من المراحل (التي تم تطبيقها ، على سبيل المثال ، في خدمة Google AutoML).

صياغة المشكلة

يمكن حل مهام التعلم الآلي مع المعلم بطرق مختلفة ، يتم تقليل معظمها إلى تقليل وظيفة الخسارة

أو تعظيم وظيفة الاحتمال

J

$J$

، من أجل الحصول على تقدير للمعلمات

L

$L$

{\hat{θ}}_{m}

$\hat{θ}_m$ بناء على عينة بيانات التدريب المتاحة

y_{t}

$y_t$ :

المرونة والأتمتة في التعلم الآلي

التعلم الآلي الآلي

صياغة المشكلة

من الأتمتة إلى شبه الأتمتة

استنتاج

More articles:

	ناقل الحركة اليدوي - يتحكم السائق في القابض والتروس. القياس: يقوم المستخدم بشكل مستقل باختيار الطرق وإنشاء خط أنابيب.
	تلقائي - ليست هناك حاجة لاختيار التروس بنفسك ، ما عليك سوى ضبط الوضع. القياس: يحصل المستخدم على حل جاهز.
	– , . : , .