التفكير العالي في التعلم العميق

مرحبا يا أصدقاء. والمواد اليوم مخصصة لإطلاق مجموعة التالية من المجموعات في الأساسية و المتقدمة دورات "الرياضيات للعلوم البيانات".




سنتطرق اليوم إلى بعض الأفكار حول طرق التعلم العميق. نبدأ بمراجعة طرق القالب لتطبيق التعلم العميق في البيئة العلمية ، وبعد ذلك سنتحدث عن عملية التصميم الشامل ، وكذلك بإيجاز عن ميزات طرق التعلم الآلي البديلة التي قد تكون أكثر واعدة لحل مشكلات معينة.

قوالب التعلم العميق للعلوم


كيف يتم استخدام طرق التعلم العميق عادة في المجتمع العلمي؟ على مستوى عالٍ ، يمكنك صياغة العديد من طرق القوالب التي يمكن من خلالها استخدام التعلم العميق في المهام التالية:

  1. التوقعات. , – (). . , , , , . , « / ». – , , . , ( ) (, ), .
  2. . , , . . , . , , , . , . , .
  3. . , (, , , ), . , , , , .

Workflow


باستخدام قوالب تطبيقات التعلم العميق المذكورة أعلاه ، سنلقي نظرة على سير العمل لتصميم نظام التعلم العميق من البداية إلى النهاية. في الشكل 1 ، يمكنك أن ترى كيف يبدو سير عمل التعلم العميق النموذجي.


الشكل 1: رسم تخطيطي لسير عمل التعلم العميق النموذجي.

يمكن النظر إلى عملية تطوير تطبيق التعلم العميق النموذجية على أنها تتكون من ثلاث خطوات رئيسية: (1) خطوة معالجة البيانات ، (2) مكون التدريب ، (3) التحقق والتحليل. تتضمن كل مرحلة من هذه المراحل عدة مراحل وأساليب مرتبطة بها ، والتي تظهر أيضًا في الشكل. في هذه المراجعة ، سنغطي معظم أساليب مرحلة التدريب والعديد من تقنيات التحقق وتحليل البيانات. يرجى ملاحظة أنه في حين أن التسلسل الطبيعي يتضمن معالجة البيانات أولاً ، ثم التدريب ، والتحقق من الصحة في نهاية المطاف ، فمن المرجح أن تؤدي عملية التطوير القياسية إلى عدة تكرارات للمراحل ، أي أنه سيتم مراجعة الطريقة أو الاختيار الذي تم في مرحلة معينة بناء على نتائج المرحلة اللاحقة.

بعد اختيار مشكلة التنبؤ التي تهمك ، يمكنك التفكير في ثلاث مراحل من تصميم واستخدام نظام التعلم العميق: (1) مرحلة معالجة البيانات ، على سبيل المثال ، جمع ، ووضع العلامات ، والمعالجة المسبقة ، والتصور ، وما إلى ذلك ، (2) مرحلة التدريب ، على سبيل المثال ، اختيار نموذج الشبكة العصبية ، تعريف المهام والأساليب لتدريب النموذج ، (3) مرحلة التحقق والتحليل ، حيث ، بناءً على البيانات التي تم الحصول عليها ، يتم إجراء تقييم الكفاءة ، بالإضافة إلى تحليل وتفسير الأفكار المخفية والدراسات الاستئصالية للطرق العامة.

بطبيعة الحال ، هذه المراحل الثلاث تتبع بعضها البعض. ومع ذلك ، غالبًا ما تكون المحاولة الأولى لإنشاء نظام تعلم عميق غير ناجحة. لحل المشاكل ، من المهم أن نتذكر الطبيعة التكرارية لعملية التصميم ، حيث تعمل نتائج المراحل المختلفة كأساس لمراجعة الهندسة وإعادة تنفيذ المراحل الأخرى.

في الشكل رقم 1 يبين أمثلة من التكرارات مشتركة مع السهام ربط الثنائية: (ط) السهم حاكي (1) ، والذي يتوافق مع التكرار في جمع البيانات العملية، لأنه يحدث ذلك بعد عملية التصور البيانات leyblinga قد تحتاج البيانات الخام إلى تعديل، حيث كانت النتيجة جدا صاخبة أو لم تلتقط الهدف المطلوب ؛ (2) سهم متكرر (2)، الذي يتوافق مع التكرارات في عملية التعلم ، على سبيل المثال ، إذا كان الهدف أو الطريقة الأخرى أكثر ملاءمة ، أو إذا كانت عملية التعلم بحاجة إلى تقسيمها إلى عدة مراحل ، وإجراء الإشراف الذاتي الأول ، ثم التدريب مع المعلم ؛ (3) السهم المتكرر (3) ، المسؤول عن تغيير خطوات معالجة البيانات بناءً على نتائج مرحلة التدريب ؛ "4" سهم متكرر (4)مسؤول عن تغيير بنية عملية التعلم بناءً على النتائج التي تم الحصول عليها في مرحلة التحقق من الصحة لتقليل وقت التدريب أو استخدام نموذج أبسط ؛ (5) سهم التكرار (5) هو تكيف لخطوات معالجة البيانات استنادًا إلى نتائج التحقق / التحليل ، على سبيل المثال ، عندما يعتمد النموذج على سمات بيانات خاطئة ، ويجب إعادة جمع البيانات لتجنب ذلك.

التركيز البحثي والتسمية


في هذا القسم ، سنتحدث عن العديد من الطرق المستخدمة في مرحلة التدريب ، جنبًا إلى جنب مع بعض الأساليب التي تعتبر نموذجية لمراحل معالجة البيانات والتحقق منها (على سبيل المثال ، التعزيز ، التفسير ، وتحليل التمثيل).

في مرحلة التدريب ، نعتبر النماذج والمهام والأساليب الشائعة. من خلال النماذج (والتي تسمى أحيانًا العمارة) نحن نفهم بنية الشبكة العصبية للتعلم العميق - عدد الطبقات ونوعها وعدد الخلايا العصبية ، إلخ. على سبيل المثال ، في مهمة تصنيف الصور ، يتم إدخال الصور ، ويأتي التوزيع الاحتمالي على مجموعة (منفصلة) من الفئات (أو الفئات) المختلفة. نعني بالأساليب نوع التدريب المستخدم لتدريب النظام. على سبيل المثال ، يعد التعلم مع المعلم عملية تعلم شائعة عندما تتلقى شبكة عصبية بيانات ذات علامات ، حيث تشير التسميات إلى الملاحظات.

على عكس النماذج والمهام المختلفة ، يمكن أن تكون الطرق مجموعات فرعية لطرق أخرى. على سبيل المثال ، الإشراف الذاتي- هذه هي الطريقة التي يتم فيها تدريب الشبكة العصبية على مثيلات البيانات والملصقات ، حيث يتم إنشاء الملصقات تلقائيًا على مثيلات البيانات ، ويمكن أيضًا أن تُعزى هذه الطريقة إلى طرق التدريس مع المعلم. يبدو هذا مربكا بعض الشيء! ومع ذلك ، في هذه المرحلة ، يكفي أن يكون لديك على الأقل فهم عام للنماذج والمشكلات والأساليب.

هل تستخدم التعلم العميق أم لا؟


قبل الغوص في الأساليب المختلفة للتعلم العميق ، من المهم صياغة المشكلة وفهم ما إذا كان التعلم العميق سيوفر الأدوات المناسبة لحلها. توفر النماذج الأساسية القوية للشبكات العصبية العديد من الوظائف المعقدة ، مثل تحويلات الصورة المعقدة. ومع ذلك ، في كثير من الحالات ، قد لا يكون التعلم العميق أفضل خطوة أولى أو قد لا يكون مناسبًا لحل المشكلة. أدناه نستعرض بإيجاز أكثر طرق التعلم الآلي شيوعًا ، خاصة في السياقات العلمية.

تخفيض البعد والتجميع. في المجتمع العلمي ، الهدف النهائي لتحليل البيانات هو فهم الآليات الأساسية التي تولد أنماطًا في البيانات. عندما يكون الهدف كذلك ، فإن تقليل الأبعاد وتجميعها هي طرق بسيطة ولكنها فعالة للغاية للكشف عن خصائص البيانات المخفية. غالبًا ما تكون مفيدة في خطوة البحث وتصور البيانات (حتى إذا تم استخدام طرق أكثر تعقيدًا لاحقًا).

تخفيض البعد.طرق تقليل البعد خطية ، أي أنها تعتمد على التحولات الخطية لتقليل بُعد البيانات ، أو غير الخطي ، أي تقليل البعد مع الحفاظ التقريبي على بنية البيانات غير الخطية. الطرق الخطية الشائعة لتقليل الأبعاد هي طريقة المكون الأساسي وتحلل المصفوفة غير السالبة ، في حين أن الطرق غير الخطية هي تضمين الاستوكاستك للجيران مع توزيع t و UMAP. العديد من الأساليب للحد من الأبعاد بالفعل تطبيقات الجودة في عبوات مثل scikit تعلم أو على جيثب (مثل github.com/oreillymedia/t-SNE-tutorial أو github.com/lmcinnes/umap ).

تجمع. غالبًا ما توفر تقنيات التجميع المستخدمة جنبًا إلى جنب مع تقليل الأبعاد طريقة قوية لتحديد أوجه التشابه والاختلاف في مجموعة البيانات. يتم استخدام الطرق بشكل شائع ، مثل طريقة k-الوسائل (غالبًا طريقة k-يعني المعدلة) ، ونموذج خليط من التوزيعات الغوسية ، والتجمع الهرمي والتجمع الطيفي. مثل طرق تقليل الأبعاد ، فإن طرق التجميع لها تطبيقات جيدة في حزم مثل تعلم الحروف .

الانحدار الخطي والانحدار اللوجستي (والاختلافات). ربما تكون أكثر الأساليب الأساسية لحل مشكلة التدريس مع المعلم ، مثل التصنيف والانحدار ، والانحدار الخطي واللوجستي واختلافاتها (على سبيل المثال ، Lasso and ridge regression) يمكن أن تكون مفيدة بشكل خاص في حالة البيانات المحدودة ومجموعة واضحة من الميزات (ربما تمت معالجتها مسبقًا) (على سبيل المثال ، في شكل بيانات مجدولة). تتيح هذه الأساليب أيضًا تقييم مدى كفاية صياغة المشكلة ويمكن أن تكون نقطة بداية جيدة للتحقق من نسخة مبسطة من المشكلة التي يتم حلها. نظرًا لبساطتها ، فإن الانحدارات الخطية واللوجستية يمكن تفسيرها بشكل كبير وتوفر طرقًا بسيطة لأداء الإسناد.

أشجار القرار والغابات العشوائية وتعزيز التدرج. فئة أخرى شعبية من الأساليب هي أشجار القرار والغابة العشوائية وتعزيز التدرج. يمكن أن تعمل هذه الطرق أيضًا مع مشاكل الانحدار / التصنيف وهي مناسبة تمامًا لنمذجة العلاقات غير الخطية بين المدخلات والمخرجات. غالبًا ما يمكن تفضيل الغابة العشوائية ، التي تعد جزءًا من مجموعة أشجار القرار ، على طرق التعلم العميق في الظروف التي تكون فيها البيانات ذات نسبة إشارة إلى ضوضاء منخفضة. قد تكون هذه الطرق أقل قابلية للتفسير من الانحدار الخطي / اللوجستي ، ومع ذلك ، في عمل حديث ، نظرنا في مكتبات البرامج قيد التطوير التي تحل هذه المشكلة.

الأساليب والموارد الأخرى. تتم مناقشة جميع الطرق المذكورة أعلاه ، بالإضافة إلى العديد من الطرق الشائعة الأخرى ، مثل النماذج الرسومية ، والعمليات الغوسية ، وتحسين بايزي ، بالتفصيل في دورة التعلم الآلي بجامعة تورنتو أو في ستانفورد CS229 ، في مقالات تفصيلية حول نحو ddascasc.com والبرامج التعليمية التفاعلية مثل d2l.ai /index.html (يُسمى Dive to Deep Learning) وعلى github.com/rasbt/python-machine-learning-book2nd-edition .



ما المهام التي يقوم عالم البيانات بحلها؟ ما هي أقسام الرياضيات ولأي مهام تحتاج إلى معرفتها؟ ما هي متطلبات علماء البيانات؟ ما المعرفة في الرياضيات اللازمة للتميز عن الآخرين وتأمين التقدم الوظيفي ؟ لا يمكن الحصول على إجابات لجميع هذه الأسئلة من خلال ندوة الويب المجانية التي ستعقد في 6 مايو. اسرع للتسجيل !



All Articles