بنية الشبكة العصبية الجديدة - EfficientDet

مرحبا يا هبر! أقدم لكم تحليل مقال "EfficientDet: الكشف عن الأشياء القابلة للتطوير والفعالة" بواسطة Mingxing Tan ، Ruoming Pang ، Quoc V. Le.

في السنوات الأخيرة ، تم إحراز تقدم هائل نحو الكشف عن الأشياء بشكل أكثر دقة ، بينما أصبحت أجهزة الكشف عن الأشياء الحديثة أكثر تكلفة أيضًا. تعوق تكلفة العمليات الحسابية والحوسبة المكلفة نشرها في العديد من التطبيقات الواقعية ، مثل الروبوتات والسيارات الآلية ، حيث يكون حجم النموذج والتأخير محدودًا للغاية. نظرًا لهذه الموارد المحدودة في العالم الحقيقي ، تزداد كفاءة النموذج أهمية متزايدة لاكتشاف الكائنات.
كانت هناك العديد من الأعمال السابقة التي تهدف إلى تطوير بنيات كاشف أكثر كفاءة. غالبًا ما تميل هذه الأعمال إلى أن تكون أكثر كفاءة ، وتضحي بالدقة. يطرح سؤال طبيعي: هل من الممكن بناء بنية كشف قابلة للتوسيع بدقة أعلى وكفاءة أكبر مع مجموعة واسعة من قيود الموارد؟ يعتقد مبدعو EfficientDet أنهم وجدوا الإجابة على هذا السؤال.

EfficientDet: اكتشاف كائن قابل للتطوير وفعال


صورة

يوضح الجدول أعلاه أن EfficientDet
تحقق دقة أعلى بكثير مع حسابات أقل
من أجهزة الكشف الأخرى.

ما هي بنية EfficientDet؟


صورة
تتوافق بنية EfficientDet الشاملة إلى حد كبير مع نموذج كاشفات المرحلة الواحدة (مرحلة واحدة). استنادًا إلى EfficientNet ، الذي تم تدريبه مسبقًا على ImageNet ، يتم إرفاق طبقة ذات
هرم مميز ثنائي الاتجاه (BiFPN) ، تليها شبكة فئة وكتلة لتوليد تنبؤات فئة الكائن ومربع محيط ، على التوالي.

نبذة عن BiFPN:


ظهرت فكرة إنشاء هرم ميزة ثنائية الاتجاه بعد دراسة أداء الشبكة وكفاءتها لتحسين التدرج: FPN و PANet و NAS-FPN. يحقق PANet دقة أفضل من FPN و NAS-FPN ، ولكن على حساب المزيد من المعلمات والحسابات. لتحسين كفاءة النموذج ، تم اقتراح العديد من التحسينات للاتصالات عبر النطاق:
  • -, , . : , , . PANet, 2 ();
  • -, , , , 2 ();
  • -, PANet, , ( ) , .

صورة
تصميم شبكة
الميزات - (أ) يقدم FPN مسارًا لأسفل لدمج الميزات متعددة المستويات من المستوى 3 إلى 7 (P3 - P7) ؛
(ب) يضيف PANet مسارًا إضافيًا من القاعدة إلى القمة فوق FPN ؛
© NAS-FPN يستخدم بنية
البحث العصبي للبحث عن طوبولوجيا شبكة غير منتظمة للكائنات ؛
(د) إضافة اتصالات باهظة الثمن من جميع ميزات الإدخال إلى ميزات الإخراج ؛
(هـ) يبسط اللوحة عن طريق إزالة بعض العقد ؛
(و) BiFPN لدينا مع تنازلات أفضل من الدقة والكفاءة.

صورة
يوضح الجدول كيف ، بدءًا من RetinaNet (ResNet50 + FPN) ، تم استبدال التشفير بـ EfficientNet-B3 ، ثم تم استبدال FPN الأساسي بـ BiFPN ، نمت الدقة مع كل تغيير.

صورة
تستخدم EfficientDet أيضًا وظيفة صعبة بدلاً من SoftMax ، والتي تعتمد على طريقة التطبيع السريع للدمج ، والتي توفر نفس الدقة التي توفرها عملية الدمج المستندة إلى Softmax ، ولكنها تعمل بسرعة 1.26-1.31 مرة على وحدات معالجة الرسومات.

صورة
كما تم تحسين الأداء في تصنيف الصور من خلال زيادة حجم الشبكة وعمقها ودقة الإدخال بشكل مشترك.
يوضح الرسم البياني مقارنة بين طرق القياس المختلفة. تعمل جميع الطرق على تحسين الدقة ، ولكن طريقة القياس الشاملة توفر دقة وكفاءة أفضل للتنازل.

صورة
في الشكل ، يمكنك رؤية مقارنة بين حجم النموذج
وتأخير الإخراج: يتم قياس التأخير بحجم الدفعة 1 على نفس الجهاز ،
مجهزة بمعالج تيتان V ومعالج زيون. AN لتقف على AmoebaNet + NAS-FPN ، مدربة مسبقًا مع زيادة.

استنتاج:


نتيجة لدراسة منهجية للخيارات المختلفة لتصميم بنية شبكة للكشف الفعال عن الكائنات ، تم اقتراح شبكة وظيفية ثنائية الاتجاه مرجحة وطريقة تحجيم مركبة مخصصة لزيادة الدقة والكفاءة. استنادًا إلى هذه التحسينات ، تم تطوير عائلة جديدة من أجهزة الكشف تسمى EfficientDet والتي تحقق باستمرار دقة وكفاءة أكبر من الفن السابق ، مع مجموعة واسعة من حدود الموارد. على وجه الخصوص ، تحقق EfficientDet-D7 الخاصة بنا أعلى مستوى من الدقة مع معلمات وفلوبس أقل من أفضل أجهزة الكشف الموجودة. كما أن EfficientDet أسرع 3.2 مرة على وحدة معالجة الرسومات و 8.1 مرات أسرع على وحدة المعالجة المركزية.

المصدر: Mingxing Tan Ruoming Pang Quoc V. Le
Google Research، Brain Team "EfficientDet: الكشف عن الأشياء القابلة للتطوير والفعالة"
arxiv.org/abs/1911.09070

All Articles