تكوين وظيفة الخسارة لشبكة عصبية على أساس البيانات السيزمية

في مقال سابق ، وصفنا تجربة لتحديد الحد الأدنى من الأقسام المسمى يدويًا لتدريب شبكة عصبية باستخدام بيانات الزلازل. اليوم نواصل هذا الموضوع عن طريق اختيار دالة الخسارة الأنسب.

يتم النظر في فئتين أساسيتين من الوظائف - الانتروبيا الثنائية المتقاطعة والتقاطع عبر الاتحاد - في 6 متغيرات مع اختيار المعلمات ، بالإضافة إلى مجموعات من وظائف الفئات المختلفة. بالإضافة إلى ذلك ، يعتبر تسوية وظيفة الخسارة.

Spoiler: تمكن من تحسين جودة توقعات الشبكة بشكل ملحوظ.



أهداف البحث التجاري


لن نكرر وصف تفاصيل المسح الزلزالي والبيانات التي تم الحصول عليها ومهام تفسيرها. كل هذا موصوف في مقالتنا السابقة .

كانت فكرة هذه الدراسة مدفوعة بنتائج المنافسة على البحث عن رواسب الملح على شرائح ثنائية الأبعاد . وفقا للمشاركين في المسابقة ، في حل هذه المشكلة ، تم استخدام حديقة حيوانات كاملة من وظائف الخسارة المختلفة ، علاوة على ذلك ، مع نجاحات مختلفة.

لذلك ، سألنا أنفسنا: هل من الممكن حقًا لمثل هذه المشاكل في هذه البيانات أن تختار وظيفة الخسارة التي يمكن أن تعطي مكسبًا كبيرًا في الجودة؟ أم أن هذه الخاصية هي فقط لظروف المنافسة ، عندما يكون هناك صراع على المكان العشري الرابع أو الخامس للمقاييس المحددة مسبقًا من قبل المنظمين؟

عادة ، في المهام التي يتم حلها بمساعدة الشبكات العصبية ، يقوم ضبط عملية التعلم بشكل أساسي على تجربة الباحث وبعض الاستدلال. على سبيل المثال ، بالنسبة لمشاكل تجزئة الصورة ، غالبًا ما يتم استخدام وظائف الخسارة ، استنادًا إلى تقييم تزامن أشكال المناطق المعترف بها ، ما يسمى التقاطع عبر الاتحاد.

بشكل حدسي ، بناءً على فهم السلوك ونتائج البحث ، ستعطي هذه الأنواع من الوظائف نتائج أفضل من تلك التي لم يتم صقلها للصور ، مثل تلك المتقاطعة. ومع ذلك ، فإن التجارب في البحث عن أفضل خيار لهذا النوع من المهام ككل وتستمر كل مهمة على حدة.

تحتوي البيانات الزلزالية المعدة للتفسير على عدد من الميزات التي يمكن أن يكون لها تأثير كبير على سلوك وظيفة الخسارة. على سبيل المثال ، تكون الآفاق التي تفصل الطبقات الجيولوجية ناعمة ، وتتغير بشكل أكثر حدة فقط في أماكن العيوب. بالإضافة إلى ذلك ، تحتوي المناطق المميزة على مساحة كبيرة بما فيه الكفاية بالنسبة للصورة ، أي غالبًا ما تُعتبر النقاط الصغيرة في نتائج التفسير خطأً في التعرف.

كجزء من هذه التجربة ، حاولنا العثور على إجابات للأسئلة المحلية التالية:

  1. هل دالة الخسارة للتقاطع عبر فئة Union هي أفضل نتيجة حقًا للمشكلة التي تم تناولها أدناه؟ يبدو أن الجواب واضح ، ولكن أي واحد؟ وكم هو الأفضل من وجهة نظر الأعمال؟
  2. هل من الممكن تحسين النتائج من خلال الجمع بين وظائف الفئات المختلفة؟ على سبيل المثال ، التقاطع فوق الاتحاد والانتروبيا بأوزان مختلفة.
  3. هل من الممكن تحسين النتائج بإضافة إضافات مختلفة إلى دالة الخسارة مصممة خصيصًا للبيانات الزلزالية؟

ولسؤال أكثر عمومية:

هل من الجدير بالانزعاج اختيار دالة الخسارة لمهام تفسير البيانات الزلزالية ، أم أن الزيادة في الجودة لا يمكن مقارنتها مع الوقت الضائع لإجراء مثل هذه الدراسات؟ ربما يجدر اختيار أي وظيفة بشكل بديهي وإنفاق الطاقة على اختيار معلمات تدريب أكثر أهمية؟

وصف عام للتجربة والبيانات المستخدمة


بالنسبة للتجربة ، اتخذنا نفس المهمة المتمثلة في عزل الطبقات الجيولوجية على شرائح ثنائية الأبعاد لمكعب زلزالي (انظر الشكل 1).


الشكل 1. مثال لشريحة ثنائية الأبعاد (يسار) ونتيجة وضع علامات على الطبقات الجيولوجية المقابلة (يمين) ( المصدر )

ونفس المجموعة من البيانات المصنفة بالكامل من القطاع الهولندي لبحر الشمال. البيانات السيزمية المصدر متاحة على موقع Open Seismic Repository: Project Netherlands Offshore F3 Block . يمكن العثور على وصف موجز في Silva et al. "مجموعة بيانات هولندا: مجموعة بيانات عامة جديدة لتعلم الآلة في التفسير الزلزالي . "

نظرًا لأننا في حالتنا نتحدث عن شرائح ثنائية الأبعاد ، لم نستخدم المكعب ثلاثي الأبعاد الأصلي ، ولكن "التشريح" المصنوع بالفعل ، متاح هنا:مجموعة بيانات تفسير هولندا F3 .

أثناء التجربة ، قمنا بحل المشاكل التالية:

  1. نظرنا إلى بيانات المصدر وحددنا الشرائح ، الأقرب في الجودة من وضع العلامات اليدوي (على غرار التجربة السابقة).
  2. سجلنا بنية الشبكة العصبية ، ومنهجية ومعلمات التدريب ، ومبدأ اختيار شرائح للتدريب والتحقق (على غرار التجربة السابقة).
  3. اخترنا وظائف الخسارة المدروسة.
  4. اخترنا أفضل المعلمات لوظائف الخسارة ذات المعلمات.
  5. قمنا بتدريب الشبكات العصبية بوظائف مختلفة على نفس حجم البيانات واخترنا أفضل وظيفة.
  6. قمنا بتدريب الشبكات العصبية مع مجموعات مختلفة من الوظيفة المحددة مع وظائف فئة أخرى على نفس الكمية من البيانات.
  7. قمنا بتدريب الشبكات العصبية على تنظيم الوظيفة المختارة على نفس الكمية من البيانات.

للمقارنة ، استخدمنا نتائج تجربة سابقة تم فيها اختيار دالة الخسارة بشكل حدسي وكان مزيجًا من وظائف فئات مختلفة مع معاملات تم اختيارها أيضًا "بالعين".

يتم عرض نتائج هذه التجربة في شكل مقاييس تقديرية وتوقعتها شبكات أقنعة الشرائح أدناه.

المهمة 1. اختيار البيانات


كبيانات أولية ، استخدمنا الخطوط والخطوط المتقاطعة الجاهزة لمكعب زلزالي من القطاع الهولندي لبحر الشمال. كما في التجربة السابقة ، لمحاكاة عمل المترجم ، لتدريب الشبكة ، اخترنا فقط أقنعة نظيفة ، بعد النظر في جميع الشرائح. ونتيجة لذلك ، تم تحديد 700 خط عرضي و 400 سطري من ~ 1600 صورة مصدر.

المهمة 2. تحديد معلمات التجربة


هذا والأقسام التالية ذات أهمية ، أولاً وقبل كل شيء ، للمتخصصين في علوم البيانات ، وبالتالي ، سيتم استخدام المصطلحات المناسبة.

بالنسبة للتدريب ، اخترنا 5 ٪ من إجمالي عدد الشرائح ، علاوة على ذلك ، السطور والخطوط العرضية في الأسهم المتساوية ، أي 40 + 40. تم اختيار الشرائح بالتساوي في جميع أنحاء المكعب. للتحقق ، تم استخدام شريحة واحدة بين الصور المجاورة لعينة التدريب. وهكذا ، تكونت عينة التحقق من 39 سطراً و 39 خطاً متصالباً.

وقع 321 مضمنة و 621 خطًا متقاطعًا في العينة المتأخرة ، والتي تمت مقارنة النتائج عليها.

على غرار التجربة السابقة ، لم يتم تنفيذ المعالجة المسبقة للصورة ، وتم استخدام نفس بنية UNet مع نفس معلمات التدريب.

تم تمثيل أقنعة الشريحة المستهدفة كمكعبات ثنائية للبعد HxWx10 ، حيث يتوافق البعد الأخير مع عدد الفئات ، وكل قيمة للمكعب هي 0 أو 1 ، اعتمادًا على ما إذا كان هذا البكسل في الصورة ينتمي إلى فئة الطبقة المقابلة أم لا.

كان كل توقع شبكة مكعبًا مشابهًا ، ترتبط كل قيمته باحتمال أن بكسل بكسل معين ينتمي إلى فئة الطبقة المقابلة. في معظم الحالات ، تم تحويل هذه القيمة إلى الاحتمالية نفسها باستخدام السيني. ومع ذلك ، لا ينبغي القيام بذلك لجميع وظائف الخسارة ، وبالتالي لم يتم استخدام التنشيط للطبقة الأخيرة من الشبكة. بدلاً من ذلك ، تم إجراء التحويلات المقابلة في الوظائف نفسها.

للحد من تأثير عشوائية اختيار الأوزان الأولية على النتائج ، تم تدريب الشبكة لمدة 1 مع الانتروبيا الثنائية المتقاطعة كدالة للخسائر. بدأت جميع التدريبات الأخرى مع تلقي هذه الأوزان.

المهمة 3. اختيار وظائف الخسارة


للتجربة ، تم اختيار فئتين أساسيتين من الوظائف في 6 متغيرات:

الانتروبيا الثنائية المتقاطعة :

  • الانتروبيا عبر الصليب.
  • الانتروبيا الثنائية المرجحة.
  • الانتروبيا المتوازنة الثنائية.

تقاطع الاتحاد :

  • خسارة جاكار
  • خسارة تفيرسكي
  • خسارة Lovász.

ويرد وصف موجز للوظائف المدرجة مع رمز Keras في المقالة . نقدم هنا أهم الروابط (حيثما أمكن) لوصف مفصل لكل وظيفة.

بالنسبة لتجربتنا ، فإن اتساق الوظيفة المستخدمة أثناء التدريب مهم مع المقياس الذي نقوم من خلاله بتقييم نتيجة توقعات الشبكة على العينة المتأخرة. لذلك ، استخدمنا الكود الذي تم تطبيقه على TensorFlow و Numpy ، مكتوبًا مباشرةً باستخدام الصيغ أدناه.

يتم استخدام الرموز التالية في الصيغ:

  • pt - لقناع الهدف الثنائي (الحقيقة الأرضية) ؛
  • ص - لقناع التنبؤ بالشبكة.

بالنسبة لجميع الوظائف ، ما لم يُحدد خلاف ذلك ، يُفترض أن قناع التنبؤ بالشبكة يحتوي على احتمالات لكل بكسل في الصورة ، أي القيم في الفاصل الزمني (0 ، 1).

الانتروبيا عبر الصليب


الوصف: https://towardsdatascience.com/understanding-binary-cross-entropy-log-loss-a-visual-explanation-a3ac6025181a .



تسعى هذه الوظيفة إلى تقريب توزيع توقعات الشبكة من الهدف ، معاقبة ليس فقط التوقعات الخاطئة ، ولكن أيضًا التنبؤات غير المؤكدة.

الانتروبيا عبر الثقل المرجح




تتزامن هذه الوظيفة مع الإنتروبيا الثنائية مع قيمة بيتا 1. من المستحسن عدم التوازن الطبقي القوي. بالنسبة إلى بيتا> 1 ، ينخفض ​​عدد التنبؤات السلبية الخاطئة (سلبية كاذبة) ويزداد اكتمال (الاستدعاء) ، بالنسبة إلى بيتا <1 ينخفض ​​عدد التنبؤات الإيجابية الخاطئة (إيجابية خاطئة) وتزداد الدقة (الدقة).

الانتروبي الثنائي المتوازن




تتشابه هذه الوظيفة مع الانتروبيا المرجحة ، لكنها تصحح مساهمة القيم المنفردة ، وكذلك القيم الصفرية للقناع الهدف. يتزامن (حتى ثابت) مع إنتروبيا ثنائية متقاطعة بقيمة معامل بيتا = 0.5.

خسارة الجاكار


يحدد معامل الجاكار (المعروف أيضًا باسم التقاطع على الاتحاد ، IoU) مقياس "التشابه" بين المنطقتين. يفعل مؤشر النرد الشيء نفسه:



لا معنى للنظر في كل من هاتين الدالتين. اخترنا الجاكار.

بالنسبة للحالة التي يتم فيها تحديد كلا المنطقتين باستخدام أقنعة ثنائية ، يمكن إعادة كتابة الصيغة أعلاه بسهولة من حيث قيم الأقنعة:



بالنسبة للتنبؤات غير الثنائية ، يعد تحسين معامل الجاكار مهمة غير تافهة. سنستخدم نفس الصيغة للاحتمالات في قناع التنبؤ كتقليد معين للمعامل الأولي ، وبالتالي وظيفة الخسارة التالية:



خسارة تفيرسكي


الوصف: https://arxiv.org/pdf/1706.05721.pdf



هذه الوظيفة هي نسخة معلمة لتحسين معامل الجاكار الذي يتزامن معه في alpha = beta = 1 ومع مؤشر النرد عند alpha = beta = 0.5. بالنسبة للقيم الأخرى غير الصفرية وغير المتزامنة ، يمكننا تحويل التركيز إلى الدقة أو الاكتمال بنفس الطريقة كما في وظائف التداخل المتوازن المرجح والمتوازن.

يمكن إعادة كتابة مشكلة تحول التركيز باستخدام معامل واحد يقع في الفاصل الزمني (0 ، 1). ستبدو دالة الخسارة الناتجة كما يلي:



خسارة Lovász


من الصعب إعطاء صيغة لهذه الوظيفة ، لأنها خيار لتحسين معامل الجاكار عن طريق خوارزمية تعتمد على الأخطاء المصنفة.

يمكنك رؤية وصف الوظيفة هنا ، يوجد أحد خيارات الرمز هنا .

شرح مهم!


لتبسيط مقارنة القيم والرسوم البيانية فيما يلي ، تحت مصطلح "معامل الجاكار" ، سوف نفهم الوحدة ناقص المعامل نفسه. خسارة الجاكار هي إحدى الطرق لتحسين هذه النسبة ، إلى جانب خسارة تفرسكي وخسارة لوفاش.

المهمة 4. اختيار أفضل المعلمات لوظائف الخسارة ذات المعلمات


لتحديد أفضل وظيفة خسارة في نفس مجموعة البيانات ، يلزم معيار التقييم. في جودته ، اخترنا متوسط ​​/ متوسط ​​عدد المكونات المتصلة على الأقنعة الناتجة. بالإضافة إلى ذلك ، استخدمنا معامل الجاكار للأقنعة التنبؤية المحولة إلى طبقة أرماكس أحادية الطبقة وتم تقسيمها مرة أخرى إلى طبقات ثنائية.

عدد المكونات المتصلة (أي ، البقع الصلبة من نفس اللون) في كل توقعات تم الحصول عليها هو معيار غير مباشر لتقييم حجم التحسينات اللاحقة من قبل المترجم. إذا كانت هذه القيمة 10 ، فسيتم تحديد الطبقات بشكل صحيح ونحن نتحدث عن الحد الأقصى من التصحيح الطفيف في الأفق. إذا لم يكن هناك الكثير ، فأنت بحاجة فقط إلى "تنظيف" مناطق صغيرة من الصورة. إذا كان هناك عدد أكبر بكثير منها ، فإن كل شيء سيئ وربما يحتاج إلى إعادة تخطيط كاملة.

يميز معامل الجاكار ، بدوره ، تزامن مناطق الصورة المخصصة لفئة واحدة وحدودها.

الانتروبيا عبر الثقل المرجح


وفقًا للنتائج التجريبية ، تم اختيار المعلمة بيتا = 2:


الشكل 2. مقارنة بين جودة التنبؤ بالشبكة ومعايير الوظيفة الأساسية للخسارة الأساسية


الشكل 3. إحصاءات لعدد المكونات المتصلة من جانب قيم المعلمة بيتا

الانتروبي الثنائي المتوازن


وفقًا لنتائج التجارب ، تم اختيار قيمة المعلمة بيتا = 0.7:


الشكل 4. مقارنة جودة توقعات الشبكة من خلال دالة الخسارة الرئيسية والمعايير المختارة


الشكل 5. إحصاءات لعدد المكونات المتصلة

خسارة تفيرسكي


وفقًا لنتائج التجارب ، تم اختيار قيمة المعلمة بيتا = 0.7:


الشكل 6. مقارنة جودة التنبؤ بالشبكة من خلال دالة الخسارة الرئيسية والمعايير المختارة


الشكل 7. مقارنة جودة التنبؤ بالشبكة من خلال وظيفة الخسارة الرئيسية والمعايير المحددة

يمكن استخلاص استنتاجين من الأشكال المذكورة أعلاه.

أولاً ، ترتبط المعايير المحددة جيدًا إلى حد ما مع بعضها البعض ، أي يتوافق معامل الجاكار مع تقدير حجم التحسينات اللازمة. ثانيًا ، يختلف سلوك وظائف الخسارة عبر الأنتروبيا تمامًا منطقياً عن سلوك المعايير ، أي استخدام التدريب فقط هذه الفئة من الوظائف دون تقييم إضافي للنتائج لا يزال لا يستحق ذلك.

المهمة 5. اختيار أفضل وظيفة الخسارة.


قارن الآن النتائج التي أظهرت وظائف الخسارة الستة المحددة في نفس مجموعة البيانات. من أجل الاكتمال ، أضفنا تنبؤات الشبكة التي تم الحصول عليها في التجربة السابقة.


الشكل 8. شبكات إسقاطات المقارنة مدربة بوظائف خسارة مختلفة للمعايير المختارة

الجدول 1. القيم المتوسطة للمعايير




الشكل 9. إسقاطات شبكات المقارنة على عدد تنبؤات العدد المشار إليه للمكونات المتصلة

من الرسوم البيانية والجداول المقدمة ، الاستنتاجات التالية بشأن استخدام "منفرد" وظائف الخسارة:

  • في حالتنا ، تظهر وظائف "الجاكار" للتقاطع على فئة الاتحاد قيمًا أفضل من القيم المشتركة بين الأنتروبيا. علاوة على ذلك ، أفضل بكثير.
  • Lovazh loss.

دعنا نقارن بصريًا توقعات الشرائح مع واحدة من أفضل قيم خسارة Lovazh وأحد أسوأ المكونات المتصلة بها. يتم عرض القناع الهدف في الزاوية اليمنى العلوية ، والتنبؤ الذي تم الحصول عليه في التجربة السابقة في أسفل اليمين:


الشكل 10. تنبؤات الشبكة لواحدة من أفضل الشرائح


الشكل 11. تنبؤات الشبكة لواحدة من أسوأ الشرائح

يمكن ملاحظة أن جميع الشبكات تعمل بشكل جيد على قدم المساواة في التعرف عليها بسهولة شرائح. ولكن حتى على شريحة لا يمكن التعرف عليها بشكل جيد حيث تكون جميع الشبكات خاطئة ، فإن توقعات خسارة Lovazh أفضل بصريًا من توقعات الشبكات الأخرى. على الرغم من أنها واحدة من أسوأ الخسائر لهذه الوظيفة.

لذا ، في هذه الخطوة ، قررنا وجود قائد واضح - خسارة لوفاز ، والتي يمكن وصف نتائجها على النحو التالي:

  • حوالي 60 ٪ من التوقعات قريبة من المثالية ، أي لا تتطلب أكثر من تعديلات على الأقسام الفردية من الآفاق ؛
  • ما يقرب من 30 ٪ من التوقعات لا تحتوي على أكثر من نقطتين إضافيتين ، أي تتطلب تحسينات طفيفة ؛
  • يحتوي ما يقرب من 1 ٪ من التوقعات من 10 إلى 25 نقطة إضافية ، أي يتطلب تحسينًا كبيرًا.

في هذه الخطوة ، فقط باستبدال دالة الخسارة ، حققنا تحسنًا كبيرًا في النتائج مقارنة بالتجربة السابقة.

هل يمكن تحسينه بمجموعة من الوظائف المختلفة؟ تحقق من ذلك.

المهمة 6. اختيار أفضل مزيج من وظيفة الخسارة


يتم استخدام مزيج من وظائف الخسارة ذات الطبيعة المختلفة في كثير من الأحيان. ومع ذلك ، فإن العثور على أفضل مزيج ليس بالأمر السهل. مثال جيد هو نتيجة تجربة سابقة ، والتي تبين أنها أسوأ من وظيفة "منفرد". الغرض من هذه التوليفات هو تحسين النتيجة عن طريق التحسين وفقًا لمبادئ مختلفة.

دعنا نحاول فرز الخيارات المختلفة للوظيفة المحددة في الخطوة السابقة مع الآخرين ، ولكن ليس مع الكل في صف واحد. نحن نقتصر على مجموعات من الوظائف من أنواع مختلفة ، في هذه الحالة ، مع تلك المتقاطعة. لا معنى للنظر في توليفات من وظائف من نفس النوع.

الإجمالي ، قمنا بفحص 3 أزواج مع 9 معاملات محتملة لكل منها (من 0.1 \ 0.9 إلى 0.9 \ 0.1). في الأشكال أدناه ، يوضح المحور س المعامل قبل خسارة لوفاز. المعامل قبل الوظيفة الثانية يساوي واحد ناقص المعامل قبل الأول. القيمة اليسرى هي فقط دالة عبر الإنتروبيا ، والقيمة الصحيحة هي خسارة Lovazh فقط.


الشكل 12. تقييم نتائج التنبؤ للشبكات المدربة على BCE + Lovazh


الشكل 13. تقييم نتائج التنبؤ للشبكات المدربة على BCE + Lovazh


الشكل 14. تقييم نتائج التنبؤ للشبكات المدربة على BBCE + Lovazh

يمكن ملاحظة أن وظيفة "منفرد" المحددة لم يتم تحسينها عن طريق إضافة الإنتروبيا المتقاطعة. قد يكون تقليل بعض قيم معامل الجاكار بمقدار 1-2 ألف جزءًا مهمًا في بيئة تنافسية ، ولكنه لا يعوض عن تدهور الأعمال في معيار عدد المكونات المتصلة.

للتحقق من السلوك النموذجي لمجموعة من الوظائف من أنواع مختلفة ، أجرينا سلسلة مماثلة من التدريب لفقدان الجاكار. بالنسبة لزوج واحد فقط ، كان من الممكن تحسين قيم كلا المعيارين بشكل طفيف في نفس الوقت:

0.8 * JaccardLoss + 0.2 *
متوسط BBCE للمكونات المتصلة: 11.5695 -> 11.2895
متوسط ​​Jaccard: 0.0307 -> 0.0283

ولكن حتى هذه القيم أسوأ من خسارة Lovaz "منفردة".

وبالتالي ، من المنطقي التحقيق في مجموعات من الوظائف ذات الطبيعة المختلفة في بياناتنا فقط في ظروف المنافسة أو في وقت فراغ وموارد. من غير المرجح أن تنجح لتحقيق زيادة كبيرة في الجودة.

المهمة 7. تسوية أفضل وظيفة الخسارة.


في هذه الخطوة ، حاولنا تحسين وظيفة الخسارة المحددة مسبقًا بإضافة مصممة خصيصًا للبيانات السيزمية. هذا هو التسوية الموضحة في المقالة: "الشبكات العصبية للجيوفيزيائيين وتطبيقها على تفسير البيانات الزلزالية" .

تشير المقالة إلى أن التسويات القياسية مثل تحلل الأوزان على البيانات الزلزالية لا تعمل بشكل جيد. بدلاً من ذلك ، يتم اقتراح نهج قائم على معيار مصفوفة التدرج ، والذي يهدف إلى تمهيد حدود الطبقات. النهج منطقي إذا تذكرنا أن حدود الطبقات الجيولوجية يجب أن تكون سلسة.

ومع ذلك ، عند استخدام هذا التنظيم ، ينبغي للمرء أن يتوقع بعض التدهور في النتائج بمعيار الجاكار ، منذ ذلك الحين من غير المرجح أن تتزامن حدود الطبقة الملساء مع التحولات المفاجئة المحتملة التي تم الحصول عليها باستخدام الترميز اليدوي. ولكن لدينا معيار واحد آخر للتحقق - من خلال عدد المكونات المتصلة.

قمنا بتدريب 13 شبكة مع التسوية الموضحة في المقالة والمعامل أمامها ، مع أخذ القيم من 0.1 إلى 0.0001. توضح الأشكال أدناه بعض التصنيفات لكلا المعيارين.


الشكل 15. مقارنة نوعية توقعات الشبكة بالمعايير المختارة


الشكل 16. إحصاءات لعدد المكونات المتصلة من حيث قيم المعامل قبل التسوية

يُلاحظ أن التنظيم بمعامل 0.025 يقلل بشكل كبير من إحصائيات معيار عدد المكونات المتصلة. ومع ذلك ، ارتفع معيار الجاكار في هذه الحالة بشكل متوقع إلى 0.0357. ومع ذلك ، هذه زيادة طفيفة مقارنة مع انخفاض في التحسين اليدوي.


الشكل 17. مقارنة تنبؤات الشبكة بعدد التنبؤات بالعدد المحدد من المكونات المتصلة.

وأخيراً ، نقارن حدود الصفوف على الهدف والأقنعة المتوقعة لأسوأ قطع تم تحديده مسبقًا.


الشكل 18. التنبؤ بالشبكة لواحدة من أسوأ الشرائح.


الشكل 19. التراكب جزء من أفق القناع الهدف والتنبؤ

كما يتضح من الأرقام ، فإن قناع التنبؤ ، بالطبع ، مخطئ في بعض الأماكن ، ولكنه في نفس الوقت يخفف من تذبذبات الآفاق المستهدفة ، أي يصحح الأخطاء الطفيفة في الترميز الأولي.

ملخص خصائص دالة الخسارة المختارة مع التنظيم:

  • حوالي 87٪ من التوقعات قريبة من المثالية ، أي لا تتطلب أكثر من تعديلات على الأقسام الفردية من الآفاق ؛
  • يحتوي ما يقرب من 10٪ من التوقعات على بقعة إضافية واحدة ، أي تتطلب تحسينات طفيفة ؛
  • حوالي 3 ٪ من التوقعات تحتوي على 2 إلى 5 نقاط إضافية ، أي تتطلب صقل أكثر جوهرية.

الموجودات


  • فقط من خلال تعديل معلمة تعلم واحدة - وظيفة الخسارة - تمكنا من تحسين جودة توقعات الشبكة بشكل كبير وتقليل كمية التحسينات اللازمة بنحو ثلاث مرات.
  • Intersection over Union ( Lovazh loss) . -, .
  • -, . , .. .

:


  1. Reinaldo Mozart Silva, Lais Baroni, Rodrigo S. Ferreira, Daniel Civitarese, Daniela Szwarcman, Emilio Vital Brazil. Netherlands Dataset: A New Public Dataset for Machine Learning in Seismic Interpretation
  2. Lars Nieradzik. Losses for Image Segmentation
  3. Daniel Godoy. Understanding binary cross-entropy / log loss: a visual explanation
  4. Seyed Sadegh Mohseni Salehi, Deniz Erdogmus, and Ali Gholipour. Tversky loss function for image segmentation using 3D fully convolutional deep networks
  5. Maxim Berman, Amal Rannen Triki, Matthew B. Blaschko. The Lovasz-Softmax loss: A tractable surrogate for the optimization of the intersection-over-union measure in neural networks
  6. Bas Peters, Eldad Haber, and Justin Granek. Neural-networks for geophysicists and their application to seismic data interpretation

All Articles