عندما أسمع عبارة "استعادة الشبكة العصبية" ، أتسلق للتحقق من النسخ الاحتياطية

بالإضافة إلى كوني متخصصًا في تكنولوجيا المعلومات ، فأنا أيضًا مؤرخ تكنولوجيا ، وهذا ما يحدد ردي على الأخبار حول أحدث الإنجازات في مجال التقنيات الرقمية. قبل شهر ، قررت أن أبدأ في كتابة كتاب للأشخاص البعيدين عن تكنولوجيا المعلومات والمقربين من البحوث والمصادر التاريخية ("دراسة المصدر الرقمي - مشاكل محددة " مكتوبة على مواقع مسودات الكتب) ، حيث سأخبرهم عن تطور التقنيات الرقمية بالنسبة لهم .

بعد ذلك بيومين ، تومض الخبر عبر الإنترنت: تم تحسين "وصول القطار" بمساعدة الشبكات العصبية - يمكن الآن مشاهدة فيلم 1896 بدقة 4K و 60 إطارًا في الثانية "، وهذا سبب جيد لإخبار موظفي تكنولوجيا المعلومات عن نفس الشيء.

ليس لدي الفيلم الأصلي "وصول القطار" ، لذلك استخدمت صورًا حديثة (مخفضة أو غير مشوهة) + صور من الثلاثينيات (من المفترض) كعينات اختبار

عندما أسمع عبارة "استعادة الشبكة العصبية" ، أتسلق للتحقق من النسخ الاحتياطية

0. ما هي المشكلة؟


تبرز المشكلة التي ستتم مناقشتها بسبب كيفية عمل المؤرخين الحقيقيين والشبكات العصبية بالضبط.

وفقا للشخص العادي ، يجلس المؤرخ المثالي بشكل حصري في الأرشيف ويعمل مع الوثائق الرسمية والمحفوظة بشكل جيد. في الواقع ، يعمل المؤرخون مع المصادر التي لديهم وفي الشكل الذي أتوا إليه.

في الواقع ، بالإضافة إلى الوثائق الرسمية في أرشيفات الدولة ، يمكن أن تكون الصور الشخصية والرسائل والمذكرات وما إلى ذلك بمثابة مصادر. لسوء الحظ ، غالبًا ما يعمل المؤرخون ليس مع المستندات المصدر ، ولكن مع نسخ مختلفة.

هل سمعت من قبل عبارة أن رموزًا ونصوصًا مختلفة "نزلت إلينا في القوائم"؟ في هذه الحالة ، لا تعني كلمة "قائمة" كتالوجًا يُذكر فيه بعض الأعمال ، بل نسخة من هذا العمل نفسه. يأتي هذا المصطلح من كلمة "شطب".

وصلت إلينا العديد من النصوص والصور والأفلام على شكل نسخ ، وليس هناك ما يضمن أن النسخة الوحيدة لفيلم "Seventeen Moments of Spring" الذي وصل إلى مؤرخي المستقبل لن تكون مجرد نسخة مرسومة ومقصودة. لأن مسارات المصدر التاريخي غامضة.

من ناحية أخرى ، هناك الكثير من الأخبار التي تفيد بأن الشبكة العصبية أعادت أو حسّنت شيئًا ما. يبدو وكأنه نوع من السحر والكثير يشعرون بأن نوعًا من الذكاء الاصطناعي يمكن أن يعيد شيئًا ما.

في الواقع ، حول أي استعادة للون أو تفاصيل في صور صغيرة لا يتحدث ولا يمكن أن يستمر. يضيف البرنامج ببساطة عناصر إلى الصورة أو الفيديو الذي تحدده خوارزمياته حسب الاقتضاء.

لسوء الحظ ، في الواقع ، من المستحيل استعادة الصورة المفقودة ، لأن عملية التبييض لا رجعة فيها ، وإذا لم يكن للصورة جزء من الصورة ، فلا يمكن استعادتها إلا على أساس نفس الصورة.

لذلك ، فإن الشبكات العصبية تفعل الشيء نفسه تمامًا الذي يفعله الناس في مثل هذه الحالات - وهم يتخيلون على أساس تجربتهم.

والآن سأعرض ما تم الحصول عليه نتيجة لهذه الأوهام.

1. مقارنة بين خدمات التلوين المختلفة


على الرغم من أن تلوين الصور والأفلام ليست ظاهرة جديدة تمامًا ، إلا أنها متاحة الآن لكل من لديه وصول إلى الإنترنت ، ويستفيد العديد من الأشخاص من هذه الفرصة الجديدة.

نحن نعيش بالفعل في عالم يوجد فيه العديد من الصور المرسومة لجنود الحرب الوطنية العظمى ، والديكور الداخلي للتايتانيك ، والعائلة المالكة والعديد من الصور الأخرى.

قد يبدو لشخص غير مستهل أن الأمر يتعلق باستعادة اللون الأصلي ، وأن الصورة الملونة توضح لنا كيف يبدو الأشخاص والأشياء منذ مائة عام بالفعل. بناءً على هذه الصور ، يمكن للشخص أن يبدأ في استخلاص استنتاجات حول حياة الأشخاص في الماضي ، وتحليل الأحداث والمواقف المختلفة.
وعلى الرغم من أنني أفهم استحالة استعادة اللون الحقيقي من صورة بالأبيض والأسود ، يجب أن أحقق بصفتي باحثًا وأتأكد من أنني على حق.

لاختبار هذه الفكرة ، التقطت صورتين حديثتين ملونتين ، وبيّضتهما في محرر رسومي ، وقادتهما عبر خدمات التلوين عبر الإنترنت.

1.1 تلوين السيارة Ford A Phaeton


في هذه الحالة ، استخدمت صورة التقطتها بنفسي في نهاية يناير 2020 في مطار موسكو دوموديدوفو. لا أعرف كيف يتطابق لون هذه السيارات مع لونها الأصلي ، لكن هذا لا يهم. في هذه التجربة ، نتحقق من مدى دقة استعادة لون الصورة المبيضة بدقة.

تلوين السيارة فورد A Phaeton

لقد أجريت هذه التجربة على صور سيارات مختلفة والنتيجة لم تتغير: جميع الخدمات ترسم سيارات حقيقية بشكل مختلف ، لكن لا أحد يرسم بشكل صحيح.

في الوقت نفسه ، أنا شخصيًا لا أفضل النسخة الأصلية ، ولكن نتيجة التلوين من deepai.org - لون جسم هادئ مع جوانب سقف زرقاء. (ولكن في هذا الإصداريظهر اللون الأصلي في خطوط مرقمة 2 و 7 ، لكني أحب الشريط 5 الملون بواسطة algorithmia.com ، حيث يكون الجزء أصفر اللون والجزء أحمر).

يتم شرح مشكلة تلوين السيارة بكل بساطة - البيانات المضمنة في كل شبكة عصبية. وبنفس الطريقة كما هو الحال مع التلوين اليدوي ، يشير التلوين التلقائي بالضبط على أساس الخبرة التي تم صنع التلوين بها.

أي أنه لا يوجد أي سؤال عن استعادة اللون الأصلي للكلام ولا يمكن أن يستمر.

بالطبع ، هناك أشخاص يقولون إنك بحاجة إلى تحميل المزيد من الصور على الشبكة العصبية ومن ثم سيكون كل شيء على ما يرام ، ولكن هذا يتعارض مع مبدأ الشبكات العصبية - فهم ببساطة يقومون بتوسيط البيانات التي يتم تحميلها فيها ولا يمكنهم تجاوز "التجربة" التي تم الحصول عليها بهذه الطريقة.

1.2


كانت التجربة التالية مع صورة تظهر العمارة والعديد من الناس في ملابس ملونة. تم اقتصاص الصورة الأصلية وتغيير لونها وتحميلها إلى خدمات التلوين.

تلوين النافورة في VDNH

نظرًا للعدد الكبير من الأشياء التي سيتم رسمها ، فإن النتيجة ليست مباشرة كما كانت الحال مع Ford A Phaeton.

نعم ، لم ترسم أي من الخدمات التماثيل باللون الذهبي ، والزنبق الأحمر في أسفل الصورة ، والقمصان الخضراء الزاهية والزرقاء الزاهية. ومع ذلك ، تعاملت جميع الخدمات ببراعة مع رسم قميص أبيض لرجل يجلس على حاجز نافورة وبلوزة بيضاء لامرأة تمشي من اليمين إلى اليسار مع حقيبة يد على جانبها.

وبالتالي ، لدينا مرة أخرى نتيجة يمكن التنبؤ بها تمامًا - خدمات التلوين غير قادرة على استعادة اللون الحقيقي.

لكن فائدة هذا المثال هي عدم تكرار الحقيقة الواضحة مرة أخرى. بالطبع ، إن تكرار الحقائق الواضحة ضروري وصحيح للغاية ، ولكن هناك نقطة أخرى.

مكافأة من 9may.mail.ru


بالإضافة إلى التلوين ، تقوم خدمة 9may.mail.ru بعملية "استكشاف الأخطاء وإصلاحها". إذا قارنت فقط صورة ملونة وصورة ملونة تمت إزالة العيوب بها ، فستجد ميزة مثيرة للاهتمام للغاية.

مكافأة من 9may.mail.ru

يُظهر هذا الرسم التوضيحي قطعة مكبرة من الحافة اليمنى للصورة مع نافورة. كما ترون بوضوح ، أثناء "إزالة العيوب" ، تمت إزالة العنصر النحتي (لن أجرؤ على قول اسمه :))

كما شوهدت "إزالة العيوب" مماثلة في صور أخرى ملونة بواسطة 9may.mail.ru ، ولكن هناك هذه لم تكن عمليات حذف كبيرة.

وبالتالي ، لم يتم رسم المصدر التاريخي بشكل غير صحيح فحسب ، بل كان به أيضًا "جرافات" دمرت جزءًا من الصورة (وهو ما يعيدنا مرة أخرى إلى سؤال "البلى الرقمي ")

يتيح لك هذا المثال المتابعة بسلاسة إلى الجزء التالي من القصة حول تأثير" تحسين "الصور الفوتوغرافية على الشبكات العصبية على المصادر التاريخية.

2. زيادة حجم الصورة


بالإضافة إلى التلوين ، كان هناك تكبير للصور في عصر ما قبل الرقمي.

النتيجة لكلتا الحالتين هي نفسها ، نبدأ في رؤية الحد الأدنى من عنصر الصورة. في التصوير التناظري كانت "الحبوب" ، والآن تم أخذ مكانها بواسطة "بكسل" ، ولكن لديهم جوهر واحد - وهو الحد الأدنى للعنصر غير القابل للتجزئة (أريد حقًا أن أقول "الذرية" ، ولكن على الرغم من اسمها - الذرة غير قابلة للتجزئة :))

إذا نظرنا على رقعة الشطرنج مع جهاز بصري مكبِّر (تلسكوب ، مناظير ، وما إلى ذلك) ، يمكننا بعد ذلك "تكبيرها" ووضع تفاصيل لم تكن مرئية من قبل.

ولكن إذا صورنا رقعة شطرنج بحيث تناسب حبة واحدة / بكسل ، فلا توجد طريقة "لتكبير الصورة" وتصنيع كل خلية على حدة. عند تكبير هذه الصورة ، سنرى بقعة كبيرة بلون واحد حيث يجب أن تكون رقعة الشطرنج.

سيحدث نفس الموقف تمامًا إذا قمنا بتغيير حجم البكسل لصورة رقمية للوحة الشطرنج - ستفقد المعلومات حول الخلايا على رقعة الشطرنج ، ولا توجد طريقة لاستعادتها إلا على أساس نفس الصورة.

بشكل عام ، أشعر بالحرج عند قول هذه الفكرة الشائعة ، ولكن ، كما تظهر الممارسة ، فإن فكرة عدم رجوع الحد من التصوير الرقمي ليست واضحة للجميع.

من وقت لآخر ، تظهر الأخبار أن بعض الشبكات العصبية قد زادت الصورة القديمة وحسنتها ، لذا يمكننا الآن رؤية التفاصيل التي لم نتمكن من رؤيتها من قبل.

تمامًا كما هو الحال في حالة التلوين ، حاولت تطبيق الخدمات عبر الإنترنت على صور حقيقية.

2.1 طاحونة غير معروفة من الثلاثينيات


ذات مرة ، مساء السبت ، أرسل لي زميل رابطًا لصورة على صفحة أرشيف ولاية بيرم في فكونتاكتي . 1024 × 705 بكسل تعرضت لضغط JPEG عدة مرات ، مع ملصقات ضعيفة القراءة.

مطحنة غير معروفة من الثلاثينيات

لقد قضينا وقتًا رائعًا ، وحلنا هذا اللغز وأكد يوم الاثنين نتائجنا من خلال الذهاب إلى الأرشيف ودراسة الصورة الأصلية.

سمح لي هذا بإجراء تجربة ومعرفة الشبكات العصبية القادرة على ذلك.

مطحنة غير معروفة من الثلاثينيات - المقارنة

ونتيجة لذلك ، كان الخيار الأكثر قابلية للقراءة هو "زيادة بسيطة" (بشكل عام ، قرأت هذا النقش ببساطة عن طريق توسيعه على شاشة الهاتف الذكي). جعل

biz.mail.ru الملصق غير قابل للقراءة على نطاق واسع ، ولكن السطر "Acme Road Mach Co" لا يزال مقروءًا جزئيًا على مقياس معين.

جعل بقية المتقدمين ضجيجًا لدرجة أن النقش توقف عن قراءته على الإطلاق. على الرغم من أنها لا تزال معترف بها جزئيا.

أي أن خدمات "تحسين الصور" فعلت العكس تمامًا - فقد ساءت الصورة الحقيقية.

وإذا قلت إن تحسين النقوش على الصور القديمة ليس مهمة لمثل هذه الخدمات ، فسأوافق ، لأن هذه هي المشكلة بالضبط. والحقيقة هي أن هذه الخدمات موجودة ، ويتم وضعها على أنها خدمات "الترميم" و "الترميم" ، دون شرح المستخدمين للمخاطر والعواقب المرتبطة بالتكنولوجيا المستخدمة. يمكن للأشخاص الذين يدرسون تاريخ عائلاتهم أو أماكنهم "تحسين" صورهم الرقمية.

ولدي شكوك كبيرة في أنهم سيخزنون الصورة الأصلية غير المحسنة بعناية.

لدي مثال آخر يتعلق بأرشيف بيرم وإسناد الصور ، ولكنه سيكون في التحديث التالي لدراسات المصادر الرقمية ، والآن أفضل العودة إلى الآلات التي صورتها في دوموديدوفو.

2.2 غطاء محرك السيارة Lorraine-Dietrich B36


للتحقق من إمكانيات تكبير الصور ، التقطت إحدى الصور الخاصة بي ، وخفضت حجم البكسل من 4000 إلى 3000 إلى 1024 إلى 768 ، وتوجهت عبر نفس الخدمات كما في حالة صورة المصنع من المثال السابق.

لورين ديتريش B36

وإذا كان المشاهد العادي لهذه الصور "المحسنة" لا ينظر إليها حقًا ، فقد كنت مهتمًا بالتفاصيل الصغيرة.

غطاء محرك السيارة Lorraine-Dietrich B36

كانت النتيجة متوقعة.

يمكن التعرف على الشعار الموجود على شبكة المبرد ، لكنه مشوه - أصبحت الخطوط متساوية.

يتم تنفيس فتحات التهوية الجانبية ولا يمكن تمييزها عن الوهج على غطاء المحرك.

من المتوقع تمامًا ، اختفت العديد من التفاصيل الصغيرة ، لكن هذا المثال ليس هنا على الإطلاق لتأكيد فكرة عدم رجوع فقدان المعلومات من صورة رقمية مع تقليل حجم البكسل.

إذا نظرت بعناية إلى الصور ، فقد رأيت بالفعل علامات على أن الشبكة العصبية قد عملت هنا.

مكافأة من letenhance.io


هذا هو الوقت المناسب للتذكر كيف تعمل الشبكات العصبية - تختار الخيارات المناسبة من "تجربتها" الخاصة التي تم الحصول عليها نتيجة للتدريب.

والآن سوف أعرض كيف أن موقع letenhance.io بالضبط زاد 4 أضعاف الصورة ، والتي قمت بتقليلها 4 مرات في السابق.

على اليسار ترى الصورة الأصلية قبل التصغير ، على اليمين - تم الحصول عليها بعد تكبيرها. (لا يتم عرض صورة متوسطة متوسطة)

مكافأة من letenhance.io

نعم ، هذا صحيح - هذا هو وجه القرد.

وإذا رأيت في هذا حالة مضحكة ، مشكلة تدريب شبكة عصبية أو سوء استخدامها ، فأنا أرى شيئًا مختلفًا تمامًا. وهي عدد كبير من الصور الرقمية التي تم "تحسينها" والتي سيتم تحسينها بواسطة الشبكة العصبية وستدخل في التداول. سيحل بعضها محل النسخ الأصلية بحكم خسارتها.

وإذا كنت قبل البدء في كتابة هذا المقال ، كنت على دراية بالمشكلات المرتبطة بطريقة تحسين / استعادة الصور باستخدام الشبكات العصبية ، فقد وجدت هذه المشكلة وجهها الخاص.

ولكن هذه ليست نهاية القصة.

3. زيادة عدد الإطارات في الفيديو


من أجل الحصول على فيلم ، لا يكفي أن يكون لديك صورة واحدة كبيرة وملونة. يجب أن يكون هناك العديد من هذه الصور ويجب أن تحل محل بعضها البعض بسرعة كبيرة.

تتمثل إحدى طرق تحسين الأفلام في زيادة سرعة استبدال هذه الصور ببعضها البعض. أو ، كما هو صحيح أن نسميها ، "زيادة معدل الإطار".

وفي هذه الحالة أيضًا ، لا يوجد شيء جديد. تمامًا كما في حالة تغير اللون وتقليل حجم البكسل ، لا توجد طريقة للحصول على معلومات حول ما حدث بين الإطارات.

يمكن افتراض كيفية تحرك الهدف في الإطار وإنهائه على الإطارات المضافة حديثًا ، ولكن ، كما هو الحال في التلوين والتكبير ، سيكون الانتهاء من التفاصيل الجديدة ، وليس استعادة ما حدث بالفعل.

يتم توضيح ذلك بشكل أفضل من خلال لقطة من عرض DAIN للشبكة العصبية . (بناءً على وصف مقطع الفيديو "وصول قطار" المذكور سابقًا ، كانت هذه الشبكة العصبية هي التي استخدمها مؤلفوها لزيادة معدل الإطارات) فيما

زيادة عدد الإطارات في الفيديو

يلي مقارنة بين 3 خيارات لزيادة معدل الإطارات من 12 إطارًا في الثانية إلى 24 إطارًا في الثانية.

الإطار الأيسر العلوي هو الفيديو الأصلي.
أسفل اليمين هو نتيجة DAIN. الحلان
المتبقيان هما حلول يقارنها منشئو DAIN بأنفسهم.

كما ترى ، في جميع الحالات الثلاث لزيادة معدل الإطارات ، نحاول العثور على الحالة المتوسطة بين إطارين. على الرغم من حقيقة أن خيار DAIN (الإطار الأيمن السفلي) يبدو أكثر حدة من خيارات SepConv و ToFlow ، إلا أنه لا يزال يوضح كيف يتم تلطيخ القميص على الظهر والرأس.

وحتى عندما تتحرك التقنيات إلى الأمام ولن يكون هناك مثل هذا التلطيخ ، فإن هذا لن يغير الوضع مع حقيقة أنه من المستحيل استعادة ما حدث بين الإطارات ، وكل ما تبقى لنا هو رسم نوع من الحالة المتوسطة.

استنتاج


بصفتي متخصصًا في تكنولوجيا المعلومات ، أفهم أن هذه التقنيات غير مصممة للحفاظ على المصادر الرقمية بشكل صحيح. هناك حاجة إلى الشبكات العصبية من أجل إنتاج محتوى جميل وسهل الانزلاق.

لذلك ، يتم تلوين الأفلام ، اقتصاصها وزيادة معدل الإطارات.

هذا مجرد عرض للأعمال التجارية ، ولا ينبغي أن يهتم مؤلفو التكنولوجيا بكيفية استخدام المستخدمين لتطورهم.

لكن كمؤرخ ، أرى نتائج استخدام هذه التقنيات. ستؤدي زيادة عدد الصور والأفلام "المحسنة بواسطة الشبكات العصبية" إلى دخولها في المواد المستخدمة كمصادر تاريخية في دراسات مختلفة. ستؤدي الظواهر المتزامنة إلى غسل الإصدارات القديمة للملفات وتحويل النسخ "المحسنة" إلى النسخ المتاحة فقط (مرحبًا ، " Digital Wear ").

لا يمكن إيقاف هذه العملية ، ولكن يمكن تطوير طرق لتقليل الضرر. في الواقع ، هذا هو ما يدور حوله الكتاب حول دراسات المصادر الرقمية ، وهو موجه بشكل خاص لزملائي في ورشة العمل التاريخية ، وليس المتخصصين في صناعة تكنولوجيا المعلومات.

على الرغم من أن هناك طريقة متاحة لجميع الناس ، بغض النظر عن المهنة ، للتوقف عن استدعاء عملية إنشاء محتوى وسائط سهل الهضم بكلمات "الاستعادة" و "الاستعادة" ، حتى لا تخلق انطباعًا خاطئًا بين غير المستهلين حول جوهر هذه العملية والمنتج الناتج.

هناك كلمة أخرى لهذا:
, , . -, , . (, ); , . , , . , ( ) , , . , - - — , (. ). , , , , . إذا كانت ر تقتصر على تصحيح هذا التنافر فقط ، فيجب الاعتراف بدورها على أنه مرغوب ومفيد للغاية.

(الاختيار الغامق لي).

قاموس بروكهاوس وإيفرون الموسوعي: المجلد الخامس والعشرون ، ص. 624

منشور في ألف وثمانية مائة وتسعة تسعة.

كما ترون ، هذه المشكلة غير معروفة في الألفية الأولى وكانت ذات صلة حتى في وقت ظهور الفيلم الأصلي "وصول القطار".

All Articles