فيديو Dipfake إطار واحد


مثال عملي أول نموذج الحركة الحركة


هل من الممكن عمل فيلم كامل من صورة واحدة؟ وبعد تسجيل حركات شخص ما ، استبدله بآخر في الفيديو؟ بالطبع ، الإجابة على هذه الأسئلة مهمة للغاية لمجالات مثل السينما والتصوير الفوتوغرافي وتطوير ألعاب الكمبيوتر. يمكن أن يكون الحل معالجة الصور الرقمية باستخدام برامج متخصصة. تسمى المشكلة المعنية بين المتخصصين في هذا المجال مهمة التوليف التلقائي للفيديو أو الصور المتحركة.


للحصول على النتيجة المتوقعة ، تجمع المناهج الموجودة بين الأشياء المستخرجة من الصورة الأصلية والحركات التي يمكن تقديمها كفيديو منفصل - "مانح".


الآن ، في معظم المناطق ، يتم تنفيذ الرسوم المتحركة للصور باستخدام أدوات رسومات الكمبيوتر. يتطلب هذا النهج معرفة إضافية حول الكائن الذي نريد تحريكه - عادة ما يكون نموذجه ثلاثي الأبعاد ضروريًا (يمكن العثور هنا على كيفية عمله الآن في صناعة الأفلام ). تعتمد معظم أحدث الحلول لهذه المشكلة على التدريب المتعمق للنماذج ، والتي تستند إلى الشبكات العصبية التنافسية التنافسية (GAN) وأجهزة الترميز التلقائي المتنوعة (VAE). تستخدم هذه النماذج عادةً وحدات تم تدريبها مسبقًا للبحث عن نقاط رئيسية للكائنات في الصورة. المشكلة الرئيسية في هذا النهج هي أن هذه الوحدات يمكن أن تتعرف فقط على الأشياء التي تم تدريبها عليها.


, ? «First Order Motion Model for Image Animation». — First Order Motion Model, . , (, , ), , .




, .


, , (occlusion map). . , , .



: .
DR3×H×WSR3×H×W. SD.



SD. , ( ) R. T^SDDSO^SD. .


.



TSDDS. TSD. , R( ), TSDTSRTRD. , X, TXR. Kp1,...,pK, p1,...,pKR.


:



TRX=TXR1, , TXR.


:


TSD=TSRTRD=TSRTDR1


TSR(pk)TDR(pk). U-Net, K, .
softmax , .


PT^SDTSD(z)( z), S. , T^SD, , D, S. T^SD, KS0,...,Sk(S0=S), T^SD. S1,...,SkU-Net.
T^SD(z):



Mk— (M0 — ) Jk:




, SD^. , . down-sampling ξRH×W. ξc T^SD. S, D^. — O^SD[0,1]H×W, , , S. :


ξ=O^SDfw(ξ,T^SD)


fw(,), — ( ).


, . ξ, .



, . reconstruction loss, . - VGG-19. reconstruction loss :


Lrec(D^,D)=i=1I|Ni(D^)Ni(D)|


D^— , D— , Ni()— i- , VGG-19, I— .



- . . , . , . , , , .


, XTXY, , thin plane spline. Y. , TXR
TYR. C :


TXRTXYTYR


( 1— ):



L1. , reconstruction loss 2 .



S1D1,...DTDt, St. S1D1Dt. , TDtD1(p)pk:



, — S1D1.


!


4 :


  1. VoxCeleb — 22496 , YouTube;
  2. UvA-Nemo — , 1240 ;
  3. BAIR robot pushing — , , , . 42880 128 .
  4. 280 TaiChi YouTube.

X2Face Monkey-Net, .



كما يتبين من الجدول ، فإن نموذج First Order Motion يتفوق على المناهج الأخرى من جميع النواحي.


الأمثلة التي طال انتظارها



مغيف



موضه


جربه الآن! إنه بسيط للغاية ، كل شيء جاهز هنا .


All Articles