Dipfake video satu bingkai


Contoh kerja Model Gerak Pertama


Apakah mungkin membuat seluruh film dari satu foto? Dan setelah merekam gerakan satu orang, gantikan dia dengan orang lain di video? Tentu saja, jawaban atas pertanyaan-pertanyaan ini sangat penting untuk bidang-bidang seperti bioskop, fotografi, dan pengembangan game komputer. Solusinya bisa pemrosesan foto digital menggunakan perangkat lunak khusus. Masalah yang dipermasalahkan di antara spesialis di bidang ini disebut tugas sintesis otomatis video atau animasi gambar.


Untuk mendapatkan hasil yang diharapkan, pendekatan yang ada menggabungkan objek yang diekstraksi dari gambar asli dan gerakan yang dapat disampaikan sebagai video terpisah - "donor".


Sekarang, di sebagian besar wilayah, animasi gambar dilakukan dengan menggunakan alat grafik komputer. Pendekatan ini membutuhkan pengetahuan tambahan tentang objek yang ingin kita animasi - model 3D-nya biasanya diperlukan (cara kerjanya di industri film sekarang dapat dibaca di sini ). Sebagian besar solusi terbaru untuk masalah ini didasarkan pada pelatihan model yang mendalam, yang didasarkan pada jaringan saraf generatif-kompetitif (GAN) dan autoencoder variasional (VAE). Model-model ini biasanya menggunakan modul pra-terlatih untuk mencari titik kunci dari objek dalam gambar. Masalah utama dengan pendekatan ini adalah bahwa modul-modul ini hanya dapat mengenali objek yang mereka latih.


, ? Β«First Order Motion Model for Image AnimationΒ». β€” First Order Motion Model, . , (, , ), , .


…



, .


, , (occlusion map). . , , .



: .
D∈R3Γ—HΓ—WS∈R3Γ—HΓ—W. SD.



SD. , ( ) R. T^S←DDSO^S←D. .


.



TS←DDS. TS←D. , R( ), TS←DTS←RTR←D. , X, TX←R. Kp1,...,pK, p1,...,pKR.


:



TR←X=TX←Rβˆ’1, , TX←R.


:


TS←D=TS←R∘TR←D=TS←R∘TD←Rβˆ’1


TS←R(pk)TD←R(pk). U-Net, K, .
softmax , .


PT^S←DTS←D(z)( z), S. , T^S←D, , D, S. T^S←D, KS0,...,Sk(S0=S), T^S←D. S1,...,SkU-Net.
T^S←D(z):



Mkβ€” (M0 β€” ) Jk:




, SD^. , . down-sampling ξ∈RHβ€²Γ—Wβ€². ΞΎc T^S←D. S, D^. β€” O^S←D∈[0,1]Hβ€²Γ—Wβ€², , , S. :


ΞΎβ€²=O^S←DβŠ™fw(ΞΎ,T^S←D)


fw(β‹…,β‹…), βŠ™β€” ( ).


, . ΞΎβ€², .



, . reconstruction loss, . - VGG-19. reconstruction loss :


Lrec(D^,D)=βˆ‘i=1I|Ni(D^)βˆ’Ni(D)|


D^β€” , Dβ€” , Ni(β‹…)β€” i- , VGG-19, Iβ€” .



- . . , . , . , , , .


, XTX←Y, , thin plane spline. Y. , TX←R
TY←R. C :


TX←R≑TX←Y∘TY←R


( 1β€” ):



L1. , reconstruction loss 2 .



S1D1,...DTDt, St. S1D1Dt. , TDt←D1(p)pk:



, β€” S1D1.


!


4 :


  1. VoxCeleb β€” 22496 , YouTube;
  2. UvA-Nemo β€” , 1240 ;
  3. BAIR robot pushing β€” , , , . 42880 128 .
  4. 280 TaiChi YouTube.

X2Face Monkey-Net, .



Seperti dapat dilihat dari tabel, model First Order Motion lebih unggul daripada pendekatan lain dalam semua hal.


Contoh yang sudah lama ditunggu-tunggu



Mgif



Mode


Sekarang coba sendiri! Sangat sederhana, semuanya disiapkan di sini .


All Articles