Dipfake Video ein Bild


Arbeitsbeispiel fĂŒr ein Bewegungsmodell erster Ordnung


Ist es möglich, einen ganzen Film aus einem Foto zu machen? Und nachdem Sie die Bewegungen einer Person aufgezeichnet haben, ersetzen Sie sie im Video durch eine andere? NatĂŒrlich ist die Antwort auf diese Fragen fĂŒr Bereiche wie Kino, Fotografie und die Entwicklung von Computerspielen Ă€ußerst wichtig. Die Lösung könnte die digitale Fotoverarbeitung mit einer speziellen Software sein. Das fragliche Problem unter Fachleuten auf diesem Gebiet ist die Aufgabe der automatischen Synthese von Video- oder Bildanimationen.


Um das erwartete Ergebnis zu erzielen, kombinieren bestehende AnsĂ€tze Objekte, die aus dem Originalbild extrahiert wurden, und Bewegungen, die als separates Video geliefert werden können - „Spender“.


In den meisten Bereichen erfolgt die Bildanimation jetzt mit Computergrafikwerkzeugen. Dieser Ansatz erfordert zusĂ€tzliches Wissen ĂŒber das Objekt, das wir animieren möchten - sein 3D-Modell ist normalerweise erforderlich (wie es jetzt in der Filmindustrie funktioniert, finden Sie hier ). Die meisten der neuesten Lösungen fĂŒr dieses Problem basieren auf einer eingehenden Schulung von Modellen, die auf generativ-kompetitiven neuronalen Netzen (GAN) und variierenden Autoencodern (VAE) basieren. Diese Modelle verwenden normalerweise vorab trainierte Module, um nach SchlĂŒsselpunkten von Objekten im Bild zu suchen. Das Hauptproblem bei diesem Ansatz besteht darin, dass diese Module nur die Objekte erkennen können, auf denen sie trainiert wurden.


, ? «First Order Motion Model for Image Animation». — First Order Motion Model, . , (, , ), , .







, .


, , (occlusion map). . , , .



: .
D∈R3×H×WS∈R3×H×W. SD.



SD. , ( ) R. T^S←DDSO^S←D. .


.



TS←DDS. TS←D. , R( ), TS←DTS←RTR←D. , X, TX←R. Kp1,...,pK, p1,...,pKR.


:



TR←X=TX←R−1, , TX←R.


:


TS←D=TS←R∘TR←D=TS←R∘TD←R−1


TS←R(pk)TD←R(pk). U-Net, K, .
softmax , .


PT^S←DTS←D(z)( z), S. , T^S←D, , D, S. T^S←D, KS0,...,Sk(S0=S), T^S←D. S1,...,SkU-Net.
T^S←D(z):



Mk— (M0 — ) Jk:




, SD^. , . down-sampling Ο∈RHâ€Č×Wâ€Č. Οc T^S←D. S, D^. — O^S←D∈[0,1]Hâ€Č×Wâ€Č, , , S. :


Οâ€Č=O^S←D⊙fw(Ο,T^S←D)


fw(⋅,⋅), ⊙— ( ).


, . Οâ€Č, .



, . reconstruction loss, . - VGG-19. reconstruction loss :


Lrec(D^,D)=∑i=1I|Ni(D^)−Ni(D)|


D^— , D— , Ni(⋅)— i- , VGG-19, I— .



- . . , . , . , , , .


, XTX←Y, , thin plane spline. Y. , TX←R
TY←R. C :


TX←R≡TX←Y∘TY←R


( 1— ):



L1. , reconstruction loss 2 .



S1D1,...DTDt, St. S1D1Dt. , TDt←D1(p)pk:



, — S1D1.


!


4 :


  1. VoxCeleb — 22496 , YouTube;
  2. UvA-Nemo — , 1240 ;
  3. BAIR robot pushing — , , , . 42880 128 .
  4. 280 TaiChi YouTube.

X2Face Monkey-Net, .



Wie aus der Tabelle hervorgeht, ist das Bewegungsmodell erster Ordnung anderen AnsĂ€tzen in jeder Hinsicht ĂŒberlegen.


Die lang erwarteten Beispiele



Mgif



Mode


Jetzt probieren Sie es selbst! Es ist sehr einfach, alles vorbereitet ist hier .


All Articles