VĂ­deo Dipfake um quadro


Exemplo de trabalho de modelo de movimento de primeira ordem


É possĂ­vel fazer um filme inteiro a partir de uma fotografia? E depois de gravar os movimentos de uma pessoa, substitua-o por outro no vĂ­deo? Obviamente, a resposta a essas perguntas Ă© extremamente importante para ĂĄreas como cinema, fotografia e desenvolvimento de jogos de computador. A solução pode ser o processamento de fotos digitais usando software especializado. O problema em questĂŁo entre especialistas neste campo Ă© chamado de tarefa de sĂ­ntese automĂĄtica de vĂ­deo ou animação de imagem.


Para obter o resultado esperado, as abordagens existentes combinam objetos extraídos da imagem original e movimentos que podem ser entregues como um vídeo separado - “doador”.


Agora, na maioria das ĂĄreas, a animação de imagens Ă© feita usando ferramentas de computação grĂĄfica. Essa abordagem requer conhecimento adicional sobre o objeto que queremos animar - seu modelo 3D geralmente Ă© necessĂĄrio (como ele funciona agora na indĂșstria cinematogrĂĄfica pode ser encontrado aqui ). A maioria das soluçÔes mais recentes para esse problema se baseia em treinamento aprofundado de modelos, baseados em redes neurais generativas competitivas (GAN) e auto-codificadores variacionais (VAE). Esses modelos geralmente usam mĂłdulos prĂ©-treinados para procurar pontos-chave dos objetos na imagem. O principal problema dessa abordagem Ă© que esses mĂłdulos podem reconhecer apenas os objetos nos quais foram treinados.


, ? «First Order Motion Model for Image Animation». — First Order Motion Model, . , (, , ), , .







, .


, , (occlusion map). . , , .



: .
D∈R3×H×WS∈R3×H×W. SD.



SD. , ( ) R. T^S←DDSO^S←D. .


.



TS←DDS. TS←D. , R( ), TS←DTS←RTR←D. , X, TX←R. Kp1,...,pK, p1,...,pKR.


:



TR←X=TX←R−1, , TX←R.


:


TS←D=TS←R∘TR←D=TS←R∘TD←R−1


TS←R(pk)TD←R(pk). U-Net, K, .
softmax , .


PT^S←DTS←D(z)( z), S. , T^S←D, , D, S. T^S←D, KS0,...,Sk(S0=S), T^S←D. S1,...,SkU-Net.
T^S←D(z):



Mk— (M0 — ) Jk:




, SD^. , . down-sampling Ο∈RHâ€Č×Wâ€Č. Οc T^S←D. S, D^. — O^S←D∈[0,1]Hâ€Č×Wâ€Č, , , S. :


Οâ€Č=O^S←D⊙fw(Ο,T^S←D)


fw(⋅,⋅), ⊙— ( ).


, . Οâ€Č, .



, . reconstruction loss, . - VGG-19. reconstruction loss :


Lrec(D^,D)=∑i=1I|Ni(D^)−Ni(D)|


D^— , D— , Ni(⋅)— i- , VGG-19, I— .



- . . , . , . , , , .


, XTX←Y, , thin plane spline. Y. , TX←R
TY←R. C :


TX←R≡TX←Y∘TY←R


( 1— ):



L1. , reconstruction loss 2 .



S1D1,...DTDt, St. S1D1Dt. , TDt←D1(p)pk:



, — S1D1.


!


4 :


  1. VoxCeleb — 22496 , YouTube;
  2. UvA-Nemo — , 1240 ;
  3. BAIR robot pushing — , , , . 42880 128 .
  4. 280 TaiChi YouTube.

X2Face Monkey-Net, .



Como pode ser visto na tabela, o modelo de movimento de primeira ordem Ă© superior a outras abordagens em todos os aspectos.


Os tĂŁo esperados exemplos



Mgif



moda


Agora tente vocĂȘ mesmo! É muito simples, tudo estĂĄ preparado aqui .


All Articles