Dipfake视频一帧


一阶运动模型工作示例


可以用一张照片拍整部电影吗?并录制了一个人的动作,然后在视频中将另一个人替换了?当然,这些问题的答案对于电影,摄影和计算机游戏开发等领域极为重要。解决方案可以是使用专用软件进行数字照片处理。该领域专家中有问题的问题称为视频或图像动画的自动合成任务。


为了获得预期的结果,现有方法结合了从原始图像中提取的对象和可以作为单独视频(“捐赠者”)传递的动作。


现在,在大多数地区,图像动画是使用计算机图形工具完成的。这种方法需要有关我们要设置动画的对象的附加知识-通常需要3D模型(可在此处找到其电影界的工作方式)。该问题的大多数最新解决方案都基于对模型的深入训练,这些模型基于生成竞争性神经网络(GAN)和变分自动编码器(VAE)。这些模型通常使用预训练的模块来搜索图像中对象的关键点。这种方法的主要问题是这些模块只能识别对其进行训练的对象。


如何解决框架中任意物体所描述的问题?在文章“ 用于图像动画的一阶运动模型 ”中提出了一种方法作者提出了他们的神经网络模型-一阶运动模型,该模型解决了图像动画的问题,而无需对动画对象进行预训练。研究了许多描述一个类别的对象(例如,面孔,人体)的视频后,作者开发的网络使您可以为与此类别相关的所有对象设置动画。


让我们更详细地了解它的工作原理...


解决方案功能


为了模拟复杂的运动,使用了一组对象关键要素的编码器,这些编码器在没有老师指导和局部仿射变换的情况下进行了训练。


, , (occlusion map). . , , .



: .
d[R3×H×w ^小号[R3×H×w ^. 小号d.



小号d. , ( ) [R. Ť^小号dd小号Ø^小号d. .


.



Ť小号dd小号. Ť小号d. , [R( ), Ť小号dŤ小号[RŤ[Rd. , X, ŤX[R. ķp1个pķ, p1个pķ[R.


:



Ť[RX=ŤX[R--1个, , ŤX[R.


:


Ť小号d=Ť小号[RŤ[Rd=Ť小号[RŤd[R--1个


Ť小号[RpķŤd[Rpķ. U-Net, ķ, .
softmax , .


PŤ^小号dŤ小号dž( ž), 小号. , Ť^小号d, , d, 小号. Ť^小号d, ķ小号0小号ķ(小号0=小号), Ť^小号d. 小号1个小号ķU-Net.
Ť^小号dž:



中号ķ— (中号0 — ) Ĵķ:




, 小号d^. , . down-sampling ξ[RH×w ^. ξc Ť^小号d. 小号, d^. — Ø^小号d[01个]H×w ^, , , 小号. :


ξ=Ø^小号dFwξŤ^小号d


Fw, — ( ).


, . ξ, .



, . reconstruction loss, . - VGG-19. reconstruction loss :


大号[RËCd^d=一世=1个一世|ñ一世d^--ñ一世d|


d^— , d— , ñ一世— i- , VGG-19, 一世— .



- . . , . , . , , , .


, XŤXÿ, , thin plane spline. ÿ. , ŤX[R
Ťÿ[R. C :


ŤX[RŤXÿŤÿ[R


( 1个— ):



大号1个. , reconstruction loss 2 .



小号1个d1个dŤdŤ, 小号Ť. 小号1个d1个dŤ. , ŤdŤd1个ppķ:



, — 小号1个d1个.


!


4 :


  1. VoxCeleb — 22496 , YouTube;
  2. UvA-Nemo — , 1240 ;
  3. BAIR robot pushing — , , , . 42880 128 .
  4. 280 TaiChi YouTube.

X2Face Monkey-Net, .



从表中可以看出,一阶运动模型在所有方面都优于其他方法。


期待已久的例子



Mgif



时尚


现在自己尝试!这很简单,这里已准备好一切


All Articles