![](https://habrastorage.org/webt/ru/u1/i2/ruu1i2f53e-_0vifyiziwyfq8ta.gif)
Exemple de travail du modĂšle de mouvement du premier ordre
Est-il possible de rĂ©aliser un film entier Ă partir d'une seule photo? Et aprĂšs avoir enregistrĂ© les mouvements d'une personne, la remplacer par une autre dans la vidĂ©o? Bien sĂ»r, la rĂ©ponse Ă ces questions est extrĂȘmement importante pour des domaines tels que le cinĂ©ma, la photographie et le dĂ©veloppement de jeux informatiques. La solution pourrait ĂȘtre un traitement photo numĂ©rique utilisant un logiciel spĂ©cialisĂ©. Le problĂšme en question chez les spĂ©cialistes de ce domaine est appelĂ© la tĂąche de synthĂšse automatique de l'animation vidĂ©o ou image.
Pour obtenir le rĂ©sultat escomptĂ©, les approches existantes combinent des objets extraits de l'image d'origine et des mouvements qui peuvent ĂȘtre livrĂ©s sous forme de vidĂ©o distincte - «donneur».
Maintenant, dans la plupart des domaines, l'animation d'image se fait Ă l'aide d'outils graphiques informatiques. Cette approche nĂ©cessite des connaissances supplĂ©mentaires sur l'objet que nous voulons animer - son modĂšle 3D est gĂ©nĂ©ralement nĂ©cessaire (comment il fonctionne maintenant dans l'industrie cinĂ©matographique peut ĂȘtre trouvĂ© ici ). La plupart des derniĂšres solutions Ă ce problĂšme sont basĂ©es sur une formation approfondie des modĂšles, qui sont basĂ©s sur des rĂ©seaux neuronaux compĂ©titifs gĂ©nĂ©ratifs (GAN) et des autoencodeurs variationnels (VAE). Ces modĂšles utilisent gĂ©nĂ©ralement des modules prĂ©-formĂ©s pour rechercher des points clĂ©s d'objets dans l'image. Le principal problĂšme de cette approche est que ces modules ne peuvent reconnaĂźtre que les objets sur lesquels ils ont Ă©tĂ© formĂ©s.
, ? «First Order Motion Model for Image Animation». â First Order Motion Model, . , (, , ), , .
âŠ
, .
, , (occlusion map). . , , .
: .
. .
![](https://habrastorage.org/webt/0x/re/cq/0xrecqhwm_d83qfkjpwhyaas8xu.png)
. , ( ) . . .
.
. . , ( ), . , , . , .
:
![](https://habrastorage.org/webt/o8/my/zm/o8myzmyow_q77egbm6eosnjrsp0.png)
, , .
:
. U-Net, , .
softmax , .
( ), . , , , , . , (), . U-Net.
:
![](https://habrastorage.org/webt/jp/f5/rz/jpf5rzgzijfa4fgmtpvzuxpg5gg.png)
â ( â ) :
![](https://habrastorage.org/webt/6d/9y/fs/6d9yfsloxcec9hjgjhv_tg-avqo.png)
, . , . down-sampling . c . , . â , , , . :
, â ( ).
, . , .
, . reconstruction loss, . - VGG-19. reconstruction loss :
â , â , â i- , VGG-19, â .
- . . , . , . , , , .
, , , thin plane spline. . ,
. C :
( â ):
![](https://habrastorage.org/webt/xd/0t/4n/xd0t4ngjbhihf67gf_da9xlhhny.png)
. , reconstruction loss 2 .
, . . , :
![](https://habrastorage.org/webt/fe/vy/ze/fevyzeqwuqjlkx6udhfihvhhzhu.png)
, â .
!
4 :
- VoxCeleb â 22496 , YouTube;
- UvA-Nemo â , 1240 ;
- BAIR robot pushing â , , , . 42880 128 .
- 280 TaiChi YouTube.
X2Face Monkey-Net, .
![](https://habrastorage.org/webt/g1/i1/wi/g1i1wibydixredtdjjf6ozoji8q.png)
Comme le montre le tableau, le modÚle de mouvement du premier ordre est supérieur aux autres approches à tous égards.
Les exemples tant attendus
![](https://habrastorage.org/webt/ao/kl/s5/aokls5vqm99ouvx0l3ubv2xh-xs.gif)
Mgif
![](https://habrastorage.org/webt/pb/fk/34/pbfk34ek4nydx_2-6mbwsarwomy.gif)
Mode
Essayez-le maintenant! C'est trÚs simple, tout est préparé ici .