StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery

#64

summarized by : Akihiro FUJII

Or Patashnik, Zongze Wu, Eli Shechtman, Daniel Cohen-Or, Dani Lischinski

StyleGANとCLIPを用いて、テキストベースで画像を操作するStyleCLIPを提案。人・動物・建造物など様々なものをテキストで操作可能。テキストによる潜在表現の摂動を加えた表現で画像を生成させる。コードも公開されている

coarse, medium, fineの３つのグループに分け、テキストによる摂動を加える。そして、CLIPによるテキストを加味した表現の差分、潜在表現が変わりすぎないようなロス、そしてFace Idのロスで学習させる

画像をテキストをもとに編集ができる

https://github.com/orpatashnik/StyleCLIP

このページで利用されている画像は論文から引用しています．