#64
summarized by : Akihiro FUJII
StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery

どんな論文か?

StyleGANとCLIPを用いて、テキストベースで画像を操作するStyleCLIPを提案。人・動物・建造物など様々なものをテキストで操作可能。テキストによる潜在表現の摂動を加えた表現で画像を生成させる。コードも公開されている
placeholder

新規性

coarse, medium, fineの3つのグループに分け、テキストによる摂動を加える。そして、CLIPによるテキストを加味した表現の差分、潜在表現が変わりすぎないようなロス、そしてFace Idのロスで学習させる

結果

画像をテキストをもとに編集ができる

その他(なぜ通ったか?等)

https://github.com/orpatashnik/StyleCLIP