- …
- …
#64
summarized by : Akihiro FUJII
どんな論文か?
StyleGANとCLIPを用いて、テキストベースで画像を操作するStyleCLIPを提案。人・動物・建造物など様々なものをテキストで操作可能。テキストによる潜在表現の摂動を加えた表現で画像を生成させる。コードも公開されている
新規性
coarse, medium, fineの3つのグループに分け、テキストによる摂動を加える。そして、CLIPによるテキストを加味した表現の差分、潜在表現が変わりすぎないようなロス、そしてFace Idのロスで学習させる
結果
画像をテキストをもとに編集ができる
その他(なぜ通ったか?等)
https://github.com/orpatashnik/StyleCLIP
- …
- …