#352
summarized by : 加藤義道
VecGAN: Image-to-Image Translation with Interpretable Latent Directions

どんな論文か?

Image-to-Image translationの研究. 他の属性を保持し特定の属性のみを編集する課題を解決するために, 各属性に対して他の属性と直交する線形方向をEnd-to-Endで学習. また, 編集の強度について、参照画像を用いることも符号化することも可能. 広範な実験により, 提案手法は局所的かつ大域的な編集について最先端の性能を達成.
placeholder

新規性

従来のように個別のスタイルネットワークを用いず, 単一のエンコーダ・デコーダアーキテクチャで変換を実現している点.

結果

HiSDの設定で訓練・評価しSDIT, StarGANv2, Elegant, HiSDと比較. またL2M-GANの設定で訓練・評価しStarGAN, CycleGAN, Elegant, PA-GAN, InterFaceGAN, L2M-GANと比較. どちらでもFIDで最先端の性能を示した. また定性的評価でも背景や文字などが劣化せずに属性の編集ができていた.

その他(なぜ通ったか?等)

編集領域をマスクなどで制限してないのに, 背景の文字などが崩れていないのはすごいと感じた.