Smoothing the Disentangled Latent Style Space for Unsupervised Image-to-Image Translation

#671

summarized by : 金城忍

Yahui Liu, Enver Sangineto, Yajing Chen, Linchao Bao, Haoxian Zhang, Nicu Sebe, Bruno Lepri, Wei Wang, Marco De Nadai

どんな論文か？

エンコーダから取得された特徴量の大きさに制約を与えることで一様分布を近似し、ドメイン毎の特徴量分布間の開きを滑らかにし、同一及び異なるドメインの画像のスタイルコードの差のノルムを評価する一方で、元画像とスタイルから生成された画像との知覚的な違いを小さくすることで滑らかな画像変換をする手法 (損失関数) の提案

新規性

異なるドメインの画像の特徴量分布を一様分布に近づけることで分布間の開きを滑らかにしスタイル変換の際に発生する突然の変化を緩和するという点で新規

結果

StarGAN v2に提案手法を取り入れ、CelebA-HQ、AFHQの評価で、提案手法が既存手法よりよい結果を達成 (但しCelebA-HQのLPIPS値を除く) する一方で、視覚的評価においても提案手法によって画像がより滑らかに変換されることが確認された

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．