#708
summarized by : 金城 忍
Unsupervised Disentanglement of Linear-Encoded Facial Semantics

どんな論文か?

顔画像を複数のマテリアル情報 (View, Lighting, Albedo, Depth) に分割し、それらを使用して元画像を再現する一方で、View, Lightingは変更せず、異なる画像のAlbedo, Depthを使用して元画像を生成し、それぞれの元画像との損失を取ることで、顔の局所的な潜在表現を学習し、より部分的な箇所の変更に対する合成画像を生成する提案

新規性

既存の顔画像の3D再現アルゴリズムで取得したマテリアル情報を使用して、その一部の特徴量を学習することで、StyleGANで画像生成に利用される符号を更に分離し、顔の局所部位に対する変化を反映した合成画像を生成するという点で新規

結果

相関除去を通して得られた分離された潜在コードに対するそれぞれの顔のセマンティクスがより大きな相関関係を示す一方で、CASIA Web-Face、Flickr-Face-HQでの評価では、提案手法は、対象となる顔の局部 (顎) の局所的な拡張とともに学習することで、その部所に変化が与えられた画像をより忠実に再現した

その他(なぜ通ったか?等)