#190
summarized by : 綱島 秀樹
MaskGAN: Towards Diverse and Interactive Facial Image Manipulation

どんな論文か?

顔画像の編集において、2stageの訓練でマスクを使って自然に部分的な変化やstyle injectionを行えるようにしたMaskGANを提案。MaskGANはスタイルをうまく転写するためのDMNと画像編集を自然に可能にするEBSTで構成されている。 CelebAMask-HQという512x512のマスクと顔画像のペアのデータセットを作成し、公開した。
placeholder

新規性

・先行研究と比較して抜きんでた定性、定量評価結果を出した点 ・画像編集用を自然に行えるようにするためのEBSTを提案した点 ・新たな顔のマスクのデータセットを提案し、評価した点

結果

・SPADEは自然な転移が出来ているが、元の髭や肌の色などの細かい特徴を欠落しがち ・StarGANはFIDこそ低いものの見た目的に全く自然な転移ができていない ・一方MaskGANは自然であり、細かい特徴も保持したまま転移が可能 ・マスクに書き込みをするインタラクティブな編集においても有効であることを証明

その他(なぜ通ったか?等)

end-to-endにこだわらず、明示的な帰納バイアスを与えたりしており、非常に合理的な手法で効果的結果を出した点、新たな顔のマスクのデータセットを提案して評価した点が大きいと考えられる。Oralになってもおかしくなかった論文であると考えられる。