#69
summarized by : 福原吉博 (Yoshihiro Fukuhara)
Where and What? Examining Interpretable Disentangled Representations

どんな論文か?

生成モデルにおいて, 教師なしでもつれほどかれた表現を獲得する研究. 以下の2つの仮説に基づいたモジュールとロスの設計でもつれ解かれた解釈可能な特徴量を獲得する手法を提案. ①Spatial Constriction:画像中の一部が一貫して変化していれば解釈可能. ②Perceptual Simplicity: latentのそれぞれの次元の方向についての変化が知覚的に単純なら解釈可能.
placeholder

新規性

Spatial Constriction と Perceptual Simplicity をそれぞれ達成するために, 各 latent が影響を与える領域を制限する, SC module と PS loss を提案. また, もつれほどかれた表現を獲得している場合は latent の座標系の回転は表現の統計的性質を変えないことを用いた教師なしの model selection 手法も提案.

結果

CelebA, Shoes, Clevr, FFHQ, DSprites, 3DShapes など複数の Dataset で評価実験を行ってる. 提案手法は教師なしの手法であるが, 既存手法と比較してよりもつれほどかれた表現を獲得可能すると同時に FID も InfoGAN と同等以上の結果を示している.

その他(なぜ通ったか?等)

https://github.com/zhuxinqimac/PS-SC