#384
summarized by : Mitani Tomohiro
Disentangled Representation Learning for 3D Face Shape

どんな論文か?

3D faceを、identityを示す特徴とexpressionを示す特徴(表情や、方向、さらには人種、性別など…)に分けたい。しかし、適したネットワーク構造や、既存のidentity/expressionラベルつきデータセットからどのように学習するかは明らかでなかった。教師データとしては、3D face meshとそのidentity mesh, expression meshの3つ組を使用。
placeholder

新規性

3D face meshを、identity meshとexpression meshにdisentangleするdecomposition networkと、それを逆に統合するfusion networkを学習。メッシュ頂点間の結合を表す隣接行列表記からspectal graph convolutiionを用いた手法が、ユークリッド距離を用いる方法を上回った。

結果

FaceWareHouseにおいて、Bilinar, FLAME, MeshAEを上回った。また、この手法では潜在空間上での補完が可能であり、identity, expressionそれぞれにおいて中間的な特徴をもつ3D modelが生成可能だった。

その他(なぜ通ったか?等)