#919
summarized by : Takahiro Itazuri
PoseFix: Model-Agnostic General Human Pose Refinement Network

どんな論文か?

単一画像から3次元の教師データなしで、3次元の顔形状と表情を推定するネットワーク RingNet を提案した。RingNet は同一人物の顔形状は異なる画像間で不変であるというキーアイデアを元に、この顔形状の不変性を利用して学習を行うことで、3次元データを用いずに FRAME モデルのパラメータの推定を実現した。
placeholder

新規性

3次元の教師データを利用することなく、同一人物における顔形状の不変性と異なる人物間における顔形状が異なる点に着目して環境変化に頑強な3次元顔形状推定を実現した。

結果

NoW データセットにおいて、PRNet、Extereme3D、3DMM-CNN より高い精度を実現した。

その他(なぜ通ったか?等)

同一人物の異なる画像間で顔形状が不変であるというキーアイデアは、異なる画像間で不変なものを利用するという前提を満たすことでその他のタスクにおいても利用可能であることが採択の理由であると考えられる。