PoseFix: Model-Agnostic General Human Pose Refinement Network

#919

summarized by : Takahiro Itazuri

Gyeongsik Moon, Ju Yong Chang, Kyoung Mu Lee

どんな論文か？

単一画像から３次元の教師データなしで、３次元の顔形状と表情を推定するネットワーク RingNet を提案した。RingNet は同一人物の顔形状は異なる画像間で不変であるというキーアイデアを元に、この顔形状の不変性を利用して学習を行うことで、３次元データを用いずに FRAME モデルのパラメータの推定を実現した。

新規性

３次元の教師データを利用することなく、同一人物における顔形状の不変性と異なる人物間における顔形状が異なる点に着目して環境変化に頑強な３次元顔形状推定を実現した。

結果

NoW データセットにおいて、PRNet、Extereme3D、3DMM-CNN より高い精度を実現した。

その他（なぜ通ったか？等）

同一人物の異なる画像間で顔形状が不変であるというキーアイデアは、異なる画像間で不変なものを利用するという前提を満たすことでその他のタスクにおいても利用可能であることが採択の理由であると考えられる。

このページで利用されている画像は論文から引用しています．