#916
summarized by : Takahiro Itazuri
RepNet: Weakly Supervised Training of an Adversarial Reprojection Network for 3D Human Pose Estimation

どんな論文か?

単一画像中の2次元ポーズから3次元ポーズを推定するタスクにおいて、2次元ポーズへの再投影誤差をベースとして弱教師ありの敵対的学習を行うネットワーク RepNet (Reproject Network) を提案した。
placeholder

新規性

再投影誤差が長い間使用されていたにも関わらず、ニューラルネットを使用した手法では直接3次元ポーズを推定していた。その結果、オーバーフィッティングが発生しやすかった。提案手法では3次元ポーズを推定すると共にカメラポーズを推定し、それらを用いて再投影誤差を計算することで、上記の問題を解決した。

結果

Human3.6M, MPI-INF-3DHP, Leeds Sports Pose (LSP) の3つのデータセット上でSOTAや教師ありの手法より良い精度を出した。また非常に高速に推定が可能である。

その他(なぜ通ったか?等)

ニューラルネットが流行する前の3次元ポーズ推定で使われていた再投影誤差を、ニューラルネットに適用することで高い精度を実現したのが採択理由としては大きいと思われる。