#865
summarized by : Naoya Chiba
Efficient Online Multi-Person 2D Pose Tracking With Recurrent Spatio-Temporal Affinity Fields

どんな論文か?

Part Affinity Field (PAF)による2D画像上の複数人物のポーズ推定をビデオシーケンスに拡張する.PAFを再帰的なアプローチで時系列に拡張したSpatio-Temporal Affinity Fields (STAF)によって,複数人物の各時刻でのポーズをビデオシーケンス上での連続性を用いつつ推定する.
placeholder

新規性

前時刻でのポーズと現時刻での入力画像から現時刻でのポーズを推定する.このときTemporal Affinity Fields (TAF)により各キーポイントの移動を学習し,PAFと統合して現時刻でのキーポイント位置の推定を行う.この枠組みをSTAFと呼んでいる.推論も高速であり,単一スケール・シングルGPUで30fpsを実現している.

結果

単一画像からPAFを推定する問題で学習し,次に動画像についての学習を行う.学習にはCOCO,MPII,PoseTrackを使用.シングルスケール,マルチスケールのそれぞれで実験しており,Ablation Studyについても記述.

その他(なぜ通ったか?等)