#188
summarized by : Ryuichi Nakahara
DeciWatch: A Simple Baseline for 10× Efficient 2D and 3D Pose Estimation

どんな論文か?

動画の3D人物姿勢推定、10分の1以下という少ないサンプリングフレームから推定

新規性

全ての動画フレームで計算するのではなく、10分の1以下のフレームに対して姿勢推定を行い、残りのフレームの姿勢を推定することで計算量を大幅に削減 サンプル・ノイズ・リカバーの3段階処理。 Transformer モデル( DenoiseNet )でノイズ除去し、別のTransformer モデル(RecoverNet) で各フレームの姿勢を得る。

結果

4つのデータセットで良好な結果

その他(なぜ通ったか?等)

様々な既存モデルに応用可能であることが評価されたと思われる またGitHubページには動画資料もあり非常に分かりやすい https://github.com/cure-lab/DeciWatch