DeciWatch: A Simple Baseline for 10× Efficient 2D and 3D Pose Estimation

#188

summarized by : Ryuichi Nakahara

Ailing Zeng; Xuan Ju; Lei Yang; Ruiyuan Gao; Xizhou Zhu; Bo Dai; Qiang Xu

どんな論文か？

動画の３D人物姿勢推定、10分の1以下という少ないサンプリングフレームから推定

新規性

全ての動画フレームで計算するのではなく、10分の1以下のフレームに対して姿勢推定を行い、残りのフレームの姿勢を推定することで計算量を大幅に削減サンプル・ノイズ・リカバーの3段階処理。 Transformer モデル（ DenoiseNet ）でノイズ除去し、別のTransformer モデル(RecoverNet) で各フレームの姿勢を得る。

結果

4つのデータセットで良好な結果

その他（なぜ通ったか？等）

様々な既存モデルに応用可能であることが評価されたと思われるまたGitHubページには動画資料もあり非常に分かりやすい https://github.com/cure-lab/DeciWatch

このページで利用されている画像は論文から引用しています．