#725
summarized by : Takahiro Itazuri
Neural Scene Decomposition for Multi-Person Motion Capture

どんな論文か?

ImageNetで事前学習したモデルは多くの画像タスクにおいて非常に良いパラメータの初期値を与える一方で、複数人の3D Motion Captureにおいてはあまり有用ではない。そこで3D Motion Captureにおいて有用な事前学習済みモデルを作成することを目的に自己教師あり学習を用いた手法であるNerual Scne Decomposition (NSD) を提案した。
placeholder

新規性

複数視点動画から自己教師あり学習を用いて、Spatial Layout (バウンディングボックスと相対的な前後関係) とInstance Segmentation (マスク) とBody Representation (見た目やポーズをエンコードしたベクトル) を抽出することが可能な手法を提案した。

結果

LCR++やResNet、Auto-encoderをベースラインとして、様々なタスクにおいて良い精度を出している。

その他(なぜ通ったか?等)

スポーツ解析をはじめとしたさまざな応用先があり、3次元における人物の状態推定タスクにおいて有用な事前学習済みモデルを提供していることが大きな貢献であると考えられる。