#380
summarized by : Ryo Nakamura
Recognizing Actions in Videos From Unseen Viewpoints

どんな論文か?

現在の動画認識におけるCNNモデルでは,学習データに含まれないカメラの視点からの行動を認識することができない.本論文では視点が変化したときの行動動画を認識できないことを示し.この問題を解決するための3次元表現に基づいた手法を提案し,計算効率の良い視点不変の表現を学習できる新しい幾何学的な畳み込みそうを提案している.さらに,視点不変な特徴を学習するためのデータセットも導入した.
placeholder

新規性

見たことのない行動の視点を学習するために,行動の潜在的な3D表現とその多視点2Dプロジェクションを学習するアプローチを提案.また,見たことのない視点からの行動に対する評価アプローチの提案.また,見たことのない視点からの行動認識のための新しいデータセットの提案.

結果

提案手法が未見の視点に対する認識性能が向上した.Datasetに関する結果としては,人間の動きに焦点を当てたデータセット(Human3.6M)では3D Poseを使用すると未見の行動に対する認識性能が向上した,したし,対象が変わってしまう行動動画に対しては性能が下がった.(動きだけの情報では対象が変わると性能が下がると考察している)というような知見がたくさん記述してある.

その他(なぜ通ったか?等)

未見の行動を認識するタスクは行動認識において重要な知見であり,その知見をためるために,モデルの提案,データセットの作成,Ablation Studyが充実している点から非常に勉強になりますし,価値の高い研究だと感じました.