#451
summarized by : Hirokatsu Kataoka
Egocentric Prediction of Action Target in 3D

どんな論文か?

一人称ビジョン x 3D空間における人物-物体インタラクションの認識に関する研究。同問題設定において、EgoPAT3Dデータセットを提案している。
placeholder

新規性

一人称ビジョンからの物体操作認識を3D空間で行うことができるEgoPAT3Dデータセットの提案が一番の貢献点である。データセットは「15シーン・3D点群・15,000物体操作行動・600分のRGBD動画・1M RGBフレーム」の特徴を持つ。

結果

提案データセットに対して視覚特徴(Visual Features), 変換行列(Transformation Matrices), IMUやその組み合わせをベンチマークした。結果は全ての特徴を用いることが最も良好な性能を叩き出し、やはりVFの寄与率が大きいことを明らかにした。

その他(なぜ通ったか?等)

Project Page: https://github.com/ai4ce/EgoPAT3D