#87
summarized by : Ryo Fujii
TITAN: Future Forecast Using Action Priors

どんな論文か?

一人称視点(車載カメラ)からエージェント(人、車)の将来の軌跡を予測する研究. 過去のエージェントの位置, アクション, シーンコンテクストを考慮し将来の軌跡、自身の動きを予測するモデルの提案。車載カメラから撮影した50 種類のラベルが付与された700のビデオクリップからなるTitan データセットを導入した.
placeholder

新規性

個々のエージェントの位置とともにアクションも考慮する新しいインタラクションモジュール, 自身の動きを予測するのにより関係のある物体を特定するモジュールの提案, マルチラベルの行動認識の精度を上げるmulti-task lossの導入.上記のアルゴリズム的な新規性に加え、 一人称視点からの歩行軌跡予測を目的としたアクションラベルを含む初めての大規模データセットを提案した。

結果

Titan データセットにて既存研究(Social-LSTM, Social_GAN), ベースラインと比較し, SOTA. また,  Agent Importance Mechanism (AIM)によって自身の将来の動作に影響する物体を特定することでリスク知覚を評価する知見を与えた。

その他(なぜ通ったか?等)

データセットの貢献度がとても高い論文であると感じた。この論文はアクションしか考慮していないが、Titanデータセットでは歩行者属性, 車の属性もアノテーションされており今後の研究へと繋がっていきそうであると感じる。