#303
summarized by : QIU YUE
SUTD-TrafficQA: A Question Answering Benchmark and an Efficient Network for Video Reasoning Over Traffic Events

どんな論文か?

新たなTraffic eventのVideo Question Answeringデータセットの提案。特に複雑な交通シーンのcausal inferenceとevents understanding能力を重視した。また、dynamic inferenceを使用したモデルを提案し、フレームを選択的にスキップすることが可能になり、計算コストを大幅に減少した。
placeholder

新規性

①データセットの新規性:Traffic eventのVideo QAデータセットにおいて大規模であり、複数のReasoning能力を評価可能。②

結果

①提案データセットが大規模であり、それを用いて今後の交通シーンのある程度詳細分析を可能にした;②提案の手法が高い精度を実現できた上、大幅に既存手法より計算コストを削減した。

その他(なぜ通ったか?等)