#391
summarized by : Akihiro FUJII
Actor-Context-Actor Relation Network for Spatio-Temporal Action Localization

どんな論文か?

人物の行動は、人物とコンテキストのペアだけでは推論できないことも多いため、人物-コンテキスト-人物の三者関係を明示的にモデルに取り込み、行動認識を行うACAR-Netを提案。ActivityNet Challenge 2020のAVA-Kineticsにおいて、他手法を大幅にうわまわり1位を獲得した。
placeholder

新規性

人物は検出領域のROI poolingを使って特徴を取得するが、コンテキストに関しては次空間の特徴量マップを直接使用する設計になっている。学習済みモデルを使うのとは異なり、事前に設定されたカテゴリに依存することなく柔軟な対応が可能になる。

結果

ActivityNet Challenge 2020のAVA-Kineticsアクションローカリゼーションタスクにおいて、我他の手法を大幅に上回る(+6.71mAP)1位を獲得

その他(なぜ通ったか?等)

https://github.com/Siyu-C/ACAR-Net