#56
summarized by : Shun.ishizaka
Asynchronous Interaction Aggregation for Action Detection

どんな論文か?

インタラクションの組み合わせにより行動を検出・認識する手法(Asynchronous Interaction Aggregation network: AIA)の提案.
placeholder

新規性

複数タイプのインタラクションを混ぜ込んで認識できるネットワークを構築した点が新しい.(1)複数タイプのインタラクションをモデル化し,統合するためのインタラクション集約構造; (2)計算量少なめで,超長期的なインタラクションを動的にモデル化する非同期メモリ更新アルゴリズム(AMU) この2点でネットワークは構成されている.

結果

AVAでaction localizationについてSoTA,3.7mAP向上(相対的に12.6%↑).UCF101-24,EPIC-KITCHENでsegmentレベルの認識も検証,こちらも高精度.

その他(なぜ通ったか?等)

Compositionalityに注目するアプローチの一種.映像理解や行動認識について,そもそもどういう形で行動が成立しているかを考えた論文が増えてきた印象がある. github → https://github.com/MVIG-SJTU/AlphAction