- …
- …
#56
summarized by : Shun.ishizaka
新規性
複数タイプのインタラクションを混ぜ込んで認識できるネットワークを構築した点が新しい.(1)複数タイプのインタラクションをモデル化し,統合するためのインタラクション集約構造; (2)計算量少なめで,超長期的なインタラクションを動的にモデル化する非同期メモリ更新アルゴリズム(AMU) この2点でネットワークは構成されている.
結果
AVAでaction localizationについてSoTA,3.7mAP向上(相対的に12.6%↑).UCF101-24,EPIC-KITCHENでsegmentレベルの認識も検証,こちらも高精度.
その他(なぜ通ったか?等)
Compositionalityに注目するアプローチの一種.映像理解や行動認識について,そもそもどういう形で行動が成立しているかを考えた論文が増えてきた印象がある.
github → https://github.com/MVIG-SJTU/AlphAction
- …
- …