#37
summarized by : Chihiro Nakatani(中谷千洋)
Hunting Group Clues with Transformers for Social Group Activity Recognition

どんな論文か?

複数人から構成される group activity や social group activity を認識する手法を提案する論文.人のバウンディングボックスに基づき heuristic にクロップした特徴からグループ行動を認識する従来手法の問題提起をしている.heuristic な処理で得た特徴はグループ行動とその構成員を認識するためには不十分と指摘している.
placeholder

新規性

transformer をベースにした新しいネットワークを提案. 個人行動認識ブランチとグループ行動認識ブランチの2つのブランチから構成されており,最終的にはグループ行動とその構成員も特定するネットワークになっている.

結果

group activity recogntion と social groun activity recognition の2つのデータセットで,他手法を上回るもしくは同等の性能を達成している.また,グループ行動の構成員を特定できているかどうかの評価もされている.

その他(なぜ通ったか?等)

単にグループ行動を認識するだけでなく,その構成員も特定するのは説明性の観点でも重要であるからなるほどと思った.他手法でその観点の議論はあまり見ないので,そこが通った理由かもしれない.