#118
summarized by : Chihiro Nakatani
GroupFormer: Group Activity Recognition With Clustered Spatial-Temporal Transformer

どんな論文か?

バレーボールデータセットでのグループ行動認識の研究. Group Transformer という機構により,選手の個人行動の時系列情報と空間的情報を同時に学習し,グループ行動認識のために良い特徴量を得る.特に,選手をクラスタリングした後にアテンションを取ることで,重要な選手関係性のみを抽出している.
placeholder

新規性

1. Clustered Spatial-Temporal Transfomer により個人行動とグループ行動の認識に良い特徴量を得た.2. 時系列情報と空間的情報の依存関係を統合するモデルを提案した.3. clustered attention 機構によりグループ行動認識に重要な選手関係を効率的に学習した.

結果

1. Volleyball Dataset と Collective Activity Dataset において SOTA を達成した. 2. Clustered Spatial-Temporal Transformer(CSTT)がグループ行動認識に有効なことを実験により示した.

その他(なぜ通ったか?等)

選手同士の関係性を考える上で,時系列情報と空間的情報を同時にうまく学習できるネットワークを考案している.