#421
summarized by : Takuma Yagi
Relational Action Forecasting

どんな論文か?

映像からの将来行動予測タスクに関する論文。Faster R-CNNベースの物体検出器を使用して映像中から動作者を検出・追跡し、将来の動作者の行動と位置を予測する。その際、動作者間の関係をグラフリカレントニューラルネット(GRNN)として記述する。
placeholder

新規性

行動予測問題にGRNNを適用したこと。物体検出ベースのアーキテクチャにより動作者間の関係性を捉えたこと。

結果

AVAおよびJ-HMDBにおいて将来の動作者の行動と位置を良く予測できることを実証。またJ-HMDBにおける早期行動認識についても最高性能。

その他(なぜ通ったか?等)

アイデアそのものは分かりやすく着実な性能向上がみられる。一方でablationや問題設定の解説が不十分でどのコンポーネントがどれだけ寄与しているのか等不明点が多い。またモデル自体は2以上の系列長の入力を許すが実験では1フレームしか入力していない(Figure 1にもそう書いてある)。