#945
summarized by : Shuhei M Yoshida
STEP: Spatio-Temporal Progressive Learning for Video Action Detection

どんな論文か?

動画からの行動認識、特に行動している人物の位置を推定し追跡するspatio-temporal localizationに関する論文。
placeholder

新規性

提案領域を時間方向に拡張しつつ空間方向の位置推定の補正を行うSTEPというフレームワークを提案。拡張と補正の反復により漸進的に提案領域を構築する。

結果

UCF-101とAVAで評価。いずれも既存手法を上回る。ただし、今年のActivityNet Challengeで、既にSTEPを上回るものが多数。

その他(なぜ通ったか?等)