STEP: Spatio-Temporal Progressive Learning for Video Action Detection

#945

summarized by : Shuhei M Yoshida

Xitong Yang, Xiaodong Yang, Ming-Yu Liu, Fanyi Xiao, Larry S. Davis, Jan Kautz

動画からの行動認識、特に行動している人物の位置を推定し追跡するspatio-temporal localizationに関する論文。

提案領域を時間方向に拡張しつつ空間方向の位置推定の補正を行うSTEPというフレームワークを提案。拡張と補正の反復により漸進的に提案領域を構築する。

UCF-101とAVAで評価。いずれも既存手法を上回る。ただし、今年のActivityNet Challengeで、既にSTEPを上回るものが多数。

このページで利用されている画像は論文から引用しています．