Learning To Refactor Action and Co-Occurrence Features for Temporal Action Localization

#295

summarized by : Ryota Hashiguchi

Kun Xia; Le Wang; Sanping Zhou; Nanning Zheng; Wei Tang

TALの精度向上のためにスニペット特徴を行動特徴と共起特徴に分離した後，新しいスニペット特徴に変換する．共起特徴は行動特徴に対して支配的であるから，時間的定位が曖昧になるという問題点が存在する．そこで明示的に特徴を分離し，再構成することでTALのための良い特徴を得ることができる．

1つの動画からアノテーションされている行動が含まれるクリップとアノテーションされていない背景のクリップを持ってきて，特徴を分類することでロバストな定位が可能．

THUMOS14とActivityNet v1.3の実験より既存手法を凌駕する性能を達成した．可視化の結果から行動特徴と共起特徴を分離できていることが確認できた．

共起特徴の可視化の結果で一つの部分のみにヒートマップが強く出ている部分が気になった．Long Jumpクラスでは砂の部分だったり，競技場の客席の部分に共起特徴として出てほしいが結果ではいまいちである．

このページで利用されている画像は論文から引用しています．