#295
summarized by : Ryota Hashiguchi
Learning To Refactor Action and Co-Occurrence Features for Temporal Action Localization

どんな論文か?

TALの精度向上のためにスニペット特徴を行動特徴と共起特徴に分離した後,新しいスニペット特徴に変換する.共起特徴は行動特徴に対して支配的であるから,時間的定位が曖昧になるという問題点が存在する.そこで明示的に特徴を分離し,再構成することでTALのための良い特徴を得ることができる.
placeholder

新規性

1つの動画からアノテーションされている行動が含まれるクリップとアノテーションされていない背景のクリップを持ってきて,特徴を分類することでロバストな定位が可能.

結果

THUMOS14とActivityNet v1.3の実験より既存手法を凌駕する性能を達成した.可視化の結果から行動特徴と共起特徴を分離できていることが確認できた.

その他(なぜ通ったか?等)

共起特徴の可視化の結果で一つの部分のみにヒートマップが強く出ている部分が気になった.Long Jumpクラスでは砂の部分だったり,競技場の客席の部分に共起特徴として出てほしいが結果ではいまいちである.