#81
summarized by : Komiki Maruyama
Learning Temporal Co-Attention Models for Unsupervised Video Action Localization

どんな論文か?

全体のアクションのクラス数だけ知っているという設定で教師なしでTemporal Action Localization(TAL)を行う研究.クラスタリング+ローカリゼーションの2ステップの手法を提案.
placeholder

新規性

教師なしでTALを行うことが他にない.クラス固有のアテンションに基づく動画特徴,クラスによらないアテンションに基づく動画特徴を生成することでクラスタリングを行う.弱教師ありの設定にも応用することができる.

結果

THUMOS14,ActivityNet1.2の両方で,弱教師あり設定では,既存の弱教師TAL手法よりも高い性能である.教師なし設定でも,既存の弱教師TALモデルに匹敵する性能である.

その他(なぜ通ったか?等)

教師なしTALの最初の提案である.