Fine-Grained Temporal Contrastive Learning for Weakly-Supervised Temporal Action Localization

#322

summarized by : Jun Kimata

Junyu Gao; Mengyuan Chen; Changsheng Xu

どんな論文か？

Weakly Supervised Action Localizationをターゲットとし，既存手法において行われている．ビデオの各時間へのラベル付けをより正確にしている．図のような形で2つの動画間でのアクションと背景のインスタンスを対照させることで，時間ごとの行動か背景化の分類をより正確にした．これを行うことによって，分類とローカライズのタスク間のギャップも緩和したらしい．

新規性

fine-grained sequence distance（FSD）やLongest Common Subsequence (LCS)という2種類の手法を用いて対照学習を行い，動画の時間的な区別をより正確にしている．

結果

THUMOS’14とActivityNet1.3を用いた実験で最も良い性能が得られた．

その他（なぜ通ったか？等）

Githubのurl https:// github.com/ MengyuanChen21/CVPR2022-FTCL.

このページで利用されている画像は論文から引用しています．