#322
summarized by : Jun Kimata
Fine-Grained Temporal Contrastive Learning for Weakly-Supervised Temporal Action Localization

どんな論文か?

Weakly Supervised Action Localizationをターゲットとし,既存手法において行われている.ビデオの各時間へのラベル付けをより正確にしている. 図のような形で2つの動画間でのアクションと背景のインスタンスを対照させることで,時間ごとの行動か背景化の分類をより正確にした. これを行うことによって,分類とローカライズのタスク間のギャップも緩和したらしい.
placeholder

新規性

fine-grained sequence distance(FSD)やLongest Common Subsequence (LCS)という2種類の手法を用いて対照学習を行い,動画の時間的な区別をより正確にしている.

結果

THUMOS’14とActivityNet1.3を用いた実験で最も良い性能が得られた.

その他(なぜ通ったか?等)

Githubのurl https:// github.com/ MengyuanChen21/CVPR2022-FTCL.