#346
summarized by : Jun Kimata
Contextualized Spatio-Temporal Contrastive Learning With Self-Supervision

どんな論文か?

自己教師を通して時空間的に細かい動画像表現を効率的に学習するContextualized Spatio-Temporal Contrastive Learning (ConST-CL) を提案した. ConST-CLでは,ソースからインスタンス,ターゲットからコンテキストの情報を得ている.更に分岐を行うことで,局所的な情報と全体的な情報の両方を得る. 学習した特徴表現で様々な下流タスクを行った.
placeholder

新規性

Contextualized Spatio-Temporal Contrastive Learningという動画における自己教師あり学習のための新たな手法を提案している点.

結果

Kinegtics400やUCF101,HMDB51,AVAなどのデータセットを用いた,行動認識や物体追跡,アクションローカライゼーションなど6種の下流タスクに対して適用して競争力のある性能が得られた.

その他(なぜ通ったか?等)

github https://github.com/tensorflow/models/tree/master/official/projects/const_cl