#308
summarized by : 福原吉博 (Yoshihiro Fukuhara)
Representation Learning via Global Temporal Alignment and Cycle-Consistency

どんな論文か?

同一種類の動画のフレーム間の対応をとる(Dynamic Time Warping)ことによる, 弱教師の表現学習の手法を提案(弱教師としているのは同一種類の動画を集めるためにラベルが必要だから).
placeholder

新規性

微分可能なDynamic Time Warping(DTW)の定式化の中で使用する, 微分可能なmin演算子として良い性質を持つsmoothMinを提案. また, DTWの非対称なコスト関数を定義し, 2つの動画の順番を入れ替えた結果が近くなるようなロス(global cycle consistency loss)を提案.

結果

ResNet50を使用した, FineGym101/290における評価実験でSoTAを達成(SpeedNet, TCN, SaL, D3TW, TCCと比較). また, Few-shotの設定でも既存手法を上回る精度を達成した.

その他(なぜ通ったか?等)

https://github.com/hadjisma/VideoAlignment