#714
summarized by : Seito Kasai
Large Scale Video Representation Learning via Relational Graph Clustering

どんな論文か?

動画における教師なし表現学習の研究。推薦システムのコールドスタート問題等で必要となるコンテンツベース検索に用いられる。
placeholder

新規性

・グラフクラスタリングを事前に用いてhard negativeを効率よくサンプリングし、metric learningの精度を向上させるGCMLを提案。 ・グラフクラスタリングの結果を分類にも使用し、これがさらに表現に効いている ・動画検索・動画分類(Sports-1M, Youtube-8M)においてstate-of-the-art

結果

・検索:NDCG@60, MAPにおいてCDMLを越える ・negativeの難しさを変更したablationで、効率の良いバッチサイズ等を検証

その他(なぜ通ったか?等)

・手法はかなりシンプルで、わかりやすい ・検証がしっかりしている(実験の組み方がうまい) ・一方でなぜ動画を使ったかは不明...実際にある問題について考えているため?