#235
summarized by : hiroki tsujimoto
Unsupervised Learning From Video With Deep Neural Embeddings

どんな論文か?

類似した動画は近く,似ていない動画は遠くなるような埋め込み表現を学習するvideo instance embedding (VIE)を提案.Embeddingのためのモデル構造とサンプリング方法に,5つの既存手法を用いて実験を行った.
placeholder

新規性

動画の埋め込み表現の獲得に,教師なし学習の枠組みを取り入れた点

結果

行動認識と静的な物体分類タスクに適用し,既存手法を上回る精度を達成.また,静的情報を捉える経路と動的情報を捉える経路の2つの経路をもつSlowfastにVIEを適用すると,最も高精度であったことから,動画処理に特化したネットワーク構造と教師なし埋め込み表現学習の組み合わせが有効であることを示した.

その他(なぜ通ったか?等)