See More, Know More: Unsupervised Video Object Segmentation With Co-Attention Siamese Networks

#611

summarized by : Masaki Taniguchi

Xiankai Lu, Wenguan Wang, Chao Ma, Jianbing Shen, Ling Shao, Fatih Porikli

どんな論文か？

Unsupervised Video Object Segmentation（映像中からメインの被写体をラベル無しで抽出するタスク。以下UVOS）に取り組んだ論文。既存の手法でよく使われる短いフレームからの情報ではノイズや被写体の変形などの影響でうまく主題抽出できていなかった。しかし、本論文ではCo-attentionと呼ばれるモジュールを使用することで映像全体から主題抽出できるようになった。

新規性

フレーム間に共通して観測できる特徴を抽出できるCo-attentionモジュールと、それを用いたCOSNetを提案したこと。このCOSNetはUVOSに限らず、顕著性の推定やオプティカルフローの推定など他の動画タスクに対しても応用の可能性がある。

結果

DAVIS16、FBMS、Youtube-Objectsの3つのUVOSタスクのベンチマークでSoTAを達成。

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．