#611
summarized by : Masaki Taniguchi
See More, Know More: Unsupervised Video Object Segmentation With Co-Attention Siamese Networks

どんな論文か?

Unsupervised Video Object Segmentation(映像中からメインの被写体をラベル無しで抽出するタスク。以下UVOS)に取り組んだ論文。既存の手法でよく使われる短いフレームからの情報ではノイズや被写体の変形などの影響でうまく主題抽出できていなかった。しかし、本論文ではCo-attentionと呼ばれるモジュールを使用することで映像全体から主題抽出できるようになった。
placeholder

新規性

フレーム間に共通して観測できる特徴を抽出できるCo-attentionモジュールと、それを用いたCOSNetを提案したこと。このCOSNetはUVOSに限らず、顕著性の推定やオプティカルフローの推定など他の動画タスクに対しても応用の可能性がある。

結果

DAVIS16、FBMS、Youtube-Objectsの3つのUVOSタスクのベンチマークでSoTAを達成。

その他(なぜ通ったか?等)