Video Object Segmentation Using Global and Instance Embedding Learning

#330

summarized by : Ryo Nakamura

Wenbin Ge, Xiankai Lu, Jianbing Shen

どんな論文か？

Video Object Segmentation(VOS)では，物体のクラスを識別と一貫した領域分割を行う課題がある．最新のVOSの手法は各クラスに対して２値セグメントを行っていた．本研究では，前景の物体をピクセル単位でセグメントするグローバルな埋め込みとクラスを区別し，それらを適切に関連付けするクラス特徴埋め込みの2つのタスクに分解することで高性能かつ素早いクラスマップの獲得を可能とした．

新規性

・グローバルのための特徴埋め込みとインスタンス予測のための特徴埋め込みに基づいて．VOSのための洞察付きの新しい解決方法の提案．・インスタンス間の時間的および空間的な埋め込み学習に組み込むことで，より正確なマスク境界を得ることができる・大規模なベンチマークデータを用いて，提案手法を徹底的に評価した．その結果，提案手法は，SoTAであった．

結果

難しいと言われているDAVISおよびYoutube VOSというデータセットでほとんどの結果において従来手法よりセグメンテーションの精度が上がり，インスタンスマスクを生成するスピードが向上した．

その他（なぜ通ったか？等）

今までにないVOSの枠組みで，高性能な結果を出せたことが採択につながったと思う．（工夫は非常にシンプル）

このページで利用されている画像は論文から引用しています．