#613
summarized by : QIU YUE
Modular Interactive Video Object Segmentation: Interaction-to-Mask, Propagation and Difference-Aware Fusion

どんな論文か?

新たなinteractive Video Object Segmentation (iVOS)手法を提案。提案手法がユーザーのInteractionからマスクを生成するプロセスと修正されたマスクの結果を近くのフレームに反映するプロセスをDecoupledした。提案手法が高精度でVOSを行える同時に、ユーザーのInteractionコストも同時に減らせた。
placeholder

新規性

①iVOSタスクのための新たな手法を提案。既存手法が1-StageでiVOSを行い、そのため学習困難でありまた対応可能なユーザーInteractionタイプが限られれる。提案手法が2-Stageにより、異なるタイプのユーザーInteractionを最小限のモデル変更で対応可能にした。②このタスクのための新たなデータセットも提案した。

結果

既存のデータセットDAVISにおいてSoTAなセグメンテーション精度を達成し、更にユーザーのInteractionフレーム数を減らせた。また、異なるタイプのユーザーInteractionを対応可能。

その他(なぜ通ったか?等)