Weakly Supervised Semantic Segmentation by Pixel-to-Prototype Contrast

#24

summarized by : Anonymous

Ye Du; Zehua Fu; Qingjie Liu; Yunhong Wang

どんな論文か？

画像ごとのラベルから、弱教師ありセグメンテーションを行った。教師あり学習では、画像分類でのラベルとセグメンテーションでのラベルでモデルが注目する特徴が異なる。弱教師セグメンテーションの課題は、画像分類に有効な特徴や画像領域のみ注目してしまうこと。以下を仮定とした。 1)同じ画像は異なるviewでも一貫性の意味がある領域を持つ。 2)同じラベルを持つ画素同士は特徴空間で似た表現を持つ。

新規性

特徴空間で同じクラスに属する画素とクラス表現(prototype)は距離が近く、異なるクラスは距離が遠くなるように学習を行う。提案では、画素単位での予測ラベルとembedding、各クラスのprototypeを用いた対照学習(Cross-view Contrast)を行った。対象学習では元画像に空間変換を加えた画像を用意し、2つの画像間で予測ラベルもしくはprototypeを共有し学習を行った。

結果

従来のsotaモデルに対して本学習法を適用することで大幅に性能が向上した。可視化結果からもオブジェクトに注目していることが分かった。

その他（なぜ通ったか？等）

対照学習を使用し、従来のsotaモデル構造に変更を加えずに性能向上を達成したため採用されたと思う。 githubページ↓ https://github.com/usr922/wseg

このページで利用されている画像は論文から引用しています．