#256
summarized by : Teppei Kurita
CRIS: CLIP-Driven Referring Image Segmentation

どんな論文か?

テキストの内容に従いセグメンテーションを行う。
placeholder

新規性

CLIPを直接利用すると画像レベルと画素レベルの予測との間に矛盾があるため好ましくない結果が得られてしまう。そこでCLIPモデルの知識を伝達するCRISというフレームワークを提案。

結果

従来手法に圧倒的な性能差をつけてSOTA。

その他(なぜ通ったか?等)