#975
summarized by : Anonymous
Bi-Directional Relationship Inferring Network for Referring Image Segmentation

どんな論文か?

ReferringSegmentationの手法。画像のコンテキストに一致する言語特徴の収集と各言語コンテキストをベースに画像特徴の2つの位置の空間上の依存性をとらることで2つの特徴間の関係を考慮した特徴を収集。これをLSTMから抽出された言語特徴抽出した高レベルな特徴と低レベルな特徴に対して行う。そして得られたマルチレベルの情報からTopDownとBottomUpで選択的に合成する。
placeholder

新規性

従来のReferringSegmentation手法において、画像と言語間の相互の誘導が明確に特徴づけられていないことで、特徴空間内で言語と視覚のコンテキストの一貫性が弱まっていた問題を解決した。

結果

UNC, UNC+, Google-Ref, ReferItでSOTA

その他(なぜ通ったか?等)