#347
summarized by : kota yoshida
Neighbourhood Watch: Referring Expression Comprehension via Language-Guided Graph Attention Networks

どんな論文か?

表現によって言及された関連コンテンツを強調するlanguage-guided graph attention network(LGRAN)を提案し,オブジェクト間の関係をモデル化するために、画像のオブジェクト領域にわたって有向グラフを構築する.
placeholder

新規性

以下の要素で構成されるLGRANを提案. language-self attention module:近傍オブジェクトとの関係を記述. language-guided graph attention module: 画像のオブジェクト上にグラフを構築し,言語表現に適応するオブジェクト表現を動的に学習. matching module :オブジェクト,クラス内関係,クラス間関係の3つを加重合計.

結果

referring expressionのデータセット(RefCOCO、RefCOCO +、RefCOCOg)で実験を行い.提案されたアプローチの有用性を示した,また,本提案手法が,理解の決定を視覚的に説明可能であることも示した.

その他(なぜ通ったか?等)