- …
- …
#347
summarized by : kota yoshida
どんな論文か?
表現によって言及された関連コンテンツを強調するlanguage-guided graph attention network(LGRAN)を提案し,オブジェクト間の関係をモデル化するために、画像のオブジェクト領域にわたって有向グラフを構築する.
新規性
以下の要素で構成されるLGRANを提案.
language-self attention module:近傍オブジェクトとの関係を記述.
language-guided graph attention module: 画像のオブジェクト上にグラフを構築し,言語表現に適応するオブジェクト表現を動的に学習.
matching module :オブジェクト,クラス内関係,クラス間関係の3つを加重合計.
結果
referring expressionのデータセット(RefCOCO、RefCOCO +、RefCOCOg)で実験を行い.提案されたアプローチの有用性を示した,また,本提案手法が,理解の決定を視覚的に説明可能であることも示した.
その他(なぜ通ったか?等)
- …
- …