#720
summarized by : siida
Visual Query Answering by Entity-Attribute Graph Matching and Reasoning

どんな論文か?

Visual Query Answering(原文ママ)において、end-to-endなアプローチとは異なる手法を提案する。
placeholder

新規性

先行研究ではDNNを用いた手法が支配的だが、本論文ではDNNの代わりに以下のようなグラフを用いる, (1)Naive Bayseによって人の役割を推論するinference graph, (2) 自然言語と画像から生成されるentity-attribute graph

結果

提案手法はDNNを用いた手法(LSTM+CNN[Antol+, ICCV-2015])よりも優れたAccyracyを挙げた。

その他(なぜ通ったか?等)

VQAでDNNを用いない手法を使ってLSTM+CNNのモデルよりも優れた成果を挙げたことが重要である。ただし本文中のVisual Query AnsweringはVisual Question Answering(VQA)のことかと思われ、そうであるならVQAの比較対象が少々古すぎるところが気になる