#732
summarized by : siida
Explainable and Explicit Visual Reasoning Over Scene Graphs

どんな論文か?

Visual QAにおいて、情報や質問を構造化するNeural Module Networks(NMN, [Andreas+, CVPR-2015])が提案されている。本論文はNMNの新たなモデルを提案する。
placeholder

新規性

Scene Graphs[Johnson+, CVPR-2015]というグラフ構造によってオブジェクトの関係性を記述する手法をNMNに組み合わせた。

結果

CLEVRおよびCLEVR-CoGenT[Johnson+, CVPR-2017]において、100%のAccuracyを達成した。

その他(なぜ通ったか?等)

Visual QAにおけるアプローチはend-to-endなものが主流だが、それらは可視化が難しい。一方、提案手法ではグラフのattentionを見れば推論の過程を追うことができる点が優れている。