- …
- …
#732
summarized by : siida
どんな論文か?
Visual QAにおいて、情報や質問を構造化するNeural Module Networks(NMN, [Andreas+, CVPR-2015])が提案されている。本論文はNMNの新たなモデルを提案する。
新規性
Scene Graphs[Johnson+, CVPR-2015]というグラフ構造によってオブジェクトの関係性を記述する手法をNMNに組み合わせた。
結果
CLEVRおよびCLEVR-CoGenT[Johnson+, CVPR-2017]において、100%のAccuracyを達成した。
その他(なぜ通ったか?等)
Visual QAにおけるアプローチはend-to-endなものが主流だが、それらは可視化が難しい。一方、提案手法ではグラフのattentionを見れば推論の過程を追うことができる点が優れている。
- …
- …