#310
summarized by : QIU YUE
Found a Reason for me? Weakly-supervised Grounded Visual Question Answering using Capsules

どんな論文か?

Weakly supervised grounding VQAタスクとCapsule moduleを導入した手法を提案。VQAタスクにおいて、質問を回答する際の根拠を示すという解釈性におけるニーズがある。それに対して既存手法はVQA手法に検出などを導入し、質問回答に関わる物体領域を検出。この研究でもっとFlexibleなWeakly supervised groundingをVQAに導入した。
placeholder

新規性

①タスク設定の新規性、Weakly supervised groundingをVQAに導入し、解釈性やReasoningの向上に有益な方向。②提案タスクのために、CLEVRデータセットをベースとしたCLEVR_answersデータセットを提案。③Capsule moduleを導入したGrounding能力が高いモジュールを提案。

結果

提案のCapsule moduleを導入することで、既存の2つの手法Stacked NMNとMACのGrounding性能が大幅に向上できた。同時に、既存のVQA評価指標においてもComparable的な性能を得た。

その他(なぜ通ったか?等)