#91
summarized by : Yue Qiu
TRRNet: Tiered Relation Reasoning for Compositional Visual Question Answering

どんな論文か?

Compositional VQAのためのTiered attention networkを提案した.提案のTiered reasoning手法が質問に応じて動的にobject level候補を選択し,それにより有効的にCandidate objectsからロバストなペアワイズ関係を構築できる.
placeholder

新規性

提案のネットワークは複数のTRR unitsから構成し,TRR unitごとにroot attentionモジュール(物体レベルの重要度を決める)、root to leaf attention parsing module (候補物体を決める)、leaf attention (Relationレベルの重要度を決める)とMessage passingモジュール (すべての情報を整合).

結果

①既存のVisual Reasoningモジュールと匹敵するレベルのReasoning能力を持ちながら,計算コストが従来のモデルより小さい;②GQAデータセットでSOTAを達成;③CLEVR (追加のprogram supervisionを用いていない)、VQAv2で高い精度を達成.

その他(なぜ通ったか?等)

①リアル画像VQAデータセットとSimulationVQAデータセットの両方で同時に良い精度を得られた;②性能とRuntime両方優れている.