- …
- …
#91
summarized by : Yue Qiu
どんな論文か?
Compositional VQAのためのTiered attention networkを提案した.提案のTiered reasoning手法が質問に応じて動的にobject level候補を選択し,それにより有効的にCandidate objectsからロバストなペアワイズ関係を構築できる.
新規性
提案のネットワークは複数のTRR unitsから構成し,TRR unitごとにroot attentionモジュール(物体レベルの重要度を決める)、root to leaf attention parsing module (候補物体を決める)、leaf attention (Relationレベルの重要度を決める)とMessage passingモジュール (すべての情報を整合).
結果
①既存のVisual Reasoningモジュールと匹敵するレベルのReasoning能力を持ちながら,計算コストが従来のモデルより小さい;②GQAデータセットでSOTAを達成;③CLEVR (追加のprogram supervisionを用いていない)、VQAv2で高い精度を達成.
その他(なぜ通ったか?等)
①リアル画像VQAデータセットとSimulationVQAデータセットの両方で同時に良い精度を得られた;②性能とRuntime両方優れている.
- …
- …