#848
summarized by : Ryota Natsume
Recursive Visual Attention in Visual Dialog

どんな論文か?

Visual dialogを行うために必要な、dialog中のco-referenceを推定するタスクに関する手法を提案。(“Are they on or off”の”they”が画像中のどれか推定するタスク). 提案手法では、Recursive Visual Attention (RvA)と呼ばれる、新しいアテンションミカニズムを提案し、この問題を解決した
placeholder

新規性

dialog agentが、dialogの履歴を見ることによって、co-reference推定の精度を向上させていく。RvAは、Infer module, Pair module, Att moduleの三つのモジュールによって構成されている

結果

VisDial V0.9, VisDial v1.9と呼ばれる大規模な実世界データセットで、SOTAを達成し、また、説明可能な再帰やアテンションマップの入手も可能である。

その他(なぜ通ったか?等)