- …
- …
#848
summarized by : Ryota Natsume
どんな論文か?
Visual dialogを行うために必要な、dialog中のco-referenceを推定するタスクに関する手法を提案。(“Are they on or off”の”they”が画像中のどれか推定するタスク). 提案手法では、Recursive Visual Attention (RvA)と呼ばれる、新しいアテンションミカニズムを提案し、この問題を解決した
新規性
dialog agentが、dialogの履歴を見ることによって、co-reference推定の精度を向上させていく。RvAは、Infer module, Pair module, Att moduleの三つのモジュールによって構成されている
結果
VisDial V0.9, VisDial v1.9と呼ばれる大規模な実世界データセットで、SOTAを達成し、また、説明可能な再帰やアテンションマップの入手も可能である。
その他(なぜ通ったか?等)
- …
- …