#122
summarized by : Yasuhide Miura
Image-Question-Answer Synergistic Network for Visual Dialog

どんな論文か?

画像、キャプション、対話の履歴が与えられたとき、与えられた質問にマッチする回答候補を選択する「Visual Dialog」の手法
placeholder

新規性

質問から回答候補を選択するone-stageの従来手法とは異なり、回答候補を荒くスコアリングしたあとに再度画像やテキストとの対応付けをして回答候補を選択するtwo-stage手法を採用している

結果

Visual Dialog v1.0を使用。評価指標としてDGG@k, NDGG@kを用いて評価したところ、単一手法/アンサンブル手法いずれでも従来手法を上回った

その他(なぜ通ったか?等)

Two-stage手法にするにあたり、1段階目の評価をどれくらい重要視するかのロス関数も独自に設計している部分