#701
summarized by : siida
Transfer Learning via Unsupervised Task Discovery for Visual Question Answering

どんな論文か?

Visual QAにおいて、out-of-vocabulary(OOV)問題について改善したモデルを提案する。
placeholder

新規性

訓練時のQAデータセットにはない答えを推論するための方法として以下の手順を踏む。(1)教師なし学習によりtaskを推論するモデルを訓練, (2)taskと画像情報のattentionからanswerを推論するモデルを訓練, (3)VQAに転移学習する。, 既存の方法とは違い、VQAのOOV問題に転移学習を用いている。

結果

OOV answerに対するVQA scoreの評価において、提案手法はStandard VQA[Antol+, ICCV-2015]のモデルを上回るスコアを示した。

その他(なぜ通ったか?等)

VQAのOOV問題に対し転移学習を活用した新規性と、教師なし学習・転移学習を組み合わせた上でVQAを行うという階層的な構造の希少性が評価されたのではないかと思われる。