#145
summarized by : Shintaro Yamamoto
TA-Student VQA: Multi-Agents Training by Self-Questioning

どんな論文か?

現存のVQAデータセットは、画像に対する質問の数が限られているという問題がある。データセット中の画像と質問ペアを用いるのではなく、Teaching Assistant(TA)が出題する問題を用いて学習する手法を提案する。
placeholder

新規性

学習用の問題を出題するTA及び質問に答える2体のエージェント(Student)を考える。最初のフェーズでは、TAは学習に最も効果的な問題を出題し、エージェントは互いの答えが意味的に類似するように学習。次に実際のデータセットを用いて学習。2つのフェーズを繰り返して学習を進める。

結果

VQA-v2における精度向上を確認。実験結果では、質問タイプ別の精度比較やTAが作成した問題についても載せられている。

その他(なぜ通ったか?等)

実際に人が学習する過程をモデル化されているのが面白い