- …
- …
#145
summarized by : Shintaro Yamamoto
どんな論文か?
現存のVQAデータセットは、画像に対する質問の数が限られているという問題がある。データセット中の画像と質問ペアを用いるのではなく、Teaching Assistant(TA)が出題する問題を用いて学習する手法を提案する。
新規性
学習用の問題を出題するTA及び質問に答える2体のエージェント(Student)を考える。最初のフェーズでは、TAは学習に最も効果的な問題を出題し、エージェントは互いの答えが意味的に類似するように学習。次に実際のデータセットを用いて学習。2つのフェーズを繰り返して学習を進める。
結果
VQA-v2における精度向上を確認。実験結果では、質問タイプ別の精度比較やTAが作成した問題についても載せられている。
その他(なぜ通ったか?等)
実際に人が学習する過程をモデル化されているのが面白い
- …
- …