#58
summarized by : SY
Contrast and Classify: Training Robust VQA Models

どんな論文か?

VQAの頑健性を向上させる手法を提案.Cross Entropyに加えてContrastive Lossを最適化することによって,質問文の多様性に対する頑健性を向上させる.
placeholder

新規性

Referenceとなる質問ー画像ペアに対して,答えが同じペアをpositive,異なるペアをnegativeデータとして扱うことで,contrastive lossを最適化する.

結果

VQA-Rephrasingsベンチマークを用いて評価し,Consensus Scoreが1.63%向上した.また,VQA2.0ではaccuracyが0.78%向上した.

その他(なぜ通ったか?等)

https://yashkant.github.io/projects/concat-vqa.html