summarized by : Shintaro Yamamoto
A negative case analysis of visual grounding methods for VQA

概要

VQAモデルのバイアス除去のために、画像のgroundingを改善するアプローチが取られている。画像のgroundingが本当に役に立っているのかを検証した。
placeholder

新規性

画像中の回答に役に立たない領域や、ランダムに選択された領域をモデルに与えることで精度の変化が生じるかを実験した。

結果

答えに関係ない領域や、ランダムに選択された領域を用いてもモデルの性能は変化しないことが分かり、現在の手法ではvisual groundingがバイアス除去に寄与していないことが明らかになった。