#144
summarized by : Shintaro Yamamoto
Domain-Robust VQA With Diverse Datasets and Methods but No Target Labels

どんな論文か?

VQAにおけるdomain adaptationを分析した研究.通常の画像に対するタスクと異なり,複数のモダリティの情報を入力することやシステムが多段階になるため,VQAではドメインシフトの影響が大きいと考えられる.そこで,VQAにおけるデータセットのドメインの違いについて網羅的に調査した.
placeholder

新規性

既存のVQAデータセットはどのような点が異なるか,データセットのどのような違いが一般化に影響を与えるか,どのdomain adaptation手法がVQAにおいて効果的であるかなど,VQAにおけるdomain adaptationを検討するために重要な要素を実験的に検証した点.

結果

9種類のデータセットを比較し,画像と言語両方にデータセット間の違いがあることなどを明らかにした.手法に関しては,neuro-symbolic, compositional modelsがドメインシフトに頑健であることを確認した.

その他(なぜ通ったか?等)

ポスター:http://people.cs.pitt.edu/~mzhang/domain-robust-vqa/poster.pdf