#788
summarized by : QIU YUE
Perception Matters: Detecting Perception Failures of VQA Models Using Metamorphic Testing

どんな論文か?

VQA手法のLow-level Perceptionを評価可能な仕組みMeta-VQAを提案。提案のMeta-VQAを用いていくつかの既存のSoTAなVQA手法でも実際にLow-level Perceptionにおいて認識の一致性が低いことを発見した。この発見が今後ほかのVQA手法を提案する時に重要な参考になる。また、VQA手法の性能の評価の一つ重要な分析ツールとしてMeta-VQAがかなり有用。
placeholder

新規性

①既存のVQA手法がいかにLow-level Perceptionできるかを評価可能にする仕組みMeta-VQAを提案。A.画像を分割し、それぞれのパーツで回答させて、回答を統計する;B.質問を更に分割し、各々のサブ質問を回答させる.のABの2つの仕組みにより既存のあらゆるVQA手法のPerception Consistencyを評価可能にした。②実験により既存のSOTA手法の問題も明示化した。

結果

提案のMetaVQA仕組みを用いて、いくつか複数の既存のSoTAなVQA手法を評価した結果、既存の手法が実際視覚と言語的なLow-level PerceptionにおいてのConsistencyに問題があることを発見した。この知見が、将来更にHigh-level reasoningモデルを構築するために重要。

その他(なぜ通ったか?等)