#530
summarized by : QIUYUE
RAVEN: A Dataset for Relational and Analogical Visual REasoNing

どんな論文か?

Visual Reasoningタスクに用いられる新たなデータセットRAVENの提案(RPMベースでvision, structural, relational, analogical reasoningなどの能力を評価).また,Dynamic Residual Tree (DRT)モジュール(木構造な計算グラフで計算を行える)を提案し,従来手法にDRTを取り入れることで大きな性能向上を得られる.
placeholder

新規性

提案のRAVENデータセットにvisionとreasoning間のセマンティックstructure representationがアノテーション付けられた.これによりStructure representation上のreasoning能力の評価ができる.

結果

RAVENデータセットにおいて,提案のDRT構造を用いて,ResNetベースな手法の精度を53.43%から59.56%まで向上させた.(vs Human精度84.41%)

その他(なぜ通ったか?等)

提案のデータセットは今までのVisual Reasoningデータセットで評価しにくいStructure的なanalogical reasoning能力を評価できる.Humanの精度と現状のモデルの精度に大きなギャップも存在し,将来的なVisual Reasoningを評価する上で重要なデータセットとして用いられる.