- …
- …
#557
summarized by : QIU YUE
どんな論文か?
Spatial-temporal reasoning (ビデオの方ではなく、IQを図るルール探し問題みたいなタスク。例:RAPENデータセット)の新たなNeural Symbolic系のモデルの提案。Spatial-temporal reasoning が視覚的な要素の理解と異なる要素間の時系列関係性理解が必要。ここで、人間の考えるプロセスをまねした手法を提案し、既存手法より高い汎化性能を実現。
新規性
RAPENデータセットを扱う既存手法が高い精度を実現できたが、既存手法のモデルのReasoningプロセスの透明性が低く、人間のReasoningプロセスと離れている。ここで、Perception(視覚要素の理解)とReasoning(視覚要素間の関係の理解)を別々で行う手法を提案し、人間のReasoningプロセスと近い他、解釈性と汎化性能を向上した。
結果
既存のベンチマークRapenにおいて、提案のPrAE手法が既存手法より高い汎化性能を示した。
その他(なぜ通ったか?等)
- …
- …