- …
- …
#332
summarized by : QIUYUE
どんな論文か?
Visual-Language Navigation (VLN)の新たなタスク及びデータセットの提案。新規タスクでは物体とシーンだけを指定し、Agentがそれらの情報によりランダムスタートポイントから自己ナビを行う。また、提案タスクと既存タスクで使える新たなGraphベースなモデルも提案し、複数のデータセットにおいてSoTAを達成。
新規性
①新しいタスクの提案。既存のVLNタスクは指定したStartポイントからステップごとに指示に従って移動する。提案タスクではターゲットシーンと物体だけを指定して、ランダムスタートからナビゲートする。②提案のタスクのための新規データセットFAOを提案。③グラフ構造を融合したNavigationモデルを提案。
結果
提案のFAOデータセットと既存のベンチマークR2Rで提案のGBEモデルがSoTAを達成。また、Ablations実験によりFAOデータセットの質と必要性を示した。
その他(なぜ通ったか?等)
- …
- …