#326
summarized by : QIU YUE
Topological Planning With Transformers for Vision-and-Language Navigation

どんな論文か?

Topology graphを利用した2-stage Visual-Language Navigation (VLN)の手法の提案。ロボティクスで広く検討されている経路探索用のTopology graphをVLNのタスク導入することにより、VLNのUnknown環境においての適応性向上やAgentの移動制限の緩和などが実現できた。
placeholder

新規性

①手法的新規性:既存のVLNでは主にEnd-to-Endでを行い、特にUnknown環境において性能が大幅に落ちる。ここで、2-Stage手法により、よりロバストな経路プランニングを実現し、Unknown環境に対しての適応性を向上した。②既存の手法では、Agentが移動できる経路が限られている。提案の2-Stageフレームワークにより、Agentが探索の環境である程度自由に動ける。

結果

VLN-CEデータセットで評価実験を行った。提案モデルが有効的にNavigation mistakesを自己修正できる結果を示した。

その他(なぜ通ったか?等)