#10
summarized by : Yue Qiu
Beyond the Nav-Graph: Vision-and-Language Navigation in Continuous Environments

どんな論文か?

従来のVLNタスクで選択できる視点とAgentの姿勢が離散的である.この研究で視点やAgentの姿勢などが学習するように設定され,もっとリアル環境と近いcontinuous environmentのVLNタスク・データセットを提案.複数の従来手法を実装した結果,従来のVLNタスク設定の問題点を複数指摘した(例:VLNで学習しVLN-CEでの汎化性能が低い).
placeholder

新規性

①従来のVLNタスク設定と比べ,提案のVLN-CEがknown environment topologyの仮定とperfect agent localizationの仮定を取り消し,もっとリアル環境に近い連続な観測設定をした.②従来のVLNタスクで得られたProgressがOverestimatedしている可能性があると指摘.

結果

従来の複数の手法を提案VLN-CEで実験し、VLN-CEがVLNよりChallengeである結果を示した.また,従来の手法をVLNで学習し、VLN-CEで遷移した結果が低かったことから,VLNの設定を問題視するべきと指摘.

その他(なぜ通ったか?等)

AI Habitatがあるから、Continous設定で実験できるようになった.Dhruvグループの研究.