The Regretful Agent: Heuristic-Aided Navigation Through Progress Estimation

#853

summarized by : QIUYUE

Chih-Yao Ma, Zuxuan Wu, Ghassan AlRegib, Caiming Xiong, Zsolt Kira

どんな論文か？

Self-monitoring メカニズムを用いたVLN手法の提案．従来のビームサーチをベースとした手法は膨大な探索時間コストがかかる．提案手法では学習可能なprogress monitorを使用し，エージェントがprogressの評価値により，前の位置にロールバックするかどうかを決める．また，訪問した方向と関連なProgress Estimate値により次の行く方向を決めるメカニズムを用いる．

新規性

①VLNタスクをGraph Searchという視点から捉えている．②End-to-Endな過去履歴からRoll Backを行えるRegret Moduleの提案．③有効的に次の経路を決めるProgress Markerの提案．

結果

Room-to-Roomデータセットにおいて，従来のSOTAな手法と比べ，SR (success rate)を5%程度向上し，SPL (success rates normalized by the path length)を8%程度向上できた．

その他（なぜ通ったか？等）

提案のフレームワークがEnd-to-Endで行える．有効的に従来手法の問題点：同じ場所で繰り返しforth-and-back現象を防ぐことができた．

このページで利用されている画像は論文から引用しています．