#853
summarized by : QIUYUE
The Regretful Agent: Heuristic-Aided Navigation Through Progress Estimation

どんな論文か?

Self-monitoring メカニズムを用いたVLN手法の提案.従来のビームサーチをベースとした手法は膨大な探索時間コストがかかる.提案手法では学習可能なprogress monitorを使用し,エージェントがprogressの評価値により,前の位置にロールバックするかどうかを決める.また,訪問した方向と関連なProgress Estimate値により次の行く方向を決めるメカニズムを用いる.
placeholder

新規性

①VLNタスクをGraph Searchという視点から捉えている.②End-to-Endな過去履歴からRoll Backを行えるRegret Moduleの提案.③有効的に次の経路を決めるProgress Markerの提案.

結果

Room-to-Roomデータセットにおいて,従来のSOTAな手法と比べ,SR (success rate)を5%程度向上し,SPL (success rates normalized by the path length)を8%程度向上できた.

その他(なぜ通ったか?等)

提案のフレームワークがEnd-to-Endで行える.有効的に従来手法の問題点:同じ場所で繰り返しforth-and-back現象を防ぐことができた.