Learning Efficient Multi-agent Cooperative Visual Exploration

#320

summarized by : Shingo Nakazawa

Chao Yu; Xinyi Yang; Jiaxuan Gao; Huazhong Yang; Yu Wang; Yi Wu

どんな論文か？

例えばエージェントがある住宅内をマッピングする際にいかに効率よく全ての部屋を調査できるかに挑戦するような視覚探索分野の仕事。本論文はTransformer&強化学習をベースとしたモデル Multi-Agent Active Neural SLAM: MAANS を開発、任意の数のエージェントを協調させての環境のマッピングに成功した。

新規性

本分野の過去の仕事はエージェント数の増減が一般化できておらず、1エージェントで複雑なタスク、あるいは決まった数のエージェントで簡単なタスクを解くに限られていた。本論文では図に示したMAANSが開発され、複数のエージェント間の情報を統合した空間認識が可能となった。MAANSではエージェント数を任意に拡張可能であり、加えて各エージェントが通るべき効率の良い道筋を出力できる。

結果

フォトリアリスティックな3DシミュレータHabitatにおいて、2エージェント時の探索で競合手法 (Voronoi) に比べて約8%の探索ステップを削減 (探索範囲の重なり率はSoTA未到達)。また、2エージェントで学習したモデルを3あるいは4エージェントのタスクに適用しても提案手法はSoTAに匹敵する精度を出せた。

その他（なぜ通ったか？等）

本サマリでは論文のイントロでの表現に倣ったが、競合手法と複数エージェント時のスコアはほぼ変わらないので、本論文が「解ける課題の難易度が上がった」というものではない。エージェント数を先に決めなくても良い、一般化できるという点が評価されているのだろう。コードや発表資料、デモ動画がこちらで公開されている → https://sites.google.com/view/maans

このページで利用されている画像は論文から引用しています．