- …
- …
#46
summarized by : Yue Qiu
どんな論文か?
従来のVisual Navigation手法ではSpatial memoryを利用してシーンのSpatial情報を把握する.Agentの直接観測からのシーンの幾何構造理解を行ってこなかった.この研究でOccupancy予測を提案し,Agentの第一人称のRGB-D観測からvisible 領域のOccupancy状況を予測する.より速く空間の幾何情報を把握し,効率良くNavigationできる.
新規性
①Embodied AI系にSpatial 情報を含めたOccupation Mapの導入;②新しい第一人称のRGBD画像からOccupancyを予測するフレームワークを提案;③Occupancy予測をFusionした有効的なNavigationフレームワークを提案;④SOTAなNavigation精度を達成.
結果
①提案手法が第一人称視点とTop-downマップ設定で,Baselineより大幅に向上したOccupation Mapを生成できた;②NavigationタスクでGibsonとMatterport3DデータセットでSOTAを達成し,2020 Habitat PointNavチャレンジで優勝.
その他(なぜ通ったか?等)
Embodied 環境でNavigationする時に,環境に対しての詳細理解が重要.この研究で提案したOccupation Map構造が3次元的にSceneに対しての理解ができている.
- …
- …