#4
summarized by : Shintaro Yamamoto
Seeing the Un-Scene: Learning Amodal Semantic Maps for Room Navigation

どんな論文か?

人間が空間を探索する際,キッチンはダイニングルームの近くにあるなど初めての環境であっても目的地がどこにあるか予測することができる.そこで,Vision-and-Language Navigationにおいて,家の中の部屋の配置を予測することで精度向上を図る.
placeholder

新規性

モデルの中間出力として,Amodal Semantic Mapsという家の中の部屋の配置を表現する特徴を獲得するモデルを構築した.目的地へのナビゲーションには,画像と目的地に関する情報に加え予測したAmodal Semantic Mapsを入力として考える.

結果

Matterport 3Dのデータを解析し,キッチンは隅にあることが多いなどレイアウトに規則性があることを確認.

その他(なぜ通ったか?等)