#735
summarized by : 福沢栄治
Predicting Semantic Map Representations From Images Using Pyramid Occupancy Networks

どんな論文か?

自律型車両は一般に、非常に詳細な環境の鳥瞰図マップに依存しており、道路レイアウトなどのシーンの静的要素だけでなく、他の車や歩行者などの動的要素もキャプチャします。この論文で単一のエンドツーエンドの深層学習アーキテクチャを用いた、単眼画像から直接マップを推定するための簡単な統一されたアプローチを提案しました。
placeholder

新規性

画像ベースの特徴マップを鳥瞰図空間にマッピングして、新しい高密度な変形層を提案しました。更に、単眼画像から正確な鳥瞰図マップを予測するために、複数の画像スケールで動作する変形のピラミッドを含む、深い畳み込みニューラルネットワークアーキテクチャを設計しました。

結果

NuScenesとArgoverseのデータセットでいくつかの困難なベースラインに対して評価することにより、アプローチの有効性を示し、既存手法の最高のパフォーマンスと比較して、それぞれ9.1%と22.3%の相対的な改善を達成できることを示しています。

その他(なぜ通ったか?等)