#914
summarized by : Yuta Nakamura
SceneCode: Monocular Dense Semantic Reconstruction Using Learned Encoded Scene Representations

どんな論文か?

自律走行システムのためのSLAM(自己位置推定と環境地図作成, Simultaneous Localization and Mapping)を実現させるための技術として,画像から深度推定とセマンティックセグメンテーションをend-to-endで行う手法を提案した論文。
placeholder

新規性

セマンティックセグメンテーションの既存手法を,深度推定も同時に行えるよう改良した。さらに,latent codeの初期化方法(ゼロで初期化した)やloss functionの設計を工夫することで,視点の変化に頑健なモデルを構築している。

結果

SceneNet RGB-D datasetなどに対して実験を行い,セグメンテーションのpixel accuracy, class accuracy, mIoUが既存手法よりも改善したほか,複数の視点に対してセグメンテーションやインスタンス認識の頑健性が確保されていることが示された。

その他(なぜ通ったか?等)