MGNet: Monocular Geometric Scene Understanding for Autonomous Driving

#169

summarized by : Godel

Markus Schon, Michael Buchholz, Klaus Dietmayer

どんな論文か？

単眼カメラによるPanoptic Segmentationと，自己教師あり深度推定の2つのタスクを，リアルタイムで実行可能なマルチタスクフレームワークである「MGNet」を提案している．またそれらの推論結果から，インスタンス毎の意味的ラベルを持つ高密度の3D点群を生成することができる．

新規性

・Panoptic Segmentationと，自己教師あり深度推定の2つのタスクを一つのモデルとして提案．・実時間で２つのタスクを推論可能なモデルを提案．

結果

・マルチタスク最適化により，シングルタスクと比較して，0.1PQおよび0.7RMSE向上・ 1024×2048 Cityscapes : 精度55.7PQ &8.3RMSE，速度30 FPS 30%高速化・384×1280 KITTI Eigen Split擬似ラベルのみで学習：精度 3.761RMSE，速度82 FPS

その他（なぜ通ったか？等）

ロボットビジョンに実用的に必要な，Panoptic Segmentationと深度推定を実時間で処理することが可能なモデルを提案した．

このページで利用されている画像は論文から引用しています．