#169
summarized by : Godel
MGNet: Monocular Geometric Scene Understanding for Autonomous Driving

どんな論文か?

単眼カメラによるPanoptic Segmentationと,自己教師あり深度推定の2つのタスクを,リアルタイムで実行可能なマルチタスクフレームワークである「MGNet」を提案している.またそれらの推論結果から,インスタンス毎の意味的ラベルを持つ高密度の3D点群を生成することができる.
placeholder

新規性

・Panoptic Segmentationと,自己教師あり深度推定の2つのタスクを一つのモデルとして提案. ・実時間で2つのタスクを推論可能なモデルを提案.

結果

・マルチタスク最適化により,シングルタスクと比較して,0.1PQおよび0.7RMSE向上 ・ 1024×2048 Cityscapes : 精度55.7PQ &8.3RMSE,速度30 FPS 30%高速化 ・384×1280 KITTI Eigen Split擬似ラベルのみで学習:精度 3.761RMSE,速度82 FPS

その他(なぜ通ったか?等)

ロボットビジョンに実用的に必要な,Panoptic Segmentationと深度推定を実時間で処理することが可能なモデルを提案した.