- …
- …
#169
summarized by : Godel
どんな論文か?
単眼カメラによるPanoptic Segmentationと,自己教師あり深度推定の2つのタスクを,リアルタイムで実行可能なマルチタスクフレームワークである「MGNet」を提案している.またそれらの推論結果から,インスタンス毎の意味的ラベルを持つ高密度の3D点群を生成することができる.
新規性
・Panoptic Segmentationと,自己教師あり深度推定の2つのタスクを一つのモデルとして提案.
・実時間で2つのタスクを推論可能なモデルを提案.
結果
・マルチタスク最適化により,シングルタスクと比較して,0.1PQおよび0.7RMSE向上
・ 1024×2048 Cityscapes : 精度55.7PQ &8.3RMSE,速度30 FPS 30%高速化
・384×1280 KITTI Eigen Split擬似ラベルのみで学習:精度 3.761RMSE,速度82 FPS
その他(なぜ通ったか?等)
ロボットビジョンに実用的に必要な,Panoptic Segmentationと深度推定を実時間で処理することが可能なモデルを提案した.
- …
- …