#354
summarized by : Shuhei M Yoshida
Multi-Task Multi-Sensor Fusion for 3D Object Detection

どんな論文か?

マルチ・センサー入力に基づく3次元物体検知を高速に解く手法を提案する。
placeholder

新規性

(1) RGB画像とLiDARデータに基づき、3次元物体検知、2次元物体検知、地面推定、深さ推定のマルチタスク学習により、高精度な3次元物体検知モデルを学習する手法 (2) 推定した深さマップを用いて、RGBから抽出した特徴マップとLiDARから抽出した特徴マップをピクセルレベルでフュージョンするpoint-wise feature fusion

結果

KITTIベンチマークにおいて、2D, 3D, 鳥瞰検知の各タスクで、既存SOTAを上回る精度を達成。TOR4DでもSOTA。さらに、10 fpsの推論速度。

その他(なぜ通ったか?等)