#799
summarized by : Naoya Chiba
MonoRUn: Monocular 3D Object Detection by Reconstruction and Uncertainty Propagation

どんな論文か?

単眼RGB画像から物体の位置・姿勢推定をバウンディングボックスのみの教師で行う手法の提案.2Dで物体検出・特徴量抽出を行い,対応する領域について3Dに投影,3Dに再投影したときにもとの座標に戻ることを利用して学習する.このとき不確実性マップを推定,予測精度の高い点でPnPで解くことで信頼度として用いる姿勢の共分散を推定できるようにした.
placeholder

新規性

単眼RGB画像から物体の位置・姿勢推定をバウンディングボックスのみの教師で行う手法の提案.2Dで物体検出・特徴量抽出を行い,対応する領域について3Dに投影,3Dに再投影したときにもとの座標に戻ることを利用して学習する.このとき不確実性マップを推定,予測精度の高い点でPnPで解くことで信頼度として用いる姿勢の共分散を推定できるようにした.

結果

KITTI-Objectで学習・評価.深度を用いない既存手法と比較して優れた性能と計算時間を達成.さらに点群を教師信号として入れると高い推定性能を実現している.

その他(なぜ通ったか?等)