#103
summarized by : Yue Qiu
RTM3D: Real-time Monocular 3D Detection from Object Keypoints for Autonomous Driving

どんな論文か?

従来の3D detection手法は3D BBOXから2D BBOXまで射影する場合のConstraintを用いる.2D BBOXが4つのエッジしかないので,2D detectorの精度が大きく3D検出に影響する.この論文でエッジではなく3D BBOXのキーポイントを射影し,3D,2D射影の幾何関係から3次元検出を行う.ノイズが入っていてもキーポイントベースなのでロバストかつ高速でで検出を行える.
placeholder

新規性

①3次元検出問題をキーポイント検出問題としてformulateできた.従来のFormulationより高効率的かつ高精度で3次元検出を行える.②新しいone-stage, multi-scale3次元キーポイント検出手法を提案;③priorと3次元物体情報をジョイントで最適化できるEnergy関数を提案;④KITTIで初めての単眼画像からリアルタイムで3次元検出の手法.

結果

①提案手法を実装するのに,追加のAnnotation情報が必要なし;②初めてのReal-timeで(FPS > 24)走れるSingle image 3D 検出手法;③KITTIでSOTAなパフォーマンスを達成.

その他(なぜ通ったか?等)

Runtimeと精度両方良かった;Additional学習データが必要としない.