#486
summarized by : Naoya Chiba
PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection

どんな論文か?

三次元点群を入力とする物体検出手法PointVoxel-RCNN (PV-RCNN)を提案.点群をボクセル空間での3D CNNで畳み込みして特徴量を抽出,複数のスケールの情報を集約するため各スケールの特徴量を結合してからBEVに変換して2Dで物体検出し,対応する3DのBounding Boxを推定,近いKey Pointの特徴量を使って修正.
placeholder

新規性

三次元点群からの物体検出において,畳み込みは3D CNNでマルチスケールな特徴量抽出,物体検出はBEV上の2D CNN,Refinementは点群(近傍Key Pointの特徴量)で行う.統合時にはKey PointからRoIに対してPoolingする.

結果

KITTIとWaymo Open Datasetで評価,大きく差をつけてSoTAを達成.Ablation Studyでは各特徴量・モジュールが有効であるかを検証している.

その他(なぜ通ったか?等)

いくつかの3Dデータを処理するネットワーク構造・データ構造について,それぞれのメリットが活きるように組み合わせ,最終的には良いスコアで物体検出を実現した.