PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection

#486

summarized by : Naoya Chiba

Shaoshuai Shi, Chaoxu Guo, Li Jiang, Zhe Wang, Jianping Shi, Xiaogang Wang, Hongsheng Li

どんな論文か？

三次元点群を入力とする物体検出手法PointVoxel-RCNN (PV-RCNN)を提案．点群をボクセル空間での3D CNNで畳み込みして特徴量を抽出，複数のスケールの情報を集約するため各スケールの特徴量を結合してからBEVに変換して2Dで物体検出し，対応する3DのBounding Boxを推定，近いKey Pointの特徴量を使って修正．

新規性

三次元点群からの物体検出において，畳み込みは3D CNNでマルチスケールな特徴量抽出，物体検出はBEV上の2D CNN，Refinementは点群（近傍Key Pointの特徴量）で行う．統合時にはKey PointからRoIに対してPoolingする．

結果

KITTIとWaymo Open Datasetで評価，大きく差をつけてSoTAを達成．Ablation Studyでは各特徴量・モジュールが有効であるかを検証している．

その他（なぜ通ったか？等）

いくつかの3Dデータを処理するネットワーク構造・データ構造について，それぞれのメリットが活きるように組み合わせ，最終的には良いスコアで物体検出を実現した．

このページで利用されている画像は論文から引用しています．