- …
- …
#486
summarized by : Naoya Chiba
どんな論文か?
三次元点群を入力とする物体検出手法PointVoxel-RCNN (PV-RCNN)を提案.点群をボクセル空間での3D CNNで畳み込みして特徴量を抽出,複数のスケールの情報を集約するため各スケールの特徴量を結合してからBEVに変換して2Dで物体検出し,対応する3DのBounding Boxを推定,近いKey Pointの特徴量を使って修正.
新規性
三次元点群からの物体検出において,畳み込みは3D CNNでマルチスケールな特徴量抽出,物体検出はBEV上の2D CNN,Refinementは点群(近傍Key Pointの特徴量)で行う.統合時にはKey PointからRoIに対してPoolingする.
結果
KITTIとWaymo Open Datasetで評価,大きく差をつけてSoTAを達成.Ablation Studyでは各特徴量・モジュールが有効であるかを検証している.
その他(なぜ通ったか?等)
いくつかの3Dデータを処理するネットワーク構造・データ構造について,それぞれのメリットが活きるように組み合わせ,最終的には良いスコアで物体検出を実現した.
- …
- …