HVPR: Hybrid Voxel-Point Representation for Single-Stage 3D Object Detection

#542

summarized by : Naoya Chiba

Jongyoun Noh, Sanghoon Lee, Bumsub Ham

どんな論文か？

三次元点群から物体検出をSingle Stageで行うためのネットワーク構造の提案．点群をボクセル化しセル単位で簡単なPointNet構造で特徴量を集約，ボクセル特徴量とする．さらに点群からPointNet++で点群特徴量を抽出する．これらと特徴量を記憶しておく特徴量を対応付けて抽出，2D画像に変換して物体認識を行う．

新規性

ボクセル特徴量と点群特徴量，さらにメモリしておく特徴量を設定し，少ない計算コストで高い空間解像度の特徴を抽出して2Dの特徴量マップに変換する．さらに2Dの特徴量を処理するネットワークでも，3Dにおける特徴量を陽に入力し空間的なまばらさを考慮することを期待したAttentionを設定，スケールに寄らない物体検出を図った．

結果

KITTIで評価し高い性能を達成，既存手法のなかでも比較的高速な推論を実現している．提案するモジュールによって性能が向上していることを確認した．

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．