#483
summarized by : Higaki Yoshinari
HVNet: Hybrid Voxel Network for LiDAR Based 3D Object Detection

どんな論文か?

車載用途でLiDAR点群のみを入力とした物体検出のタスクにおいて、点群の新しいマルチスケール特徴量の利用により、精度を維持した高速化を達成。
placeholder

新規性

(1)3DのLiDAR点群を2Dの疑似画像特徴に射影 (2)従来のvoxel feature encoder (VFE)を拡張し、x,y方向のみマルチスケールでボクセル化し、スケールの分だけ特徴量のチャネル数を増やす (3)クラス別にDetection Headを設ける

結果

KITTIデータセットの3D detection(BEV)評価において、SOTAのSTDの12.5Hzに対し、同等の(一部のクラスでは上回る)精度で31Hzの処理速度。

その他(なぜ通ったか?等)

2D画像の特徴量のマルチスケール化のアプローチを、3Dデータである点群に対し適用できるようにした独自のアプローチで、SOTA同等以上の精度と、大幅な速度向上を検証した点が評価のポイントと考えられる。