#484
summarized by : Higaki Yoshinari
MLCVNet: Multi-Level Context VoteNet for 3D Object Detection

どんな論文か?

点群の3D物体検出のSOTAのVoteNetを拡張し、異なるレベルのコンテクスト情報の抽出を組み合わせることで、3D物体検出の精度を向上した。従来は、物体間・背景との分離に課題があった。
placeholder

新規性

パッチ・物体・シーン全体の3つのレベルのコンテクスト情報を抽出するモジュール(patch-to-patch context module, object-to-object context module , global scene context module)を追加することにより、検出精度を向上する。このために、アテンション機構とマルチスケール特徴合成を用いる。

結果

VoteNetに対し、SUN RGB-DデータセットのmAPで2.1%向上、ScanNetV2のmAPで5.9%向上。patch-to-patch contextの追加の効果が最も大きい。

その他(なぜ通ったか?等)

コンテクスト情報の利用を点群データ処理に応用する新規性により、全てのクラスの検出精度においてSOTAを上回る明確な性能向上を検証した点が評価のポイントと考えられる。