#505
summarized by : Naoya Chiba
DisARM: Displacement Aware Relation Module for 3D Detection

どんな論文か?

三次元点群からの物体検出における性能向上のためのモジュールDisARMの提案.単に局所点群から特徴量を計算して物体検出を行った場合にはシーンのコンテキストを利用しにくいことを指摘し,物体のアンカー間で相互に特徴量を参照するネットワーク構造を用いてコンテキストを利用した物体候補を生成するように学習する.
placeholder

新規性

物体検出にはコンテキスト情報の適切な抽出が必要であるという思想のもとにDisARMを設計・提案したことが新規.FPSでアンカーを選択した後に三次元空間での距離と特徴量空間での距離をそれぞれ利用して重み付けを行い,アンカー間での関係を記述した特徴量を計算,後段のBounding Boxの検出に利用する.

結果

主にVoteNetにモジュールとして追加してScanNetV2,SUN RGB-Dで検証.メモリ・計算時間にはそれほど影響がなく物体検出性能が大きく向上した.他のネットワークにも適用して検証し,いずれのケースでも性能向上に寄与することを確認.

その他(なぜ通ったか?等)