#48
summarized by : 日坂 幸次
Pyramid Point Cloud Transformer for Large-Scale Place Recognition

どんな論文か?

近年、深層学習を用いた点群記述子は、場所の認識タスクにおいて素晴らしい結果を達成しています。 しかし、点群のスパース性のために、点群の識別可能な局所的特徴をどのように抽出して 効率的に大域的な記述子を形成する方法は、依然として困難な問題である。 本論文では、効率的な検索のために点群から差別的な大域記述子を学習するために、ピラミッド型点群変換ネットワーク(PPT-Net)を提案する。

新規性

具体的には、まず、点群の異なるk-NN近傍点の空間的関係を適応的に学習するピラミッドポイント変換モジュールを開発し、点群の識別的な局所特徴を抽出するために、グループ化された自己注意を提案する。 識別性の高い大域記述子を得るために、点群のマルチスケール特徴マップを大域記述子に集約するためのピラミッド型VLADモジュールを構築する。

結果

オックスフォード大学のデータセットと3つの社内データセットを用いた実験の結果、本手法が点群ベースの場所認識タスクにおいて最先端の技術を達成することが示された。 コードは、https://github.com/fpthink/PPT-Net。

その他(なぜ通ったか?等)