Improving RGB-D Point Cloud Registration by Learning Multi-Scale Local Linear Transformation

#129

summarized by : Naoya Chiba

Ziming Wang; Xiaoliang Huo; Zhenghao Chen; Jing Zhang; Lu Sheng; Dong Xu

どんな論文か？

RGB-D画像から得られる三次元点群のいち合わせにおいて，画像から得られる特徴量と幾何特徴量（深度画像を2D CNNで処理）をマルチスケールでうまく混合し扱うための手法GAVE (Geometry-Aware Visual Feature Extractor) を提案．UnsupervisedR&Rの枠組みで教師なしでも点群位置合わせの学習が可能．

新規性

画像特徴量と幾何特徴量をRGB画像と深度画像のそれぞれから抽出した後，深度画像から推定されるマップにしたがって画像特徴量を線形に結合し各点での出力特徴量とする．さらにこれをマルチスケールで行い足し合わせることでマルチスケールでの特徴量を混合する．得られた特徴量で対応推定を行い相対姿勢を出力する．

結果

ScanNetと3D Matchで検証し高い位置合わせ性能を達成．Ablation Studyとして提案したモジュールの要素を取り除き，各要素が性能向上に寄与していることを確認．

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．