DeepI2P: Image-to-Point Cloud Registration via Deep Classification

#191

summarized by : Naoya Chiba

Jiaxin Li, Gim Hee Lee

どんな論文か？

ハンドクラフトな特徴点検出や特徴量の記述を行わず，学習ベースで画像・点群間の位置合わせを行う．RGB画像と点群を入力し，各三次元点が視錐台内にあるかどうか，内側の場合にはカメラのどの領域で観測されたかを推定，この対応関係からカメラ姿勢を最適化ソルバーを用いて求めることで位置合わせを達成する．

新規性

画像と三次元点群の間で階層的にアテンションを行い，各三次元点がどの画像領域に対応しているかを学習するようにネットワークを設計，これをPointNet++に近いネットワーク構成にResNetによって得られる画像特徴量を差し込むようにアテンションすることで実現している．また，ネットワークの出力からカメラ姿勢を推定するための最適化問題も定式化した．

結果

Oxford RobotcarデータセットとKITTIデータセットで検証．既存手法より高精度なカメラ姿勢推定を実現．カメラ姿勢の最適化もPnP問題として特より提案する枠組みのほうが優れることを示した．

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．