#440
summarized by : Naoya Chiba
End-to-End Learning Local Multi-View Descriptors for 3D Point Clouds

どんな論文か?

三次元点群の位置合わせのためのLocal Descriptorを提案.微分可能レンダラーを用いてMulti-ViewなDepthのパッチ画像を生成して2D CNNで特徴マップを計算.Soft-view Pooling(Softmaxを用いたView Pooling)を行い特徴マップを統合してからMLPで特徴量に変換.Triplet Lossで学習する.
placeholder

新規性

微分可能レンダラーで視点位置を学習可能パラメータとし,点群位置合わせに適した視点を自動的に獲得するようにした.また,View-poolingに3D ConvとSoftmaxを用いることで全画像に勾配が伝播するため,学習が進みやすくなることを期待.

結果

3D Match Datasetで検証しSoTAを達成.3D Matchほどではないが,近年の手法のなかでは比較的高速に推論できる.ETH benchmarkでも比較的良好な推定ができている.Ablation Studyについても記述しており,パラメータを変更した場合の評価を実施.

その他(なぜ通ったか?等)

微分可能レンダラーによるMulti-view CNNを点群位置合わせに用いるアイデアが面白い.導入したSoft-view Poolingも分かりやすいアイデアで,性能も良好.