#315
summarized by : Haruhi Shida
Image2Point: 3D Point-Cloud Understanding with 2D Image Pretrained Models

どんな論文か?

2次元モデルのアーキテクチャと重みを3次元点群理解に転送する可能性について,転送の実現性,転送の利点,転送がうまくいく理由を経験的に調査.その結果,ニューラルネットモデルの同じアーキテクチャと事前学習された重みを使って画像と点群の両方を理解できることを発見した.
placeholder

新規性

2次元画像モデルと点群モデルは異なるアーキテクチャで設計され,異なるタイプのデータで学習される,そのため画像から点群へ直接モデルを転移する試みは十分に検討されていない.そこで本研究ではfinetuned-image-pretrained models (FIP)を用いて,画像から点群へ事前学習済みモデルを転移させる手法を検討した.

結果

単に2D事前学習されたConvNetを変換し入力,出力,バッチ正規化層(FIP-IOまたはFIP-IO+BN)の最小限の微調整で,FIPは様々なトリックを採用した点群モデルの多くに勝る性能を達成.3D点群分類で非常に競争力のある性能を達成できることを示した.

その他(なぜ通ったか?等)

本研究は,画像事前学習が点群理解に有効であることを新たに示した.これは点群理解タスクにおいても既存の大規模データセットでの事前学習済みモデルを用いることができるため,点群理解のボトルネックに対する解決策の1つになりえる.