#587
summarized by : Naoya Chiba
RfD-Net: Point Scene Understanding by Semantic Instance Reconstruction

どんな論文か?

三次元点群から物体表面形状を推定するネットワークの提案.初めに入力点群から物体を検出し入力シーン点群を物体ごとに分割した後,インスタンスごとの点群を入力としてLatent Vectorを計算,VAEのような構造を経由してサンプリング後空間中の各点についてOccupancyを推定するImplicit Functionでの形状表現によってメッシュを推定する.
placeholder

新規性

物体検出と表面形状再構成を同時に行う点が新規.物体検出時に得られる物体領域の特徴量を利用してOccupancyを推定するようにマルチタスクな学習を行っている.各ネットワークについても様々な工夫を導入しており,オブジェクトネスに従ったドロップアウト,検出後の回転・並進の補正,形状に対応するLatentへの確率的モデルの導入などが行われている.

結果

ScanNetv2とScan2CADで実験.物体検出,単一オブジェクトの三次元形状再構成,インスタンスの全周補完を行い,提案法のように物体検出と形状再構成を同時に学習するアプローチが優れることを示した.

その他(なぜ通ったか?等)