- …
- …
#631
summarized by : yusuke saito
どんな論文か?
目的は正確な表面再構成、効果記憶、効率的な計算、類似形状の一貫性、多様な形状カテゴリ間の一般化、深度カメラ観測からの推論を可能にする3次元形状表現を学習する。3次元メッシュやポーズ付きの奥行き画像から、空間を分解する三次元形状表現を行うための、局所的な深層暗黙関数(Local Deep Implicit Functions)を推論するネットワークを提案。
新規性
- Deep IFを用いて、Structured IFによって予測されたガウス関数に対する残差である局所関数を予測することを提案。各形状要素内の全体的な形状ではなく、微細な形状のみを予測する。
- 各予測された形状要素内の入力のpoint cloudを収集し,PointNetでエンコードすることで、空間の SIF分解を使用することを提案。
結果
ShapeNetデータセット、3D-R2N2の訓練分割とテスト分割を使用、OccNetと比較。
- ネットワークパラメータを1%以下に抑えつつ、10.3ポイント高い表面再構成精度(F値)を実現
- 多様な形状に対し、一貫性を持たせた構造化された3次元表現を生成しつつ、17.8ポイントの向上
- 効率性では、最大パラメータでのデコーダはOccNetの0.004倍のサイズ、F値は1.13 倍向上
その他(なぜ通ったか?等)
PointCloud(例えば、RGB-D)の転送は大きなコストがかかる。そのような大きくなりがちな3D形状データのエンコード・デコードをF値90を超える形で復元可能にし、現実のアプリケーションシーンに一歩近づけた点。
- …
- …