ELLIPSDF: Joint Object Pose and Shape Optimization With a Bi-Level Ellipsoid and Signed Distance Function Description

#153

summarized by : Naoya Chiba

Mo Shan, Qiaojun Feng, You-Yi Jau, Nikolay Atanasov

多視点RGB-D画像に対して2段階の階層からなるシーンで三次元形状をモデル化，最適化して形状を記述する．あらかじめ物体に対応したSDFを潜在変数と対応させるネットワークを学習しておき，物体ごとの姿勢と対応する潜在変数をオンラインで最適化してグローバルなシーンを推定する．

シーン全体の形状の推定を物体の詳細な形状と大まかな位置・形状・姿勢に分離し，細かな形状は事前にDualSDFのようなネットワークで学習しておき，オンラインではこれらの概形を楕円体で記述して粗い形状とする．この粗い形状を配置することでシーンを記述するように最適化する．

詳細な形状はShaneNetで学習しておき，ScanNetのシーンで学習・評価を行う．2段階のモデルを用いることでシーンを正確に認識できるようになっていることを示した．

このページで利用されている画像は論文から引用しています．