Shape Prior Deformation for Categorical 6D Object Pose and Size Estimation

#171

summarized by : Naoya Chiba

Meng Tian, Marcelo H Ang Jr, Gim Hee Lee

どんな論文か？

RGB-D画像から物体の6DoF推定を行う手法の提案．事前に各カテゴリの物体についての変形情報を学習しておき，物体検出時には学習したモデルとシーン中の物体の間の変形の推定を経由して，姿勢とスケールを推定する．姿勢推定ではy軸回りの対称性を許容する．

新規性

複数のカテゴリの物体を同時に姿勢推定．はじめにオートエンコーダーで物体カテゴリごとに平均形状を示す潜在表現を計算しておく．その後入力された物体のRGB-D画像と各カテゴリの平均形状の間で各点のCorrespondence MatrixとDeformation Fieldを推定，対応付けから姿勢を推定する．

結果

レンダリングによって得られるCAMERAデータセットと実シーンのデータセットを組み合わせて学習・評価．Mask R-CNNでインスタンスを検出し，対応する領域を切り出して姿勢推定用のRGB-D画像を得る．既存手法より高精度かつほとんどのしきい値設定で既存手法より優れた姿勢推定ができた．

その他（なぜ通ったか？等）

スケールも合わせた物体の位置・姿勢推定手法は新規で，実応用上需要がある問題設定となっている． https://github.com/mentian/object-deformnet

このページで利用されている画像は論文から引用しています．