#552
summarized by : neka-nat
Normalized Object Coordinate Space for Category-Level 6D Object Pose and Size Estimation

どんな論文か?

RGBD画像を用いて、学習およびテスト時においてCADモデルがない状態で6次元の姿勢を推定する手法。基準となる姿勢をカテゴリごとに正規化されたモデルによって表現し、カテゴリの推定と正規化されたモデルとの対応点を求めることによって6次元の推定を行っている。
placeholder

新規性

物体の6次元姿勢推定においては基本的にCADモデルが必要であったが、それが無い状態で推定するという新たな課題にチャレンジしている。ネットワークはMaskRCNNをベースにしており、クラスラベルとインスタンスマスク、正規化されたオブジェクトのマップをRGB画像から推定し、その2次元のマップと深度データから姿勢推定を行う。

結果

CADモデルが必要な従来手法(RGBのみ)との比較を行っており、本手法は深度データを用いているが、CADモデル無しで従来手法よりも精度が高い結果を示している。問題として、上の評価では2D射影したものに対して評価しており、今後は6次元の姿勢における精度向上が課題となっている。

その他(なぜ通ったか?等)