#905
summarized by : Ryosuke Araki
PVN3D: A Deep Point-Wise 3D Keypoints Voting Network for 6DoF Pose Estimation

どんな論文か?

単一のRGB-D画像から6DoFの物体姿勢推定を行うデータ駆動型の手法を提案.ポーズ情報を回帰するのではなく,キーポイントを基づいたアプローチをとる.物体のキーポイントを検出し,最小二乗法で姿勢パラメタを推定するDeep Hough voting networkを提案.NWのモジュール内で,キーポイント,中心点,セマンティックラベルの各オフセットを推定し,各クラスでクラスタリングと投票を行う.
placeholder

新規性

新しいキーポイントベースの物体姿勢推定手法の提案.複数のデータセットでSOTAを達成.3Dキーポイントとセマンティックセグメンテーションを共同学習することで性能向上出来ることを示した.

結果

YCBデータセットに含まれるほとんどのアイテムでSOTAを達成した.また,LINEMODデータセットでは全ての物体のADD(S)メトリックが98%以上を達成.

その他(なぜ通ったか?等)

昨年のCVPRで発表されたPVNetよりも高性能な姿勢推定手法.LINEMODのADDメトリックに至っては,もはやほぼ100%の性能を達成している.