#227
summarized by : Hideki Tsunashima
DenseFusion: 6D Object Pose Estimation by Iterative Dense Fusion

どんな論文か?

入力データとしてRGB画像、点群を利用し、RGB画像には物体検知を掛けた後にCNNを通し、物体の色情報を抽出。 点群はPointNetを通し幾何構造を抽出して色情報との二つの情報を結合して物体の回転、移動、信頼度を求めることで高速かつ、オクルージョン(物体の被り)に頑健になる手法を提案。 提案手法にはピクセルごとの特徴を結合するものと幾何構造の抽出部分をイテラティブにした二つを提案。
placeholder

新規性

色情報と深度情報を結合することで6D物体姿勢推定を行うことを可能にした点と点群から幾何情報を抽出する際にイテラティブに幾何情報を洗練していく手法を提案した点。

結果

YCB-VideoとLineMODにてSOTAを達成。 また、既存のSOTA手法であるICP refinementを行った後のPoseCNNの結果よりも高い精度を出した上、200倍の高速化に成功

その他(なぜ通ったか?等)

6D物体姿勢推定はロボットの制御においては重要な項目であり、アルゴリズムの速度と精度が両立出来ることが重要である。 その両者を本論文は達成するだけでなく、色情報と深度情報を結合する6D物体姿勢推定において有用な手法を提案したことから通ったと考えられる。