#162
summarized by : Naoya Chiba
PR-GCN: A Deep Graph Convolutional Network With Point Refinement for 6D Pose Estimation

どんな論文か?

RGB-D画像から物体の位置・姿勢を推定する手法の提案.点群の欠損やノイズを補正するネットワークと画像特徴量・形状特徴量をあわせて用いるGCNによって各点ごとの位置・姿勢・信頼度を出力する.推論時には信頼度が最も高い点の位置・姿勢を最終的な推定結果とする.
placeholder

新規性

階層的な形状補完を行うネットワークを用いる点,テクスチャと幾何を両方入力した上kNNグラフ上でのEdgeConvを用いるGCNで特徴量を処理する点が新規.物体検出には画像上でのFaster RCNNを用い,対応うする物体領域のDepthから点群を構成する.点群の補完では複数解像度を出力し学習させることで概形を予測させる.

結果

LINEMOD,Occlusion LINEMOD,YCB-Videoデータセットで検証.既存手法と比較し提案法が優れた位置・姿勢推定を達成したことを示した.Ablation Studyとして提案手法のコンポーネントがパフォーマンス向上に寄与していることを検証している.

その他(なぜ通ったか?等)