#556
summarized by : Naoya Chiba
DGECN: A Depth-Guided Edge Convolutional Network for End-to-End 6D Pose Estimation

どんな論文か?

単眼RGB画像から微分可能なPnPアルゴリズムとグラフ畳み込みネットワークを組み合わせて物体の姿勢推定を行う手法の提案.入力画像を2D CNNで処理し深度の推定とセマンティックラベルの推定,対応点の推定をしてからEdgeConvを行い物体姿勢を推定することでEnd-to-Endで学習できるネットワーク構成となっている.
placeholder

新規性

PnPを微分可能にし,6DoFの物体姿勢推定に利用した点が特に新規.一旦信頼度付きで深度推を行い,近傍グラフを用いたグラフ畳み込みを行って局所特徴量を計算,画像から得られている特徴量と統合してから,改めてグラフ畳み込みを用いて対応関係を集約し物体姿勢を推定する.

結果

Synthetic Sphere Dataset, YCB-V Dataset, LM-O Datasetで検証し高い姿勢推定性能を達成.さらに対応推定部分の既存手法への変更,PnP部分の既存手法への変更,各コンポーネントの有用性の検証をAblation Studyとして行っている.

その他(なぜ通ったか?等)