#621
summarized by : Naoya Chiba
ZebraPose: Coarse To Fine Surface Encoding for 6DoF Object Pose Estimation

どんな論文か?

画像を入力として三次元物体の姿勢推定を行う手法ZebraPoseの提案.物体表面にマッピングされた階層的なバイナリ表現を用いて対応付けを行う.はじめに推定対象の三次元物体の表面に対してコードと対応したマップを生成しておき,2DのCNNで物体検出・領域マスク後に各画素の物体表面におけるコードを推定するように学習する.
placeholder

新規性

物体表面での座標系をバイナリコーディングで行い,2Dからのマッピングを学習するというアイデアが新規.三次元計測等で用いられてきたバイナリコーディングのアイデアから,空間的な階層(粗密)とコードの上位・下位が紐づくように設計,学習時に粗い対応から細かい対応まで段階的に学習するような重み付けを行う.

結果

LM-Oデータセット,YCB-Vデータセットで検証し,既存研究と比較して優れた姿勢推定を実現した.提案法のハイパーパラメータと構成要素についてのAblation Studyについても記述.

その他(なぜ通ったか?等)