#413
summarized by : 角田良太朗
OnePose: One-Shot Object Pose Estimation Without CAD Models

どんな論文か?

6dof pose estimationにおいて従来はCADモデル既知の上でinstance/category毎の検出しかできないものが大半であり、本論文ではSfMベースの手法に立ち戻ることでoneshotのポーズ推論を可能にする。
placeholder

新規性

事前にtracking対象の物体を写したビデオからSfMによりsparse点群を特徴量込みで作成し、推論時はクエリ画像の2D特徴量を直接graph attention networkにより3D点群とマッチングさせ、そこからPnPによりカメラポーズを導出する。2D-3Dの対応を取ることで従来のSfMのような2D-2Dマッチングを経由せず高速化しているのがポイント。

結果

HLoc(SuperPoint&SuperGlue)およびinstance/category specificな手法と比べて精度を上回ることに加えてリアルタイムで動作可能。

その他(なぜ通ったか?等)

かなり汎用性の高い手法に思われる。 https://zju3dv.github.io/onepose/