#600
summarized by : Naoya Chiba
ES6D: A Computation Efficient and Symmetry-Aware 6D Pose Regression Framework

どんな論文か?

単眼RGB-D画像から物体の位置・姿勢を推定する手法ES6Dの提案.対称性を考慮したロス関数を採用することで対称形状でも適切な姿勢推定を学習できる.RGBと三次元座標を2D CNNで処理した後,PointNetのようなGlobal Max-Poolingと1x1 Convolutionからなるネットワークで各点の特徴量を計算,並進・回転と信頼度を推定し信頼度の高い点を採用して位置・姿勢を推定.
placeholder

新規性

対称性を考慮した姿勢推定部分が特に新規.物体の原点を設定して並進を推定し,回転については対称性によって重なる点をグループ化することで対称な形状についてもうまくロスを計算する.回転対称性が離散的な場合でも連続な場合でもこのアプローチによって処理できる.グループ化した形状プリミティブと姿勢の間でロスを計算するための距離も合わせて提案している.

結果

YCB-VideoとT-LESSで評価,T-LESSの物体は対称性が高く難しい.提案法を用いることで対称性を考慮してうまく学習することができ,特に局所解に陥らず姿勢推定ができていることを確認した.

その他(なぜ通ったか?等)