#437
summarized by : Takahiro Maeda
EPro-PnP: Generalized End-to-End Probabilistic Perspective-N-Points for Monocular Object Pose Estimation

どんな論文か?

argmin処理の不連続性を確率分布を導入することで緩和しEnd-to-End学習を可能にした.Perspective-n-Pointを用いた6次元姿勢推定の精度を向上した.categorical softmaxの連続空間版と言える.
placeholder

新規性

古典的なアルゴリズムで頻出するargmin処理は,機械学習モデル内部に組み込むと,不連続性により学習が不安定となる.これを緩和しEnd-to-End学習を可能とするEPro-PnP layerを提案した.

結果

6次元姿勢推定ベンチマーク,3次元物体検出ベンチマーク双方において,End-to-End学習ができなかった従来法の精度を大きく上回った.

その他(なぜ通ったか?等)

古典的なアルゴリズムで頻出するargmin処理に対する手法であり,応用可能性が大きい.Best student paperを受賞している. https://github.com/tjiiv-cprg/EPro-PnP