#289
summarized by : yusuke saito
KFNet: Learning Temporal Camera Relocalization Using Kalman Filtering

どんな論文か?

カメラリローカライゼーションにおいて、現在の時間的なリローカライゼーション手法は精度の点で最先端のOneShotな手法に劣っていた。既存のPoseNetベースの手法は、基本的には画像検索を介した近似的な姿勢推定に特化したものであり、精度の面でベースラインを超えることはできなかった。
placeholder

新規性

- シーン座標回帰問題を学習可能な方法で時間領域に拡張し、時間的に一貫した2D-3Dマッチングを実現した - 従来のカルマンフィルタを時系列画像上のピクセルレベルの状態推論を解決するリカレントCNNネットワーク(KFNet)に統合する

結果

KFNetによるリローカライゼーション精度、およびマッピング精度すべてのデータセットにおいてOneShotな手法よりも改善されている。また、モーションブラーフィルタを適用したテストでは、OneShotな手法では精度が低下したのに対し、KFNetでは精度が低下しなかった。

その他(なぜ通ったか?等)

カルマンフィルタをネットワークに組み込むことで、既存手法よりも精度を向上させつつ、モーションブラーが発生しても精度を保つことができる点が良い。