Pseudo RGB-D for Self-Improving Monocular SLAM and Depth Prediction

#203

summarized by : Naoya Chiba

Lokender Tiwari, Pan Ji, Quoc-Huy Tran, Bingbing Zhuang, Saket Anand , Manmohan Chandraker

どんな論文か？

RGB-D SLAMと単眼深度推定を組み合わせて自己教師学習する手法の提案．単眼画像によるSLAMではスケールドリフトが生じ，ロバスト性と精度に悪影響があった．一方単眼深度推定では遠い点での精度の悪さ・時間ウインドウが広い場合のロバスト性の悪化が問題となる．これらの手法を組み合わせて反復して学習させることで，欠点を補い推定性能が向上する．

新規性

RGB-D SLAMによる深度を単眼深度推定の教師として用い，単眼深度推定の出力をRGB-D SLAMに用いて学習することで自己教師での精度向上ができた．深度情報を仮想的なステレオ視差としてORB-SLAMに組み込み，カメラ姿勢と深度推定を行う．深度推定ははじめMonodepth2の学習済みモデルから始める．ベースラインを広くとった深度がSLAMから得られるのでこれも推定するように学習する．

結果

KITTIとTUM RGB-Dデータセットで学習・評価を行った．自己教師学習で単眼を用いる手法としてはSoTAを達成，他の問題設定（自己教師学習でステレオを用いる，深度を教師として用いるなど）と比較しても順当な精度であり，自己教師学習がうまく適用できる問題設定であることがわかる．

その他（なぜ通ったか？等）

既存の手法のメリット・デメリットを整理し，うまく組み合わせることで自己教師学習で精度が向上するような問題設定を設計した． https://lokender.github.io/self-improving-SLAM.html

このページで利用されている画像は論文から引用しています．