#48
summarized by : Shoji Sonoyama
3D Packing for Self-Supervised Monocular Depth Estimation

どんな論文か?

単眼カメラの動画像から視差画像とカメラ姿勢を推定する問題設定。 本論文では上記の問題設定の中でスケールを復元するために自動車の車速を入力に追加している。
placeholder

新規性

1. Space2Depth演算により、情報の損失を抑え高精度なDepthを推定するPackNetの提案。 2. 車速を用いてスケールを復元するVesosity Super Vision lossの提案。 3. 200m遠方までのDepthを記録した新しいベンチマークであるDense Depth for Automated Driving(DDAD)の構築と公開。

結果

KITTI, nuScene, CityScape, DDADを用いて既存手法と性能を比較し、既存手法よりも高い性能を達成した。 また、遠方においても非常にきれいな点群が生成できている。 本論文の実装はhttps://github.com/tri-ml/packnet-sfmで公開されており、Titan V100を用いて60ms以下で推論が可能。

その他(なぜ通ったか?等)

車速を用いたスケールの復元は既存に無いアイデア。精度の高さと推論速度の速さにより実応用に向けて一歩近づいている。加えて新しいベンチマークの公開により今後の本分野の発展に大きく貢献されると考えられる。