#798
summarized by : Shoji Sonoyama
Self-Supervised Monocular Trained Depth Estimation Using Self-Attention and Discrete Disparity Volume

どんな論文か?

単眼カメラ動画からself supervisedな学習でDepthを推定する問題設定。 Monodepth2をベースにself attentionとdiscrete disparity volumeを組み合わせた手法を提案した。
placeholder

新規性

単眼深度推定にself attentionを取り入れる方法とDDVをself-supervisedに拡張する方法を提案した。 self attentionは画像上で隣接していない同じDepthを持つ領域に対してattentionするような意図を持たせている。 加えて、DDVを用いることでロバストでシャープな視差とDepth推定値のconfidenceが得られる。

結果

KITTI 2015データセットとMake3Dデータセットを用いた評価にて、従来のSoTAであるMonodepth2を超える精度を達成した。

その他(なぜ通ったか?等)

KITTI 2015データセットとMake3Dデータセットを用いた評価にて、従来のSoTAであるMonodepth2を超える精度を達成した。 また、ablation studyにより提案手法で用いているself attentionが近い領域で精度改善に貢献していることを示した。