#205
summarized by : Naoya Chiba
Improving Monocular Depth Estimation by Leveraging Structural Awareness and Complementary Datasets

どんな論文か?

単眼画像からの深度推定手法の提案.空間構造を認識させることを意図して画像全体の特徴と空間的なAttentionをモジュールとして組み込む.また,深度が均一な領域で滑らかになるようなロスを導入.さらに深度推定に失敗しやすい例を収集しハードケースのデータセットを構築して,段階的にハードケースを混ぜることでカリキュラム学習を行うことで精度が向上した.
placeholder

新規性

全体の構造を認識させるGlobal Pooling Blockと画素ごとにAttentionを行うSpatial Attention Blockの導入,BarHu Lossの利用,均一な部分での滑らかさを要請するLossの導入,ハードケースデータセットによるカリキュラム学習の導入,サンプルペアを用いたRLを改良したGFRLの提案,エッジを認識して境界を明確化するLossの提案が新規.

結果

様々なハードケースを考慮して収集したHC Depth Datasetを構築し学習・評価に利用し優れた推定性能を達成.NYUDv2,TUM DatasetでもSoTA.

その他(なぜ通ったか?等)

多くの改良を施し,確実に単眼深度推定の性能を向上させた.