#131
summarized by : Shoji Sonoyama
BiFuse: Monocular 360 Depth Estimation via Bi-Projection Fusion

どんな論文か?

360°カメラの画像からDepth画像を推定する問題設定。 従来用いられていた、equirectangular projectionは完全に展開できるが歪みが大きい。cubemap projectionは歪みが少ないが視野の一部が欠損する。 人間の目を模して、これらの投影法を融合させるアプローチを提案する。
placeholder

新規性

2つ投影法を融合させた2 branch networkと2つのネットワークで情報を相互伝達するためのFusion Blockの提案。 新しいpadding方法であるspherical paddingの提案。

結果

Martterport3D等のデータセットSoTAの推定精度を達成。プロジェクトページがあり、実装が公開されている。https://fuenwang.ml/project/bifuse/

その他(なぜ通ったか?等)

推定精度でSoTAを達成。加えて、abblation studyで提案手法のsheprical paddingの有効性を示している。人の目の仕組み基づいたアプローチも興味深い。