#101
summarized by : Teppei Kurita
The Temporal Opportunist: Self-Supervised Multi-Frame Monocular Depth

どんな論文か?

単眼画像のシーケンスから3DシーンフローとDepthを自己教師で推定する。
placeholder

新規性

従来手法のデコーダ設計の限界を指摘し、学習が安定するようなsplitデコーダに変更し、また3Dシーンフローの時間的な一貫性を利用しConvLSTMを介して以前の推定値を伝搬させていることが技術的な新規性。

結果

SOTAかつ実行時間の高速化を達成。半教師の手法との性能差も縮めた。

その他(なぜ通ったか?等)

従来手法の解析を通して、その課題をネットワークの工夫で解決するという王道。高性能かつ軽量であるので実用的。 [Code] https://github.com/visinf/multi-mono-sf