#897
summarized by : ReiTamaru
Understanding Road Layout From Videos as a Whole

どんな論文か?

動画を入力として、上からの視点で道路画像を予測して生成。
placeholder

新規性

道路画像生成の従来研究では、車の検出やシーン同士の関係性などローカルな特徴しか考えていたかったが、この研究では動画のカメラモーションの影響を減らし、道路状況を理解するようなFeature Transform Moduleを提案。また、LSTMを用いて動画の長時間の情報を読み込み、SoTAを達成。

結果

KITTIデータセットで実験を行い、SoTAを達成。COLMAPを用いてグローバルな情報を読み込むことで側道の再現に成功している。

その他(なぜ通ったか?等)