Understanding Road Layout From Videos as a Whole

#897

summarized by : ReiTamaru

Buyu Liu, Bingbing Zhuang, Samuel Schulter, Pan Ji, Manmohan Chandraker

動画を入力として、上からの視点で道路画像を予測して生成。

道路画像生成の従来研究では、車の検出やシーン同士の関係性などローカルな特徴しか考えていたかったが、この研究では動画のカメラモーションの影響を減らし、道路状況を理解するようなFeature Transform Moduleを提案。また、LSTMを用いて動画の長時間の情報を読み込み、SoTAを達成。

KITTIデータセットで実験を行い、SoTAを達成。COLMAPを用いてグローバルな情報を読み込むことで側道の再現に成功している。

このページで利用されている画像は論文から引用しています．