summarized by : ReiTamaru
Buyu Liu, Bingbing Zhuang, Samuel Schulter, Pan Ji, Manmohan Chandraker
動画を入力として、上からの視点で道路画像を予測して生成。
道路画像生成の従来研究では、車の検出やシーン同士の関係性などローカルな特徴しか考えていたかったが、この研究では動画のカメラモーションの影響を減らし、道路状況を理解するようなFeature Transform Moduleを提案。また、LSTMを用いて動画の長時間の情報を読み込み、SoTAを達成。
KITTIデータセットで実験を行い、SoTAを達成。COLMAPを用いてグローバルな情報を読み込むことで側道の再現に成功している。