#893
summarized by : Katsuyuki Nakamura
Learning a Dynamic Map of Visual Appearance

どんな論文か?

空撮画像と地上画像のペアから地理アトリビュート (lush, warm, gloomyなど)を時空間推定する手法。30万枚の画像ペアからなるCross-View Time (DVT)データセットを構築。
placeholder

新規性

地理アトリビュートを大規模かつ時空間的に推定した点(大陸×24時間×12ヶ月レベル)

結果

Figure 6のようなDynamic visual attribute mapを生成できた。これによって3つのアプリをケーションを実現:(1)地上画像を入力として撮影地点を推定、(2)地上画像の検索、(3)メタデータ検証。先行手法がないため提案手法のAblationで定量評価を行っている。

その他(なぜ通ったか?等)

記述の甘さが見受けられるが、アプリケーションのインパクトが高く評価されたと考えられる。コード、データセットはここで公開予定。https://tsalem.github.io/DynamicMaps/