#188
summarized by : rindybell
Lending Orientation to Neural Networks for Cross-View Geo-Localization

どんな論文か?

画像ベースの地理的位置推定は、異なる視点からの画像をマッチングさせるため、チャレンジングな問題である。 しかし、既存手法では、重要な手がかりである「方向の情報」を用いていなかった。 本論文では、画像の各ピクセルの「方向の情報」を符合する、siameseネットワークを提案する。 また、大規模な地理的位置推定用データセット、「CVACTデータ」を構築・公開する。
placeholder

新規性

1. 「方向の情報」の導入 各ピクセルごとに極座標を計算。 計算した極座標を、color-coded法を用いて2Dの方向mapに変換。元の入力画像に連結する。 連結した画像を7層のニューラルネットワークの入力とし、埋め込みベクトルを得る。 埋め込みベクトル間のトリプレットロスを最小化する。 2. 「CVACT」データ google mapを用いて構築。約130kの地表画像と衛星画像の組を持つ。

結果

CVUSAデータ: recall top 1%において、従来法、提案法はそれぞれ、91.54、93.19である。 recall top 1だと、18.80、31.71である。 CVACTデータ localizationの精度が、従来法、提案法それぞれ、約5%、約20%である。

その他(なぜ通ったか?等)