Lending Orientation to Neural Networks for Cross-View Geo-Localization

#188

summarized by : rindybell

Liu Liu, Hongdong Li

どんな論文か？

画像ベースの地理的位置推定は、異なる視点からの画像をマッチングさせるため、チャレンジングな問題である。しかし、既存手法では、重要な手がかりである「方向の情報」を用いていなかった。本論文では、画像の各ピクセルの「方向の情報」を符合する、siameseネットワークを提案する。また、大規模な地理的位置推定用データセット、「CVACTデータ」を構築・公開する。

新規性

1. 「方向の情報」の導入各ピクセルごとに極座標を計算。計算した極座標を、color-coded法を用いて2Dの方向mapに変換。元の入力画像に連結する。連結した画像を7層のニューラルネットワークの入力とし、埋め込みベクトルを得る。埋め込みベクトル間のトリプレットロスを最小化する。 2. 「CVACT」データ google mapを用いて構築。約130kの地表画像と衛星画像の組を持つ。

結果

CVUSAデータ： recall top 1%において、従来法、提案法はそれぞれ、91.54、93.19である。 recall top 1だと、18.80、31.71である。 CVACTデータ localizationの精度が、従来法、提案法それぞれ、約5%、約20%である。

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．