- …
- …
#188
summarized by : rindybell
どんな論文か?
画像ベースの地理的位置推定は、異なる視点からの画像をマッチングさせるため、チャレンジングな問題である。
しかし、既存手法では、重要な手がかりである「方向の情報」を用いていなかった。
本論文では、画像の各ピクセルの「方向の情報」を符合する、siameseネットワークを提案する。
また、大規模な地理的位置推定用データセット、「CVACTデータ」を構築・公開する。
新規性
1. 「方向の情報」の導入
各ピクセルごとに極座標を計算。
計算した極座標を、color-coded法を用いて2Dの方向mapに変換。元の入力画像に連結する。
連結した画像を7層のニューラルネットワークの入力とし、埋め込みベクトルを得る。
埋め込みベクトル間のトリプレットロスを最小化する。
2. 「CVACT」データ
google mapを用いて構築。約130kの地表画像と衛星画像の組を持つ。
結果
CVUSAデータ:
recall top 1%において、従来法、提案法はそれぞれ、91.54、93.19である。
recall top 1だと、18.80、31.71である。
CVACTデータ
localizationの精度が、従来法、提案法それぞれ、約5%、約20%である。
その他(なぜ通ったか?等)
- …
- …