#122
summarized by : Takayuki Semitsu
DOLG: Single-Stage Image Retrieval With Deep Orthogonal Fusion of Local and Global Features

どんな論文か?

画像検索のための表現学習において、大域的な特徴ベクトルとそれに直交する局所的な特徴ベクトルによる表現を2-stageでなくEnd-to-endに学習する。
placeholder

新規性

大域的な特徴と局所的な特徴を組み合わせる手法はこれまでにもあったが、大域的特徴を求める前段、局所的特徴を求める後段と2-stageになっていた(DELG: Deep Local and Global Features)。提案手法(DOLG: Deep Orthogonal Local and Global feature fusion)では1-stageで両者をEnd-to-endに学習する。

結果

ランドマーク検索タスクのデータセットであるOxfordとParisを使って評価。(A)局所特徴ベース、(B)大域特徴ベース、(C)大域+局所の組み合わせ で既存手法を分類し、提案手法と精度を比較。多くの指標で提案手法が最も良い結果。

その他(なぜ通ったか?等)

Baidu社 https://github.com/feymanpriv/DOLG-paddle 準備中