Composed Query Image Retrieval Using Locally Bounded Features

#804

summarized by : Anonymous

Mehrdad Hosseinzadeh, Yang Wang

どんな論文か？

合成クエリ画像検索の目標として、問い合わせ画像におおむね類似しているが、要求された修正に応じて異なる画像を検索することである。本論文では，画像内の局所領域のセットを用いた画像を表現する新しい方法を提案する。これにより修正テキスト内の各単語と画像内の各領域の関係性を明示的に示し、モデルの画像の一部と修正テキストを正確に相関させることを可能にする。

新規性

この論文で提案している内容は，クエリが参照画像とユーザが画像に適用するように要求した修正テキストであるという点で既存の最新手法とは異なっており、この種のクエリを利用した初の研究でもあるため新規性はあると感じた。

結果

Fashion200K、MITstates、CSSの3つのデータセットを用いたが、比較したどの最先端の手法よりも優れた性能を示しており、提案手法が入力画像を局所領域の集合として表現していることが理由として挙げられる。またより多くのregionを提案したモデルを用いた場合により高い性能を示していた。

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．