#477
summarized by : Mikihiro Tanaka
Cross Modal Retrieval With Querybank Normalisation

どんな論文か?

高次元空間への埋め込みを利用したk近傍探索で、様々なデータの近傍となってしまう「ハブ」と呼ばれるデータが現れる問題が知られていたが、最新のcross modalな検索においても「ハブ」が検索性能を下げる要因になっていることを特定し、推論時に正規化してこれを緩和する手法を提案した。
placeholder

新規性

近年のcross modalな検索の主流なアプローチの一つである高次元空間への埋め込みを利用した手法において、「ハブ」が検索性能を下げる要因になっていることを特定した。Querybankと呼ぶqueryの集合を訓練データなどから用意し、あらかじめ検索対象との類似度を測っておくことで、「ハブ」をなしている可能性の高い対象を抑制するような正規化を行う手法を提案し、その有効性を確認した。

結果

推論時に提案する正規化を行うことで、テキストによる動画像検索を始めとし、テキストによる画像や音声の検索、画像による画像の検索といった様々なタスクで、学習済みモデルによる検索性能をさらに向上させられることを確認した。

その他(なぜ通ったか?等)

https://vladbogo.github.io/QB-Norm/