#61
summarized by : 岡本大和
Fashion IQ: A New Dataset Towards Retrieving Images by Natural Language Feedback

どんな論文か?

ユーザとシステムの対話によるファッション検索を目指す論文
placeholder

新規性

従来は推薦中の画像と、それに対するユーザのフィードバックから、次に推薦するファッションを選択していたが、追加入力としてファッションの属性(テキストデータ:例「V-neck」等)を利用してマルチモーダルにした。 また、ユーザが求めるファッションとシステムが推薦中のファッションの相違点を説明したキャプションを生成するユーザフィードバックモデルを構築して、検索モデルの学習に利用するといった工夫もある。

結果

従来手法よりも検索性能の向上を確認。

その他(なぜ通ったか?等)

1つ目の新規性はファッション属性(テキストデータ)を入力に加えたこと。ただし、これだけではContributeが弱いかもしれない。今回の学習や評価用にFashion IQ Dataset を構築した点でも新規性を強調しており、あわせ技で採択されたと思われる。