#79
summarized by : SY
Ask&Confirm: Active Detail Enriching for Cross-Modal Retrieval With Partial Query

どんな論文か?

画像検索を対話的に行うタスクの提案.ユーザが与えたクエリに対して,エージェントがユーザに質問を繰り返すことで候補を絞っていくという問題設定になっている.
placeholder

新規性

エージェントがユーザに確認の質問を行うことで,入力クエリが断片的な情報しか含まない場合でもユーザの意図する画像の検索を可能とする.また,このような問題設定では教師あり学習が難しいため,実際の対話データなしで学習する手法を提案.

結果

Visual Genomeをベースとした新たなデータセットを構築し,提案フレームの検索性能が高いことを示した.

その他(なぜ通ったか?等)