summarized by : Shunsuke Tokunaga
Seungmin Lee, Dongwan Kim, Bohyung Han
コンテンツ変調器とスタイル変調器で構成されるCoSMoは、テキスト情報を用いてクエリ画像の内容・スタイルを変更し、画像検索を行う。これによって、ユーザは自分の意図を検索に反映させることが容易になる。
CoSMoと呼ばれる、テキストから画像の内容・スタイルを変更するコンポジターを提案。コンテンツ変調器にDMNLを適用。
Fashion200k における Recall@1 で23.3のスコアを出し、SOTAを達成