#121
summarized by : Yasuhide Miura
Deep Supervised Cross-Modal Retrieval

どんな論文か?

画像とテキストで相互に検索を行うCross-Modal Retrievalを教師ありで行う手法
placeholder

新規性

画像/テキストからCNNで特徴抽出を行い、最終層の重みを共有することで似たデータ同士が空間上で近い点に変換されることを期待する。また同じラベルのデータが共通の空間で近いところに集まるようにクラス分類のロスも加える

結果

NUS-WIDEやXMediaNetといったデータセットで検索精度をMAPで評価し、既存手法を上回る

その他(なぜ通ったか?等)

シンプルなロス構成なため