Solving Mixed-Modal Jigsaw Puzzle for Fine-Grained Sketch-Based Image Retrieval

#675

summarized by : 日坂　幸次

Kaiyue Pang, Yongxin Yang, Timothy M. Hospedales, Tao Xiang, Yi-Zhe Song

どんな論文か？

ユーザーの手書きの絵で画像を検索するAIについては、手書きの絵と実際の画像のペアのデータセットを揃えるのは難しいため、ImageNetのデータセットを使った分類の事前学習が今まで必要であったが、ジグソーパズルを解く事前学習をさせることで、ImageNetの事前学習を不要にした。

新規性

ジグソーパズルを解く事前学習をさせることで、ImageNetの事前学習を不要にした。

結果

提案手法は、従来のImageNet予備訓練段階よりも優れていることを示した。この手法は、カテゴリ間での一般化が良好であり、さらに、カテゴリ間での一般化特性がより良好なFG-SBIRモデルを導く。この事前学習戦略が将来のFG-SBIRの標準となり、他のクロスモーダル検索・認識タスクにも採用されることを期待している。

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．