#675
summarized by : 日坂 幸次
Solving Mixed-Modal Jigsaw Puzzle for Fine-Grained Sketch-Based Image Retrieval

どんな論文か?

ユーザーの手書きの絵で画像を検索するAIについては、手書きの絵と実際の画像のペアのデータセットを揃えるのは難しいため、ImageNetのデータセットを使った分類の事前学習が今まで必要であったが、ジグソーパズルを解く事前学習をさせることで、ImageNetの事前学習を不要にした。
placeholder

新規性

ジグソーパズルを解く事前学習をさせることで、ImageNetの事前学習を不要にした。

結果

提案手法は、従来のImageNet予備訓練段階よりも優れていることを示した。この手法は、カテゴリ間での一般化が良好であり、さらに、カテゴリ間での一般化特性がより良好なFG-SBIRモデルを導く。この事前学習戦略が将来のFG-SBIRの標準となり、他のクロスモーダル検索・認識タスクにも採用されることを期待している。

その他(なぜ通ったか?等)