#819
summarized by : Yukitaka Tsuchiya
R2GAN: Cross-Modal Recipe Retrieval With Generative Adversarial Network

どんな論文か?

GANを基にしたクロスモーダルなレシピの検索をする新しいネットワーク (R^2GAN)を提案した.レシピ(文章)と食べ物(画像)の共通の潜在的な部分空間を学習する.
placeholder

新規性

一つのGeneratorと二つのDiscriminatorを用いたのは新しいアイディア.通常の{real, fake}の識別をするDiscriminatorに加えて生成された画像が{recipe, image}のどちらの潜在変数空間から生成されたものなのかを識別することで,クロスモーダルの比較を実現した.

結果

Median rank (MedR)とrecall rate at top K (R@K)で評価を行った.Recipe1M datasetにおいてstate-of-the-artの結果を得た.

その他(なぜ通ったか?等)