#403
summarized by : Yuta Nakamura
Learning Cross-Modal Embeddings With Adversarial Networks for Cooking Recipes and Food Images

どんな論文か?

レシピから料理写真,料理写真からレシピをより高い性能で出力させるための新しいフレームワーク(Adversarial Cross-Modal Embedding, ACME)を提案した論文
placeholder

新規性

①Retrieval LearningをHard Sample Miningによって高速化している,②Adversarial Lossを最小化することによって異なるモダリティの特徴量分布を可能な限り一致させている,③StackGANと似た手法でレシピから料理写真の出力の訓練性能を向上させている

結果

Recipe 1M datasetで検証し,baseline手法に比べてすべての指標が改善した。さらにACMEの手法のうち一部分だけを使い残りを使わないようにしてもやはりbaselineに比べて若干指標が改善していた。

その他(なぜ通ったか?等)