Learning Cross-Modal Embeddings With Adversarial Networks for Cooking Recipes and Food Images

#403

summarized by : Yuta Nakamura

Hao Wang, Doyen Sahoo, Chenghao Liu, Ee-peng Lim, Steven C. H. Hoi

レシピから料理写真，料理写真からレシピをより高い性能で出力させるための新しいフレームワーク(Adversarial Cross-Modal Embedding, ACME)を提案した論文

①Retrieval LearningをHard Sample Miningによって高速化している，②Adversarial Lossを最小化することによって異なるモダリティの特徴量分布を可能な限り一致させている，③StackGANと似た手法でレシピから料理写真の出力の訓練性能を向上させている

Recipe 1M datasetで検証し，baseline手法に比べてすべての指標が改善した。さらにACMEの手法のうち一部分だけを使い残りを使わないようにしてもやはりbaselineに比べて若干指標が改善していた。

このページで利用されている画像は論文から引用しています．