#557
summarized by : Yue Qiu
Learning Visual Emotion Representations From Web Data

どんな論文か?

大規模Emotion Recognition相関タスク用データセットStockEmotionを提案(1M+画像,690 emotion tag).また,EmotionNet(text distillationとjoint text, visual embedding手法)を提案.StockEmotionデータセットで学習のEmotionNetが複数Visual EmotionタスクでSOTA達成.
placeholder

新規性

①今までにない大規模なEmotionデータセットの提案;②提案のEmotionNetが有効的にNoise-labeledデータからEmotionの表現学習を行える、さらに,zero-shot設定で従来のsupervised手法と同レベル精度達成.

結果

複数のVisual Emotionに関するタスクでStockEmotionで学習済みのEmotionNetがSOTA達成(emotion recognition; zero-shot learning; image retrieval).さらに,EMOTICデータセットでsupervised手法と同レベルな精度達成(zero-shot learning 設定で).

その他(なぜ通ったか?等)

Emotion RecognitionタスクのためにImageNet規模なデータセットを提案.また,実験で提案データセットの有効性を十分示し,将来のEmotion Recognitionタスクの重要なデータセットとなる.