#515
summarized by : Akihiro FUJII
Dive Into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty Estimation for Facial Expression Recognition

どんな論文か?

表情認識は主観的なアノテーションになるため曖昧性がある。学習中にC-1クラスを分類するC個ブランチを合わせたネットワークと同じように分類させる制約をかけることにより、曖昧性を学習しながら推論中にコストをかけない手法を提案。AffectNetでSotA性能を獲得

新規性

ラベルに曖昧性がある表情認識タスクにおいて、ネットワーク潜在表現を使った手法を提案。潜在表現をC-1クラスに分類するC個のブランチに分割し、曖昧性を表現させ、それをTarget Branchに学習させる。推論時はTarget Branchのみ使うことによって、推論時の計算コストを下げている。

結果

RAFDBでは89.42%,AffectNetでは63.11%の最高性能を達成し,新記録を達成した.

その他(なぜ通ったか?等)