#517
summarized by : Ryo Miyoshi
FERV39k: A Large-Scale Multi-Scene Dataset for Facial Expression Recognition in Videos

どんな論文か?

動画像ベース表情認識のための新たな大規模データセットを作成した研究. 大規模かつ高品質なデータセットを作成するための手法を提案した. そして,実シーンでの表情認識手法の利用を想定し,4つのシナリオに基づいた大規模データセットを作成した. さらに,4タイプのベースライン手法によって性能を評価し,動画ベース表情認識における課題を整理した.
placeholder

新規性

・データセット作成のための新たなワークフローを提案した点 ・バリエーションが豊富な大規模かつ高品質なデータセットを作成した点 ・動画ベース表情認識の新たな課題を示した点

結果

4タイプのベースライン手法の性能を評価し,表情とシーンコンテキストを扱うTwo-stream Netが最も良い精度を示した.また,顔認識,他の表情認識データセットによる事前学習はあまり効果がなかった.さらに,行動認識などで用いられているスパースサンプリングを用いると性能が若干低下した.顔表情以外のシーン情報は,表情の認識に寄与することを示唆した.

その他(なぜ通ったか?等)

これまでのデータセットとより圧倒的に大規模かつバリエーション豊かなデータセットを作成した,データセット作成の方法を示した点. 動画ベース表情認識の新たな課題を示した点.