- …
- …
#708
summarized by : Ryota Suzuki
どんな論文か?
画像に対する応答ラベルの分布を学習するが,ラベル分布を出すのに複数の補助的なタスクを使う(表情認識なら,action unit認識とかfacial landmark検出とか).対象画像を補助タスクでクラス分類学習し,推定ラベル分布が出る.補助タスクでのkNNによる近傍画像群の推定ラベル分布をガイドとしたロスも計算.この補助タスク分類ロスと補助タスクガイドロスの2つで学習を行う.
新規性
補助タスクの潜在空間上でのグラフ的近接性を考慮するやり方は新しいとのこと.バックボーン非依存.表情認識で起きるようなアノテーションの揺れに強いらしい.
結果
バックボーンネットワークの生に対して,提案手法を組み合わせて1%程度向上.また,他手法よりもノイズに強い.ノイズ含有において,他手法より1~2%高い精度.
その他(なぜ通ったか?等)
汎用性がありそうな書き方をしている(この論文では表情認識+[action unit, facial landmark])が,他のタスク+補助タスクでうまくいくかは不明.補助タスクの選び方も課題か.Taskonomyを参照すればいける?
- …
- …