#506
summarized by : Shintaro Yamamoto
P2SGrad: Refined Gradients for Optimizing Deep Face Models

どんな論文か?

深層学習による顔認識では、cosine-based softmax lossにより高い精度を実現した。しかし、ハイパーパラメータに依存するため学習が不安定、データセットによって最適なパラメータが違うという問題がある。そこで、ハイパーパラメータに依存しない勾配であるP2SGradを提案した。

新規性

既存の顔認識モデルの学習は、学習時にはsoftmaxによって確率を取得し、テスト時にはコサイン類似度により個人の類似度を測るため、学習とテストの尺度が異なっている。そこで、学習時の勾配計算にクラスの確率ではなくコサイン類似度を用いることでこの問題の解決を行う。

結果

LFW, Mega Face, IJB-Cの3つのデータセットにおいてSOTAを更新した。

その他(なぜ通ったか?等)