#507
summarized by : 鈴木共生
An Efficient Training Approach for Very Large Scale Face Recognition

どんな論文か?

近年の顔認証では膨大なIDを含む数百万枚単位以上の学習データを用いることにより高精度を実現している.しかし,ID増加に伴い,顔認証モデル使用されるFC層のメモリ使用量や学習時間が急激に増加する.提案法ではFC層の代わりにDynamic Class Pool(以降DCP)を使用してこの問題を解決した.
placeholder

新規性

ネットワーク構造は画像のとおり.バッチサイズ分の画像と,同一IDペアを抽出した画像を2分割して組み合わせたものを入力とする.これにより,GallaryとProbeには同一IDのデータが含まれるようになり,クラス分類として学習可能になる.DCPでは全クラスIdではなく一部のクラス中心を保持し,イテレーションごとに記憶するクラス中心を更新していく.これにより,メモリ使用量と学習時間を削減した.

結果

顔認証データ(LFW,SLFWなど)のFAR評価を行い,WebFace42Mなど膨大なIDを含むデータで学習した場合にFC層ベースと比較して性能劣化がないことを示した.

その他(なぜ通ったか?等)

顔認証モデルの精度を向上させるために膨大なIDデータで学習させる場合,必要なハードウェア要件が厳しいものになる.提案法のDCPではFC層と異なり,記憶するクラス中心の数は定数であり,ID増加に伴うメモリ使用量の増加抑制を実現したため.