- …
- …
#507
summarized by : 鈴木共生
どんな論文か?
近年の顔認証では膨大なIDを含む数百万枚単位以上の学習データを用いることにより高精度を実現している.しかし,ID増加に伴い,顔認証モデル使用されるFC層のメモリ使用量や学習時間が急激に増加する.提案法ではFC層の代わりにDynamic Class Pool(以降DCP)を使用してこの問題を解決した.
新規性
ネットワーク構造は画像のとおり.バッチサイズ分の画像と,同一IDペアを抽出した画像を2分割して組み合わせたものを入力とする.これにより,GallaryとProbeには同一IDのデータが含まれるようになり,クラス分類として学習可能になる.DCPでは全クラスIdではなく一部のクラス中心を保持し,イテレーションごとに記憶するクラス中心を更新していく.これにより,メモリ使用量と学習時間を削減した.
結果
顔認証データ(LFW,SLFWなど)のFAR評価を行い,WebFace42Mなど膨大なIDを含むデータで学習した場合にFC層ベースと比較して性能劣化がないことを示した.
その他(なぜ通ったか?等)
顔認証モデルの精度を向上させるために膨大なIDデータで学習させる場合,必要なハードウェア要件が厳しいものになる.提案法のDCPではFC層と異なり,記憶するクラス中心の数は定数であり,ID増加に伴うメモリ使用量の増加抑制を実現したため.
- …
- …