#246
summarized by : Katsuhiro Muto
A 3D GAN for Improved Large-Pose Facial Recognition

どんな論文か?

顔認識におけるデータセットについての論文。一般的にデータセットに含まれる画像の大半は笑顔で正面から撮った写真であることが多く、ロバストなモデルを学習することは難しい。そこで、3D GANを用いて各人物に対して多様な顔画像を用意することで、ロバストなモデルを学習できるようにデータセットを増強する。
placeholder

新規性

3D morphable modelをGANに組み込むことで、ポーズと人物を分離することができ、ポーズ・照明・表情を操作した画像が生成できるようになった。

結果

よりリアルなテクスチャの3Dモデルを作成することができ、これを用いてデータセットを増強することで、顔認識タスク(CPLFWやCFP-FP)で精度向上が確認できた。特にFFHQのようなノイズの多いデータセットに対して有効で、FFHQを用いて増強したデータセットを用いたところ、CPLFWでSoTA性能を達成した。

その他(なぜ通ったか?等)