#425
summarized by : Shoma Iwai
Global Texture Enhancement for Fake Face Detection in the Wild

どんな論文か?

GANが生成した顔画像と本物の顔画像を見分ける。普通のResNetでは近傍のテクスチャに注目して判定するため、学習とテストで違うGANを使う場合や、画像を縮小、JPG圧縮などで劣化させた場合は正しく見分けることは難しい。そこで、画像を劣化させた場合も離れた位置のテクスチャに相関があることを発見し、GramBlockを使った広範囲情報を捉えることができるGramNetを提案した。
placeholder

新規性

人間・CNN両方について何に注目して判定しているかを調査し、よりロバストな生成画像判別を提案。

結果

ダウンサンプリング、JPEG圧縮、ノイズ・ブラー付加などで劣化させた場合でも、判定精度で既存手法やResNetを上回った。また、GramNetをdiscriminatorとして学習させたStyleGANの生成画像でテストしても、提案手法が最も高い精度となった。顔画像で学習させたGramNetは、ImageNetで学習させたBigGANの画像を8割の精度で真偽を判定できた。

その他(なぜ通ったか?等)