Global Texture Enhancement for Fake Face Detection in the Wild

#425

summarized by : Shoma Iwai

Zhengzhe Liu, Xiaojuan Qi, Philip H.S. Torr

どんな論文か？

GANが生成した顔画像と本物の顔画像を見分ける。普通のResNetでは近傍のテクスチャに注目して判定するため、学習とテストで違うGANを使う場合や、画像を縮小、JPG圧縮などで劣化させた場合は正しく見分けることは難しい。そこで、画像を劣化させた場合も離れた位置のテクスチャに相関があることを発見し、GramBlockを使った広範囲情報を捉えることができるGramNetを提案した。

新規性

人間・CNN両方について何に注目して判定しているかを調査し、よりロバストな生成画像判別を提案。

結果

ダウンサンプリング、JPEG圧縮、ノイズ・ブラー付加などで劣化させた場合でも、判定精度で既存手法やResNetを上回った。また、GramNetをdiscriminatorとして学習させたStyleGANの生成画像でテストしても、提案手法が最も高い精度となった。顔画像で学習させたGramNetは、ImageNetで学習させたBigGANの画像を８割の精度で真偽を判定できた。

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．