#161
summarized by : 福原吉博 (Yoshihiro Fukuhara)
One Man's Trash Is Another Man's Treasure: Resisting Adversarial Examples by Adversarial Examples

どんな論文か?

Adversarial Examples (AEs)に対する防御手法の研究。従来の敵対的摂動を除去する手法とは逆に、敵対的摂動を加える変換を利用した新しい防御手法を提案している。
placeholder

新規性

入力画像に対して事前学習済の分類器を用いて計算された敵対的摂動を加え、生成されたAEsを正しく分類するように2つ目の分類器を学習するという新しい防御手法を提案している点。(Adversarial Training (AT)と異なり2つの異なる分類器を使用している。)

結果

CIFAR-10、Tiny ImageNetを用いた実験では、white-boxの設定で通常のPGD-ATと比較して頑健性が大きく向上。また、学習コストもATと比較して小さい。一方で、通常の画像の精度はPGD-ATと同程度に低下してしまう。

その他(なぜ通ったか?等)

敵対的摂動を防御に有効活用するというアイデアの斬新さ。