#699
summarized by : 福原吉博 (Yoshihiro Fukuhara)
Defending Against Universal Attacks Through Selective Feature Regeneration

どんな論文か?

Universal Adversarial Perturbation (UAP) に対する防御手法の研究。学習済みのモデルの中の脆弱なフィルタを特定し、それらのフィルタからの出力を健全なものへと変換することでネットワーク全体の頑健性を向上させる手法を提案している。DNN中の6層において脆弱性の高い50%のフィルタに提案手法を提案するだけで、頑健性を大幅に向上させることが可能であることを示した。
placeholder

新規性

フィルタの重みをL1ノルムで測ることで、敵対的サンプルに脆弱なフィルタを特定する方法を提案し、それらのフィルタからの出力を健全なものへと変換する学習可能なfeature regeneration units を提案した。

結果

ImageNetにおいてUAPに対する頑健性を他の防御手法と比較して約10%向上させた。また、提案手法を用いてUAPに対して学習を行ったモデルはPGDのような他の攻撃手法に対しても高い防御性能を持っていることを確認した。

その他(なぜ通ったか?等)