#134
summarized by : 福原吉博 (Yoshihiro Fukuhara)
Towards Achieving Adversarial Robustness by Enforcing Feature Consistency Across Bit Planes

どんな論文か?

Adversarial Examples (AEs)に対する防御手法の研究。人間は「大きなスケールで特徴を捉え、印象を強めるために詳細情報 (Textureなど) を使用」している。この背景知識が無いのが脆弱性の原因の1つと考えられるので、これを学習させたい。
placeholder

新規性

モデルの学習の際の新しい制約項として、Bit Plane Feature Consistency (BPFC) を提案。入力画像の量子化諧調を256から変化させても、モデルから出力される特徴量は大きく変化しないという制約を加えている。学習速度もPGD-Adversarial Training (AT) より3〜10倍高速。

結果

CIFAR-10、MNIST、Fashion-MNISTにおいて、PGD-ATには劣るがBPFCがlinf-PGDに対する頑健性の向上に有効であることを確認した。また、DeepFoolやC&Wなどに対してはPGD-ATよりもわずかに頑健性が高いことを確認した。

その他(なぜ通ったか?等)