#544
summarized by : 伊藤 諒悟
LiBRe: A Practical Bayesian Approach to Adversarial Detection

どんな論文か?

Adversarial Examples (AEs) を学習データ分布から外れたものとしてみなし、ベイジアンニューラルネットワーク(BNN)を用いてAEsを検知する防御手法を提案。BNNにおける問題点を克服した手法としてLiBReを提案し、その防御性能を示した。
placeholder

新規性

AEsを検知する手法としてBNNが使用されることは既存であったが、予測性能と不確実性推定の性能、学習効率がトレードオフの関係になっていた。これを克服する手法としてFADEを提案したことや、学習効率を上げるために事前学習パラメータを使用してfine-tuningしたことに新規性がある。

結果

既存の防御手法を用いて、モデルの予測性能、様々な攻撃手法に対する防御性能を比較し、lその性能を示した。モデルには、ImageNet予測モデルだけでなく、顔認識モデルや物体検出モデルも使用している。

その他(なぜ通ったか?等)

公式実装:https://github.com/thudzj/ScalableBDL