#493
summarized by : 福原吉博 (Yoshihiro Fukuhara)
Detecting Adversarial Samples Using Influence Functions and Nearest Neighbors

どんな論文か?

敵対的サンプルを検出する手法の提案をしている。既に学習済みの分類器に対して、影響関数を使用して敵対的サンプルを検出する。敵対的サンプルの検出精度でSoTAを達成した。
placeholder

新規性

敵対的サンプルを検出するための新しい指標を提案している点。通常のサンプルでは、入力されたデータ点に対して「ネットワークの埋め込み空間において k-NN によって求められた近傍のデータ点の集合」と「影響関数によって求められる影響の大きい訓練データの集合」が相関するが、敵対的サンプルではそうでは無いことを利用して検出を行う。

結果

FGSM, JSMA, DeepFool, CW, PGD, EADを評価に使用。Local Intrinsic Dimentionaloty (LID) [Ma et al.] や Mahalanobis distancebased confidence score [Lee et al.] とAUCで比較して高精度を達成。White-box の設定でも1%程度しか性能が低下しなかった。

その他(なぜ通ったか?等)

敵対的サンプルの検出の精度でSoTAを達成しているから。