- …
- …
#184
summarized by : Koki Obinata
どんな論文か?
デプロイしたDNNモデルがデプロイ前のモデルから変更を受けていないかを,数個のqueryに対する結果から判別する手法を提案.モデルが変更を受けた場合に出力が大きく変わるようなサンプル(Sensitive-Sample)をqueryとし,手元のモデルの出力と一致するかどうかを試す.
新規性
DNNを騙すadversarial examplesは有名だが,「攻撃」が目的ではなく,モデルが攻撃を受けていないかを検出するという「防御」を目的とする点.
結果
4つの攻撃パターンについて検証しており,いずれも数個のSensitive-Sampleを用いることで高い(>99.95%)検出精度を達成している.
また,偽陽性が生じない手法となっている.
その他(なぜ通ったか?等)
高い検出精度と必要なquery数が少ない点.
テストに用いるquery数,テストの発覚しにくさ,想定される攻撃に対する精度検証など,実運用する際に重要となる事項を考慮している点.
- …
- …