#13
summarized by : Ryota Suzuki
Bit-Flip Attack: Crushing Neural Network With Progressive Bit Search

どんな論文か?

DNNを騙す入力Adversarial Examplesと違い,こちらはDNNパラメータを直で弄ってDNNを壊す方法の一つ.floatなパラメータのうち壊れやすいものを直接いじって攻撃する従来法があるが,本論文ではfloatの指数部のbitをflipする.ごく少数のflipだけで容易に壊せることを示す.最小のbit-flipで最大の破壊性能を示す,惰弱パラメータをbit的に検索する.
placeholder

新規性

値の置換よりもごく少ない操作で壊せることを示した.

結果

ImageNet pretrained ResNet-15がたったの5回フリップで精度が20%未満まで低下.

その他(なぜ通ったか?等)

一般的にDNNはパラメータに対してロバストであることが人気を博しているが,どこまでロバストかを見るのは有意義だ.指数部壊すなら数値的にデカいので自明レベルで納得だが,ちょっとbit的にノイズ載ったまま放置したらヤバイといえる.主張の訴え方がハマってそうなので読んでみるとよいです.