#226
summarized by : Munetaka Minoguchi
Exact Adversarial Attack to Image Captioning via Structured Output Learning With Latent Variables

どんな論文か?

CNN + RNNベースのImage Captioningにおいて,Adversarial Noiseについて検証する論文.ノイジーな画像を入力することで,キャプションの一部に対して正確なAdversarial Attackを実現することに成功.本提案によって,Image Captioningにおける構造を理解するために利用できる.
placeholder

新規性

Image Captioningにおいて,単語ごとの正確なAdversarial Attackはこの論文が初である.

結果

3つの著名なCNN + RNNベースのImage Captioningモデルにおいて検証を行い,どの手法に対しても正確なAdversarial Attackを行うことができることを示した.

その他(なぜ通ったか?等)

おそらく初とされるImage CaptioningのAdversarial Attackであることと,単語ごとに正確に行えるという手法の強さ.