#78
summarized by : Shintaro Yamamoto
What Machines See Is Not What They Get: Fooling Scene Text Recognition Models With Adversarial Text Images

どんな論文か?

画像中のテキストを読み込むScene Text Recognition (STR)は,系列データの認識タスクとして考えられる。通常の識別タスクと異なり、STRにおける誤認識に関わる要素として、文字単位での誤りや言語的な意味の考慮、RNNの活用などが挙げられる。STRにおけるAdversarial Attack手法の提案を目的とする。
placeholder

新規性

系列データの認識タスクであるSTRに対する、optimizationベースの最初のAdversarial Attack手法を提案した。food→fool、2003→200のように、言語的に意味のある出力を得ることができる。実験では、7つのベンチマークデータセット及び5つのSTRモデルを用いて提案手法の有効性を検証した。

結果

提案手法により、現存のSTRモデルを騙すことが可能であると確認した。また、商用システムにおいても実験し、同様に騙すことが可能であることが分かった。

その他(なぜ通ったか?等)