#320
summarized by : hiroki iida
Sequence-To-Sequence Domain Adaptation Network for Robust Text Image Recognition

どんな論文か?

テキストが記載された画像に対して、テキストを読み取るというタスクにおいて、系列を加味した分野適合を行った論文。gated-attention-similarity(GAS)を用いることによって、各文字の特徴を効果的に捉えることを意図している。結果として、様々な文字認識タスクで良い成績を収めている。
placeholder

新規性

GASユニットによる、文字レベルでのマッチング評価

結果

風景でのテキストは、IIIT5K, IC-13でSOTA(SVT, IC-03はASTERがSOTA)、手書き文字は、WERとWERとCERの平均で良い成績(SOTAっぽいが他の手法がすくない)。手書き数式はSOTA。手書き文字認識で標準的な分野適合手法より、よい結果が出ている。

その他(なぜ通ったか?等)