- …
- …
#97
summarized by : Keisuke Kamahori
どんな論文か?
これまでの end-to-end のテキスト認識手法は、訓練データに存在する言語やフォントしか効果的に認識できないという問題があった。そこでテキスト認識をマッチング問題と捉え直すことで、学習を追加することなく未知の言語やフォントへの一般化が可能なネットワークを設計した。
新規性
言語は限られた種類の文字の繰り返しであることから、文字のサンプルを与え類似度を計算することで one-shot で文字列の認識を行い、未知の言語や文字への拡張も可能となった。
結果
未知のフォントに対するテキスト認識で SOTA を達成した。未知の言語に対しても、文字のサンプルを与えるだけで非常に高い認識精度を示した。
その他(なぜ通ったか?等)
http://www.robots.ox.ac.uk/~vgg/research/FontAdaptor20/
- …
- …