- …
- …
#614
summarized by : yoshiki miyazawa
どんな論文か?
推論時にグリフ画像セットも入力することで、未学習の文字を推論可能とするオープンセット文字認識に関する論文。既存法では、背景や他文字といったコンテキストの影響を受けることで認識精度低下が生じていた。そこで文字とコンテキストを切り離して学習する枠組みを提案した。
新規性
オープンセット文字認識で、文字とコンテキストを分けて学習する枠組みを提案した点。
結果
オープンセット、ゼロショット、クローズセットの文字認識で、各々を評価している。
オープンセット(OSOCR)では、SOTAに対し49.10→65.34へ改善、セロショット(HWDBとCTW)でも、86.73→96.66, 63.77→77.18に改善し、SOTAを達成している。クローズセットでも、SOTA手法の同等を示している。
その他(なぜ通ったか?等)
文字認識において、コンテキスト影響を受けにくい学習は過去にあったかもしれないg。
ただしオープンセットという最新の問題設定に対し、いち早く上記を適応し、大きな性能改善を示したため通ったと考える。
Github:https://github.com/lancercat/VSDF
- …
- …