#614
summarized by : yoshiki miyazawa
Open-Set Text Recognition via Character-Context Decoupling

どんな論文か?

推論時にグリフ画像セットも入力することで、未学習の文字を推論可能とするオープンセット文字認識に関する論文。既存法では、背景や他文字といったコンテキストの影響を受けることで認識精度低下が生じていた。そこで文字とコンテキストを切り離して学習する枠組みを提案した。
placeholder

新規性

オープンセット文字認識で、文字とコンテキストを分けて学習する枠組みを提案した点。

結果

オープンセット、ゼロショット、クローズセットの文字認識で、各々を評価している。 オープンセット(OSOCR)では、SOTAに対し49.10→65.34へ改善、セロショット(HWDBとCTW)でも、86.73→96.66, 63.77→77.18に改善し、SOTAを達成している。クローズセットでも、SOTA手法の同等を示している。

その他(なぜ通ったか?等)

文字認識において、コンテキスト影響を受けにくい学習は過去にあったかもしれないg。 ただしオープンセットという最新の問題設定に対し、いち早く上記を適応し、大きな性能改善を示したため通ったと考える。 Github:https://github.com/lancercat/VSDF