- …
- …
#642
summarized by : Yue Qiu
どんな論文か?
Segmentation-free multi-line/full page text recognition手法OrigamiNetを提案.OrigamiNetは任意のCTC-trainedでfully convolutional single lineのText recognition手法をmulti-line recognition可能にする.
新規性
①SOTAなText recognitionがSegmentation-freeでSingle-line text recognitionを可能にし、提案手法は更にSegmentation-freeでmulti-line recognition可能;②提案手法はEnd-to-endで、Segmentationのアノテーション必要せずにSegmentationとRecognition同時に行える.
結果
①handwriting recognitionデータセットIAMとICDAR 2017 HTRでSOTAなcharacter error率を得られた;②更に,IAMデータセットでLocalization informationを用いたSingle line手法よりも高いパフォーマンスを得た;③定性的結果により提案手法が有効的にLineをセグメントできることを示した.
その他(なぜ通ったか?等)
①ネットワークの通用性が高い.提案のネットワークを従来の1行Text認識手法に適応することで従来手法をMulti-行のText認識可能にする.②提案手法は実装しやすい.Text画像とFull textのアノテーションだけから学習可能であり、行のSegmentationなどのアノテーションが必要ない.
- …
- …