#642
summarized by : Yue Qiu
OrigamiNet: Weakly-Supervised, Segmentation-Free, One-Step, Full Page Text Recognition by learning to unfold

どんな論文か?

Segmentation-free multi-line/full page text recognition手法OrigamiNetを提案.OrigamiNetは任意のCTC-trainedでfully convolutional single lineのText recognition手法をmulti-line recognition可能にする.
placeholder

新規性

①SOTAなText recognitionがSegmentation-freeでSingle-line text recognitionを可能にし、提案手法は更にSegmentation-freeでmulti-line recognition可能;②提案手法はEnd-to-endで、Segmentationのアノテーション必要せずにSegmentationとRecognition同時に行える.

結果

①handwriting recognitionデータセットIAMとICDAR 2017 HTRでSOTAなcharacter error率を得られた;②更に,IAMデータセットでLocalization informationを用いたSingle line手法よりも高いパフォーマンスを得た;③定性的結果により提案手法が有効的にLineをセグメントできることを示した.

その他(なぜ通ったか?等)

①ネットワークの通用性が高い.提案のネットワークを従来の1行Text認識手法に適応することで従来手法をMulti-行のText認識可能にする.②提案手法は実装しやすい.Text画像とFull textのアノテーションだけから学習可能であり、行のSegmentationなどのアノテーションが必要ない.