#133
summarized by : Yasuhide Miura
Look More Than Once: An Accurate Detector for Text of Arbitrary Shapes

どんな論文か?

画像中のテキスト領域を検出する「scene text detection」において、長いテキストの端をうまく検出できない問題と、四角形では取れない歪んだテキストを検出できない問題に対応するためのモデルを提案
placeholder

新規性

前者の問題に対して両端のズレをロスに組み込むIRMモジュールと、後者の問題に対してテキスト領域のセンターラインとそこからのオフセットを予測するSEMモジュールを組み込んだモデルを提案した

結果

ICDAR 2015/2017やSCUT-CTW1500, Total-Textデータセットで実験を行った

その他(なぜ通ったか?等)

既存手法の問題点を明らかにし、それに対する対策をモデルに組み込んだところ