#232
summarized by : takumuikeya
Shape Robust Text Detection With Progressive Scale Expansion Network

どんな論文か?

シーン中のテキスト検出における新たなネットワークとしてpsenetを提案した.既存のシーンテキスト検出におけるネットワークでは多様な形状のテキスト領域検出が難しく,距離的に近しいテキスト領域を同一の領域と誤検出する問題点がある.本論文で提案されたpsenetは複雑な形状のテキスト領域でも正確に検出でき,近しい領域を別々の領域として認識できる.
placeholder

新規性

FPNにより生成した複数スケールのセグメンテーションマップを生成し,もっとも小さいスケールのセグメンテーションマップから順次マップを大きくすることで,テキスト領域を拡張していくことにより多様な形状を認識しつつ,位置被りのない検出を可能とした.

結果

CTW1500, TotalText, ICDAR 2015 and ICDAR 2017 MLTのデータセットで比較実験を行い,既存の他の手法と比較して高い精度を出した.

その他(なぜ通ったか?等)