Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spotting

#62

summarized by : Keisuke Kamahori

Minghui Liao, Guan Pang, Jing Huang, Tal Hassner, Xiang Bai

画像中のテキスト認識において、よりテキストの向き・アスペクト比・形に対して robust なネットワークの提案。

長方形に限らない任意の形のテキスト領域を検出できるネットワークを設計した。

提案したネットワークはテキストの向き・アスペクト比・形に対して robust であり、いくつかのベンチマークで SOTA を達成した。また、小さなテキストの検出に対しても精度の向上が見られた。

https://github.com/MhLiao/MaskTextSpotterV3

このページで利用されている画像は論文から引用しています．