summarized by : Keisuke Kamahori
Minghui Liao, Guan Pang, Jing Huang, Tal Hassner, Xiang Bai
画像中のテキスト認識において、よりテキストの向き・アスペクト比・形に対して robust なネットワークの提案。
長方形に限らない任意の形のテキスト領域を検出できるネットワークを設計した。
提案したネットワークはテキストの向き・アスペクト比・形に対して robust であり、いくつかのベンチマークで SOTA を達成した。また、小さなテキストの検出に対しても精度の向上が見られた。
https://github.com/MhLiao/MaskTextSpotterV3