#616
summarized by : Yue Qiu
ContourNet: Taking a Further Step Toward Accurate Arbitrary-Shaped Scene Text Detection

どんな論文か?

Scene Text detectionの2つの従来の問題点を着目:①従来の手法はFalse Positivesを予測しがち;②Scene TextデータセットでText領域のスケールのバリエーションが多く、学習しにくい.提案のContourNetは学習データセットのBBOXとIoUの比較からProposalsの学習を行い,縦・横の2方向からBBOXの高精度化するなどの工夫で以上2つの問題に対応.
placeholder

新規性

①Scene TextのProposalsの精度、異なるスケールに対しての対応性を高めるためのAdaptive Region Proposal Networkを提案し、GTのBBOXとのIoUの近さにfocusして学習を行う.ほかの手法にも適応可能;②Local Orthogonal Texture-aware Moduleを提案し、縦横2方向からBBOXの最適化し,有効的にFPを抑制できる.

結果

従来よく使われているTotal-TextとCTW1500データセットでそれぞれ85.4%, 83.9% F-measure scoreを得られて,従来の手法より大幅に改善.

その他(なぜ通ったか?等)

識別精度より,検出領域のAccuracyを着目するところがほかの手法に取り込みやすい.有効的にFalse Positiveを抑制できる.