#471
summarized by : QIUYUE
BTS: A Bi-Lingual Benchmark for Text Segmentation in the Wild

どんな論文か?

Text segmentationでは英語ベースデータセットがたくさんあったが、中国語データセットはあまり検討されてなかった。ここで大規模中国語・英語両方入ったText Segmentationデータセットを提案。また、テキスト領域をハイライトしながら検出を行うモデルを提案し、さらにVariation Lossを導入することで有効的に背景ノイズの影響を緩和した。
placeholder

新規性

まず、中国語のText Segmentationデータセットと手法の検討が不足していて、この論文で中国語のためのデータセットを提案。さらに、データセットに中国語と英語両方入った初めてのBi-lingualとなるText Segmentationを扱っている。そして、初めてのBi-lingualを同時にSegmentする手法も提案。

結果

提案データセットにおいて、提案の手法は既存のSOTA手法を超えた性能を示せた。

その他(なぜ通ったか?等)

画像からBi-lingual 的なテキスト検出タスク設定が結構面白い。 応用場面に応じて二つの言語間の関係性も変化しそう。で、さらにVisionとの結合のところによりまた色々面白い応用がありそう。また、テキストの検出のみではなく、その後の認識も面白そう。大規模Language事前学習モデルは使えそう。