- …
- …
#16
summarized by : Atsuki Osanai
どんな論文か?
Layout Analysis(タイトル,パラグラフなどのセグメンテーション)の従来手法では,テキスト検出とそのグルーピングが別々に扱われていた.本研究ではそれらを統合しEnd-to-Endで学習する方法を提案.MaX-DeepLabを用いたテキストのインスタンスセグメンテーション→インスタンスベースのAffinity Matrixを用いたグルーピングを行う.
新規性
・ワード,ライン,パラグラフのように階層的なアノテーションを施したHier Datasetを構築
・テキスト検出とそのグルーピングをEnd to Endで行うモデルの提案
結果
・Layout analysisのベンチマークにおいて,GCNやインスタンスセグメンテーションの手法を上回る精度を達成
- Hier datasetで学習したテキスト検出モデルは,ベンチマークdatasetでfine-tuneせずともSOTAに匹敵する精度を実現
その他(なぜ通ったか?等)
https://github.com/google-research-datasets/hiertext
- …
- …