#16
summarized by : Atsuki Osanai
Towards End-to-End Unified Scene Text Detection and Layout Analysis

どんな論文か?

Layout Analysis(タイトル,パラグラフなどのセグメンテーション)の従来手法では,テキスト検出とそのグルーピングが別々に扱われていた.本研究ではそれらを統合しEnd-to-Endで学習する方法を提案.MaX-DeepLabを用いたテキストのインスタンスセグメンテーション→インスタンスベースのAffinity Matrixを用いたグルーピングを行う.
placeholder

新規性

・ワード,ライン,パラグラフのように階層的なアノテーションを施したHier Datasetを構築 ・テキスト検出とそのグルーピングをEnd to Endで行うモデルの提案

結果

・Layout analysisのベンチマークにおいて,GCNやインスタンスセグメンテーションの手法を上回る精度を達成 - Hier datasetで学習したテキスト検出モデルは,ベンチマークdatasetでfine-tuneせずともSOTAに匹敵する精度を実現

その他(なぜ通ったか?等)

https://github.com/google-research-datasets/hiertext