Document Structure Extraction using Prior based High Resolution Hierarchical Semantic Segmentation

#18

summarized by : Shintaro Yamamoto

Mausoom Sarkar, Milan Aggarwal, Arneh Jain, Hiresh Gupta, Balaji Krishnamurthy

文書からの構造抽出は，HTMLへの変換など多くの応用が考えられる．文書画像を入力として，文書中の各要素をセグメンテーションのタスクとして抽出する手法を提案．

画像に変換した文書から要素を抽出する階層的なネットワークを提案．また，従来手法は粗い要素わけがされていたことから，文書中の各要素を階層的に分類し，新たなデータセットを構築した．

入力が高解像の時，要素抽出が上手くいくことを確認．また，従来データセットにより既存手法よりも精度が高いことを確認した．

このページで利用されている画像は論文から引用しています．