summarized by : Shintaro Yamamoto
Mausoom Sarkar, Milan Aggarwal, Arneh Jain, Hiresh Gupta, Balaji Krishnamurthy
文書からの構造抽出は,HTMLへの変換など多くの応用が考えられる.文書画像を入力として,文書中の各要素をセグメンテーションのタスクとして抽出する手法を提案.
画像に変換した文書から要素を抽出する階層的なネットワークを提案.また,従来手法は粗い要素わけがされていたことから,文書中の各要素を階層的に分類し,新たなデータセットを構築した.
入力が高解像の時,要素抽出が上手くいくことを確認.また,従来データセットにより既存手法よりも精度が高いことを確認した.