summarized by : Shintaro Yamamoto
Sachin Raja, Ajoy Mondal, C V Jawahar
画像化された表から数値などの情報を抜き出すことで,XMLに変換する手法を提案.従来研究はPDF中のメタデータなどを利用するのに対し,画像情報のみを利用する手法を提案.
表画像を入力とするEnd-to-Endのモデルを提案.入力画像より表の構成要素を抜き出すTop-Downな処理及び,検出された各要素から表の構造を推測するBottom-Upな処理により構成されている.
8種類のデータセットにより有効性を示した.