#50
summarized by : 日坂 幸次
TGRNet: A Table Graph Reconstruction Network for Table Structure Recognition

どんな論文か?

データを行と列に配置する表は、非常に効果的なデータ構造であり、ビジネスや科学研究で広く利用されています。 オンラインやオフラインの文書に含まれる大規模な表データを考慮すると、表の自動認識は文書分析コミュニティからの注目を集めています。 人間は表の構造を容易に理解することができますが、機械がそれを理解することは、特に様々な異なる表のレイアウトやスタイルのために、依然として困難です。

新規性

本論文では,表構造認識の問題を表グラフの再構成として再定式化し,表構造認識のためのエンド・ツー・エンドの学習可能な表グラフ再構成ネットワーク(TGRNet)を提案する. 具体的には,提案手法は,セル検出ブランチとセル論理位置ブランチの2つの主要なブランチを持ち,以下のように構成される. 異なるセルの空間的位置と論理的位置を共同で予測する.

結果

3つの一般的な表認識データセットと、表グラフのアノテーションを含む新しいデータセット(TableGraph-350K)を用いた実験結果により、提案するTGRNetが表構造認識に有効であることを実証した。 コードとアノテーションは https://github.com/xuewenyuan/TGRNet で公開される予定です。

その他(なぜ通ったか?等)