summarized by : ryo.igarashi
ZeroShotCeres: Zero-Shot Relation Extraction from Semi-Structured Webpages

概要

「ゼロショット」オープンドメイン(特定のWebサイトのような情報抽出テンプレートに合わせて学習したモデルと異なるドメイン)の関係性抽出のための手法を提案。テキストフィールド間のレイアウト関係をGNN(グラフニューラルネットワーク)で学習することで、学習データに表現されていないWebサイトから情報を抽出する。
placeholder

新規性

視覚情報、レイアウト情報、テキスト情報を含むマルチモーダル情報を統合したGNNを導入、半構造化されたWebサイトから事前知識や学習データを持たずにオープンな情報抽出を可能にした。

結果

OpenIE, CloseIEのそれぞれについてSWDE Datasetの拡張データセットで評価を実施。OpenIEのベースラインと比較して31%の精度向上(F1)を達成した。