- …
- …
#157 #acl2020
summarized by : koji hisaka
概要
科学文書からの情報抽出(IE)は、科学文書の中心的な情報を読者に導くために使用することができます。しかし、狭義のIEシステムでは、捕捉された情報のごく一部しか抽出できず、オープンIEシステムでは、科学文書で遭遇する長文で複雑な文章をうまく処理することができません。本研究では、両タイプのシステムの出力を組み合わせてセミオープン関係抽出を実現する。
新規性
まず、Focused Open Biological Information Extraction (FOBIE)データセットを提示し、FOBIEを使用して、生物学テキストの中心となるトレードオフ関係と論証を抽出するための最新のナロー科学的IEシステムを訓練する。次に、10,000件のオープンアクセスの科学的生物学テキストのコーパスに対して、ナローIEシステムと最新のオープンIEシステムの両方を実行した。
結果
その結果、かなりの量(65%)の間違ったOpen IEの抽出物や情報に乏しいOpen IEの抽出物が、ナローIEの抽出物を用いてフィルタリングできることを示した。さらに、保持された抽出物の方が、読者にとって有益な情報を得ることができることを示した。
- …
- …