summarized by : koji hisaka
A Novel Cascade Binary Tagging Framework for Relational Triple Extraction

概要

構造化されていないテキストから関係性トリプル(主語、関係、目的語)を抽出することは、大規模ナレッジグラフ構築のために非常に重要である。しかし、同一文中の複数の関係性トリプルが同じ実体を共有するオーバーラップトリプル問題を解決することに優れた既存の研究は少ない。
placeholder

新規性

本研究では、関係性トリプル抽出タスクを再検討するための新たな視点を導入し、原理的な問題定式化から派生した新しいカスケードバイナリタグ付けフレームワーク(CASREL)を提案する。この新しいフレームワークでは、従来のように関係を離散的なラベルとして扱うのではなく、関係を主語と文中のオブジェクトを対応付ける関数としてモデル化することで、重複問題を自然に処理する。

結果

実験の結果、CASRELフレームワークは、エンコーダモジュールがランダムに初期化されたBERTエンコーダを使用している場合でも、すでに最新の方法よりも優れていることが示されており、新しいタグ付けフレームワークの威力を示しています。CASRELフレームワークは、事前に訓練されたBERTエンコーダを使用した場合、さらに性能を向上させ、2つの公開データセットNYTとWebNLGで、それぞれF1スコアで17.5と30.2の絶対利得を獲得し、最強のベースラインを上回る性能を発揮します。トリプルが重複するさまざまなシナリオでの詳細な解析により、この手法がこれらすべてのシナリオで一貫した性能向上を実現していることが示されています。