summarized by : koji hisaka
Enhancing Answer Boundary Detection for Multilingual Machine Reading Comprehension

概要

多言語の事前学習モデルは、豊富なソース言語(英語など)からの学習データを活用して、低リソース言語での性能を向上させることができる。しかし、多言語機械読解(Machine Reading Comprehension: MRC)タスクにおける伝達効果は、文分類タスクに比べて大幅に劣る。本論文では、微調整段階でのフレーズ境界監視を追加的に導入するために、以下の2つの補助タスクを提案する。
placeholder

新規性

(1)質問やパッセージを他言語に翻訳し、言語間の質問とパッセージのペアを構築する混合MRCタスクと、 (2)ウェブから収集した知識フレーズを利用した言語にとらわれない知識マスキングタスクである。

結果

2つの言語横断的なMRCデータセットを用いた広範な実験により、我々の提案するアプローチの有効性が示された。