summarized by : Shintaro Yamamoto
Cross-Lingual Abstractive Summarization with Limited Parallel Resources

概要

入力文章に対して他の言語で要約するcross-lingual summarizationでは,学習に用いることができるコーパスを手に入れるのが難しい.言語リソースが不十分な場合におけるcross-lingual summarization手法を提案.
placeholder

新規性

出力の要約を,入力と同じ言語の要約と生成したい言語の要約の2つを結合したものとして扱う.対象言語の要約を生成する際には,decoderはencoderの出力と元の言語の要約の2種類の情報を見ることになる.学習データの規模が不十分な場合,通常の要約データセットで言語を変換しない要約生成を学習した後に,cross-lingual summarizationを学習する2段階の学習を行う.

結果

英語と中国語のデータセットであるEn2ZhSum, Zh2EnSum CLSデータセット及び,新たに作成した英語とドイツ語のデータセットであるEn2DeSumを使用.ROUGEとBERTScoreによる評価ではZh2EnSumとEn2DeSumでは提案手法がベースラインを上回った一方,En2ZhSumでは性能が低くなってしまった.