summarized by : sobamchan
Extractive Summarization as Text Matching

概要

extractive summarization に取り組んでいる従来の手法では,結果として一般性の高い文を一つ一つ出力するように学習するため,冗長性の高い結果となってしまう. これを解決するために,正しい要約文は元の文書との距離が他の要約文候補と比較して近くなるはずという前提に基づいて,margin-based triplet loss を設定し BERT の fine-tune を行った. 推論時には,文書から要約としてふさわしい文に高いスコアをつけることのできる関数として,この fine-tune された Siamese-BERT を利用する.
placeholder

新規性

extractive summarization タスクをテキストマッチング問題として捉えることで,複数の文からなる要約でも冗長性を抑えることのできる手法の提案.

結果

要約タスクで多く利用されるCNN/DM データセットや,Reddit,XSum のような短い要約の生成を求められるタスクにおいて,強力な baselines を上回る性能を達成した.