summarized by : siida
Unsupervised Opinion Summarization with Noising and Denoising

概要

新聞記事以外の要約データは入手し辛く、抽象型要約において問題となっている。そこで本論文では要約のない文書から教師あり学習を行う手法を提案する。
placeholder

新規性

二種類のノイズを付与。(1) 単語やチャンクを似ているもので置き換える; (2) 意味的に似た文書で置き換える; このようにして作成したノイズ付きレビューからノイズを除去するモデルを訓練する。推論時にはノイズのないデータを入力し、重要な情報を抜き出すことで要約を実施する。またモデルのアーキテクチャには、二種類のノイズを並列して受け取るマルチソースモデルを使用している。

結果

教師なし学習でありながら、教師あり学習モデルに近いROUGEスコアを挙げた。特にRotten TomatoesにおけるR1スコアでは教師あり学習手法の最高値を0.07ポイント上回った。