summarized by : uchi_k
OpinionDigest: A Simple Framework for Opinion Summarization

概要

学習のために要約文を必要としない教師なし複数文書要約フレームワークを提案している。入力は文書ではなく事前抽出された意見フレーズになっていて、この意見フレーズからもとのレビューを再構築する transformer を学習するのが第一ステップで、続いて複数文書から代表的な意見フレーズを抽出し、この意見フレーズから transformer を用いて要約レビューを生成している。
placeholder

新規性

ブラックボックス的な扱いだった end-to-end の中身の部分を解釈可能なものに置き換えフレームワークとして完成させている点が新しい。より具体的には、aspect や sentiment でフィルタリングできるようになっている。

結果

Yelp のレビューデータセットの ROUGE スコアで SoTA。また、生成された要約を情報量、一貫性、非冗長性の3つの基準で人で評価した。情報量、一貫性で既存手法を上回る結果が得られたが、提案手法はやや冗長であるという評価となった。さらに、生成されたレビューと実際のレビュー群を比較し、どれくらい内容が合っているかの人手評価でも最も良い結果が得られた。また、本論文の特徴である、aspect でフィルタした要約もできていそうなことが示されている。また、入力文書が多くなった場合でも安定した出力が得られている。