summarized by : 日坂 幸次
RepSum: Unsupervised Dialogue Summarization based on Replacement Strategy

概要

対話要約の分野では、学習データが少ないため、教師付き要約生成手法が対話文脈から重要な情報を学習することが困難な場合が多い。 これまでにも、意味情報のみを利用した教師なし要約や、自動符号化(文の圧縮)などの手法が提案されてきたが、対話文は単語数が少なく、また対話文と要約文の間に大きな隔たりがあるため、これらの手法を対話文に適用することはできない。

新規性

本研究では、この課題を解決するために、新しい教師なし戦略を提案する。この戦略は、優れた要約は元の対話の置き換えに近似しており、対話生成などの補助的な(教師なしの)タスクでは、両者はほぼ同等であるという仮説的な基盤に基づいている。 提案された戦略RepSumは、後続のn番目の発話の生成と分類のタスクに導かれて、抽出的な要約と抽象的な要約の両方を生成するために適用される。

結果

様々なデータセットを用いた広範な実験により、提案モデルが他の教師なし手法と比較して優れていることを示す。