summarized by : cfiken
Diversifying Dialogue Generation with Non-Conversational Text

概要

対話システムにおいて、モデルの生成が単調で面白みのないもの ( I don't know. や OK. など)になりがちという課題に対して、大量の非対話データを用いてモデル生成の多様性を上げる手法を提案。対話データに back-translation を適用し得られたモデルを非対話データにも活用する手法で、他のスコアを維持したまま多様な生成が増えたことを人手評価で確認した。
placeholder

新規性

話題や言い回しのカバー範囲の狭い対話コーパスに対して、様々な話題や表現のある非対話コーパスを対話に組み合わせている。 また、back-translation を対話ドメインで使用するのは初。

結果

中国語の対話データセットと、複数のベースラインモデルを用いて実験。自動評価指標で多様性の度合いの計測と、人手評価により多様性や関連性、流暢さなどを検証。提案手法が最も、基本的なスコアを維持したまま多様性を向上させている。