Data-Efficient Goal-Oriented Conversation with Dialogue Knowledge Transfer Networks

#34 #emnlp2019

summarized by : Katsuya Shimabukuro

Igor Shalyminov, Sungjin Lee, Arash Eshghi, Oliver Lemon

概要

ソースドメインの対話データおよび数個のターゲットドメインの対話データのみを用いた、End2Endなタスク指向対話システムのドメイン適用のタスクにおいて、対話の構造を捉えるような2つの事前学習と事前学習済みのELMo、コピーメカニズムを併用する生成器を使用することにより、ベースラインや既存手法を上回る性能を示した

新規性

ソースドメインによる事前学習にて、ユーザー発話から前後のシステムの発話を再構成するDI-VAEと、対話履歴からシステムの発話を再構成するDI-VAEを事前学習、コンテキストとユーザー発話を入力として、それぞれのDI-VAEが出力する潜在変数、事前学習済みのELMoのEmbeddingをもとに、システム発話を再構成するようにターゲットドメインで学習する

結果

Stanford Multi-Domainデータセットにおいて、ターゲットドメインの対話データが1%（約10個）の設定にて、数百個のドメイン内の発話文でドメイン適用を行う既存手法を上回る性能を示した。また、提案手法と同じ学習設定の複数のベースラインと比較して、上回る性能を示した。

このページで利用されている画像は論文から引用しています．