summarized by : cfiken
Conversational Graph Grounded Policy Learning for Open-Domain Conversation Generation

概要

雑談対話システムにおいて、対話の遷移をグラフ (Conversational Graph; CG) として表現し、それをもとに返答の policy を学習する手法 CG-Policy を提案。 対話データから、頂点をコンテンツを表す what とどう返答するかの how で定義、辺を決めて CG を構築し、長期的な一貫性を保ちながら対話フローを探索するる。 2つのタスクでの実験で、一貫性や policy のコントロールの有効性を確認した。
placeholder

新規性

対話の遷移をグラフとして表現し、返答をするシステムの考案。

結果

Weibo, Persona chat (target-guided タスクとして利用) のデータセットで検証。ベースラインモデルには他の policy learning モデルである LaRM, ChatMore, TGRM, TGRM-Target と比較。 自動評価、人手評価ともに、 coherent/appropriate がベースラインに比べて大きく改善、かつ他も平均的に高いスコアとなった。 Target-guided task においても、提案手法 CG-Policy が 98 %最も高い成功率を達成し、policy の制御が可能であることを示した。