summarized by : Katsuya Shimabukuro
Automatically Learning Data Augmentation Policies for Dialogue Tasks

概要

対話応答生成のタスクにおいて、ルールベースのデータ拡張手法の組み合わせを自動選択し適用する手法を提案。データ拡張手法を全て適用する場合なども含め、自動評価および人間評価で上回る性能を示した
placeholder

新規性

12種類のルールベースのデータ拡張操作およびそれぞれ40パターンのパラメーターを出力するポリシーモデルを提案。データ拡張したモデルの学習結果を元に強化学習でポリシーモデルの学習を行う。データ拡張対象テキストを利用するモデルと利用しないモデルの2種類を提案

結果

Ubuntuコーパスを使用した対話の応答生成タスクにおいて、提案手法で獲得したデータ拡張手法で学習したモデルは、データ拡張を行わかった場合や全てのデータ拡張手法を適用した場合に比べて高いF1値、および相対的に良い人間評価を獲得した