スケジュール
メンバー
リソース
論文サマリ
ACL 2019
EMNLP 2019
ACL 2020
ACL 2021
cvpaper.challenge
«
‹
1
2
3
4
…
›
»
#3
#acl2019
summarized by : Shion Honda
Large Dataset and Language Model Fun-Tuning for Humor Recognition
Vladislav Blinov, Valeria Bolotova-Baranova, Pavel Braslavski
概要
Shion Honda
新規性
うち半分にジョークを含む3万のロシア語の短文からなるデータセットを作成した。3種のデータセットから人手ラベリングにより2000程度の信頼性の高いデータを作成。これでULMFiTをファインチューニングしたULMFunでラベルを3万まで増やした。
結果
ジョークのデータセットとしてはすべての言語において最大規模のデータセット。
«
‹
1
2
3
4
…
›
»