summarized by : taichi murayama
Predicting the Growth of Morphological Families from Social and Linguistic Factors

概要

ソーシャルメディアで多くの単語が出現し,変化していっている.例:”trump” → “trumpish”,”trumpy”など. 本研究では,ソーシャルメディア上における形態素の量がどのようになるのかを予測を行うタスク:Morphological Family Expansion Prediction (MFEP)を提案し,ベースラインとなるモデルを構築.
placeholder

新規性

形態素の変化を分析する研究は多く存在したが,形態素の変化量を予測し,どういった特徴量が有効なのかを分析した研究を初めて行った. 本研究タスクにおいて,「どのような特徴が形態素量のtoken量に影響を与えるのか?」といった計算社会科学的観点からも有用な点を理解するために,ランダムフォレストで予測モデルを構築し,各特徴の重要度について明らかにした点.

結果

本タスクで提案した将来の特定の形態素量を予測する実験 (MEFP)において,morphological family size (形態素の関連語のトークン量)が形態素の動的な変化を捉えるのに有効であることを明らかにした. また発言したユーザサイズなども特徴量として,どのような特徴が有用なのかどうかを明らかにした.