summarized by : taichi murayama
Tree-Structured Neural Topic Model

概要

木構造トピックモデルの構築に,autoencoding variational Bayes (AEVB)に基づいたニューラルネットワークベースの構造に置き換えることで,既存の確率モデルよりもデータに対するscalabilityを向上させ,downstreamのタスクにも応用可能なモデルを提案

新規性

・木構造の兄弟と親子間の関係を捉えるための再帰的モデル doubly-recurrent neural network (DRNN)を用いることで,各トピックのembeddingを獲得して,AEVBに基づいて文書内の単語の事後分布推定を行った. ・また,トピック内に存在する単語の割合に基づいて閾値を設定し,動的にトピック数や子供の数を決定していく手法を導入

結果

20Newsとamazon product reviewのデータセットを用いて,PerplexityとNPMI (正規化事故相互情報量)の観点で検証し,比較手法と強豪する精度であることを確認. 更に木構造における親子関係の類似度を測定したところ,顕著に比較手法よりも向上していた.