隱含狄利克雷分布

Dirichlet David Michael

隱含狄利克雷分布簡稱LDA(LatentDirichletallocation),是一種主題模型,它可以將文檔集中每篇文檔的主題按照機率分布的形式給出。同時它是一種無監督學習算法,在訓練時不需要手工標註的訓練集,需要的僅僅是文檔集以及指定主題的數量k即可。此外LDA的另一個優點則是,對於每一個主題均可找出一些詞語來描述它。
LDA首先由Blei,DavidM.、吳恩達和Jordan,MichaelI於2003年提出[1],目前在文本挖掘領域包括文本主題識別、文本分類以及文本相似度計算方面都有套用。

相關詞條

熱門詞條

聯絡我們