隱含狄利克雷分布簡稱LDA(LatentDirichletallocation),是一種主題模型,它可以將文檔集中每篇文檔的主題按照機率分布的形式給出。同時它是一種無監督學習算法,在訓練時不需要手工標註的訓練集,需要的僅僅是文檔集以及指定主題的數量k即可。此外LDA的另一個優點則是,對於每一個主題均可找出一些詞語來描述它。
LDA首先由Blei,DavidM.、吳恩達和Jordan,MichaelI於2003年提出[1],目前在文本挖掘領域包括文本主題識別、文本分類以及文本相似度計算方面都有套用。
相關詞條
-
狄利克雷分布
狄利克雷分布(Dirichlet distribution)或多元Beta分布(multivariate Beta distribution)是一類在實...
歷史 定義 性質 數值模擬 推廣 -
量子理論
,包括自由電子的能量分布以及導電機理,能帶理論及對導體、絕緣體、半導體性能...稱為“紫外災難”。對麥可遜-莫雷實驗所得出的“零結果”更是令人費解,實驗...放射性元素釙和鐳 1899--1900 盧梅爾和魯本斯等人 發現熱輻射能量分布...
簡介 基本介紹 量子力學 發展簡史 量子理論的發展與建立 -
主題模型
、Andrew Ng和Jordan I. Michael提出了隱含狄利克雷分布(Latent Dirichlet Allocation, LDA...由Wei Li和Andrew McCallum提出的彈珠機分布模型...
歷史 理論 套用 -
卍解
說到卍字相是右旋。但是《陀羅尼集經》第十卷所示摩利支天像所拿的扇子中,所畫...左旋,但是多數的記載是右旋。最早在印度教的主神,如毗濕奴及克利辛那,胸前...,卍和寶瓶等是象徵吉祥的八件物品之一。卍在梵文里,音室利蹉洛剎曩,意為...
基本介紹 歷史介紹 其他解釋 符號來源 象徵 -
卍[符號]
圖案不僅分布的面積相當廣(遍布西部、北部、南部);而且其延續的時期也相當...利靺蹉洛剎那),漢語讀音萬,日語讀まん(man)。佛教區用卐的佛教區1...)內白(象徵民族主義)加黑卐(錯誤認為象徵雅利安人)”的組合體,由於很多人...
“卍”的含義 卍與卐 佛教區 哲學看法 漢字信息 -
期望最大化
是語言建模問題中的隱含狄利克雷分布(latent dirichlet... 。1970年,B. J. N. Blight使用MLE對指數族分布的I型刪... 。Rolf Sundberg在1971至1974年進一步發展了指數族分布樣本...
歷史 理論 算法 性質 套用 -
最大期望算法
算法 最大期望算法 使用VBEM的常見例子是語言建模問題中的隱含狄利克雷...MLE對指數族分布的I型刪失數據(Type I censored data...1974年進一步發展了指數族分布樣本的MLE並給出了疊代計算的完整推導...
歷史 理論 算法 性質 套用 -
王莉考研數學系列用書:考研數學複習教程
考查狄利克雷收斂定理問題2.求函式的傅立葉級數展開式問題強化訓練...問題2.利用基本方法計算二重積分3.被積函式為分段函式及隱含分段...機率問題強化訓練(一)第二章隨機變數及其分布一、考核內容要點...
內容簡介 圖書目錄 編輯推薦 目錄 -
潘成棟
~1960年,主要從事L—函式零點的分布研究,首先得出關於算術級數中最小素數...中國科學院院士,1995年獲香港何梁何利基金科學與技術進步獎。 生前還擔任中共... zeta函式與DirichletL函式的零點分布、Selberg篩法等,相繼...
概述 個人簡介 人物生平 培育人才 大學校長