內容簡介
本書主要從語義模型詳解、自然語言處理系統基礎算法和系統案例實戰三個方面,介紹了自然語言處理中相關的一些技術。對於每一個算法又分別從套用原理、數學原理、代碼實現,以及對當前方法的思考四個方面進行講解。本書面向的讀者為有志於從事自然語言處理相關工作的在校學生、企事業單位工作人員等人群。本書的結構是由淺入深地進行相關內容的介紹,以滿足不同層次讀者的學習需求。
目錄信息
第1篇語義模型詳解
第1章關鍵字抽取模型 3
1.1 TF-IDF算法實現關鍵字抽取 4
1.2 TextRank算法實現關鍵字抽取 11
1.3 基於語義的統計語言模型實現關鍵字抽取 16
第2章短語抽取模型 22
2.1 基於互信息和左右信息熵實現短語抽取 23
2.2 TextRank算法實現短語抽取 28
2.3 LDA算法實現短語抽取 31
第3章自動摘要抽取模型 38
3.1 決策樹算法實現自動摘要 39
3.2 基於邏輯回歸算法實現自動摘要 44
3.3 貝葉斯算法實現自動摘要 50
第4章深度學習——計算任意詞距離模型 55
4.1 FP-Growth算法實現詞距離計算 56
4.2 N-Gram算法實現詞距離計算 61
4.3 BP算法實現詞距離計算 65
第5章拼音漢字混合識別模型 70
5.1 貝葉斯模型實現拼音漢字混合識別 71
5.2 HMM模型實現拼音漢字混合識別 75
5.3 RNN神經網路模型實現拼音漢字混合識別 80
第6章文本自動生成模型 87
6.1 基於關鍵字的文本自動生成模型 88
6.2 RNN模型實現文本自動生成 93
第2篇自然語言處理系統基礎算法
第7章Dijkstra算法 101
7.1 算法套用原理介紹 102
7.2 算法數學原理介紹 102
7.3 算法源碼說明 106
7.4 算法套用擴展 107
第8章AC-DoubleArrayTrie算法 108
8.1 算法套用原理介紹 109
8.2 算法數學原理介紹 111
8.3 算法套用擴展 116
第9章最大熵算法 117
9.1 算法套用原理介紹 118
9.2 算法數學原理介紹 119
9.3 算法源碼說明 124
9.4 算法套用擴展 125
第10章CRF算法 126
10.1 算法套用原理介紹 127
10.2 算法數學原理介紹 130
10.3 算法源碼說明 135
10.4 算法套用擴展 136
第11章馬爾可夫邏輯網算法 137
11.1 算法套用原理介紹 138
11.2 算法數學原理介紹 142
11.3 算法源碼說明 144
11.4 算法套用擴展 145
第12章DIPRE算法 147
12.1 算法套用原理介紹 148
12.2 算法數學原理介紹 151
12.3 算法源碼說明 152
12.4 算法套用擴展 153
第13章LSTM算法 155
13.1 算法套用原理介紹 156
13.2 算法數學原理介紹 158
13.3 算法源碼說明 163
13.4 算法套用擴展 165
第14章TransE算法 166
14.1 算法套用原理介紹 167
14.2 算法數學原理介紹 170
14.3 算法源碼說明 172
14.4 算法套用擴展 174
第3篇系統案例實戰
第15章搭建輿情分析與挖掘的系統 177
15.1 系統功能設計簡述 178
15.2 系統模組實現詳解 181
15.3 系統實現源碼說明 186