內容簡介
隨著網際網路技術的快速發展和廣泛套用,網路媒體已經成為重要的信息傳播和交流平台,同時也是網路輿情形成和傳播的主要載體。網路輿情通常由突發社會公共事件觸發,反映了人們對某一公共事件所表達的認知、態度、情感和傾向性,具有虛擬化、快捷化、多元化、開放性、匿名性及互動性等特點。隨著網路輿論影響力的增強,網路輿情已經成為各級政府了解社情民意的重要視窗。 隨著網路輿論對社會和公眾影響的不斷增大,出現了網路炒作、造謠傳謠等不良的現象,損害了網路媒體公信力,擾亂了網路正常傳播秩序,產生了錯誤的輿論導向,極易引發社會群體性事件。因此,加強網際網路管理和輿論治理非常重要和必要。 國家大力推進網路輿情監控體系建設,加強對網路輿情監測和引導。網路輿情監測系統在網際網路輿情監測中發揮了重要的作用,其系統核心技術就是網路輿情分析技術。網路輿情分析技術主要涉及網路信息採集技術、網路輿情傳播機制、話題檢測與跟蹤技術、文本分割技術、文本情感分析技術等。本書主要介紹了網路輿情分析所涉及的主要方法和關鍵技術,全書共有7章,分別介紹了網路輿情概論、網路信息採集技術、微博網路信息傳播機制、網路論壇輿情傳播機制、話題檢測與跟蹤技術、文本分割技術和文本情感分析技術。在介紹主要模型和算法時,還給出了模型和算法的實驗驗證,以便讀者加深對模型和算法的理解。本書可作為網路空間安全學科相關專業的研究生和本科生教材,也可作為從事相關工作的科技人員及管理人員的參考書。
圖書目錄
第1章 網路輿情概論 1
1.1 網路輿情概述 1
1.1.1 輿情與輿論 1
1.1.2 網路輿情 2
1.1.3 網路輿情演化 3
1.1.4 網路輿情實例 5
1.2 網路輿論空間治理 8
1.2.1 網路炒作問題 8
1.2.2 網路大V問題 9
1.2.3 政務微博作用 10
1.3 網路輿情傳播平台 13
1.3.1 微博網路 13
1.3.2 網路論壇 15
1.4 網路輿情分析技術 16
1.4.1 網路輿情監測系統 16
1.4.2 網路信息採集技術 17
1.4.3 話題檢測與跟蹤技術 20
1.4.4 文本情感分析技術 22
第2章 網路信息採集技術 25
2.1 引言 25
2.2 搜尋引擎概念 25
2.2.1 通用搜尋引擎 25
2.2.2 主題搜尋引擎 27
2.3 網路蜘蛛概念 29
2.3.1 基本概念 29
2.3.2 通用蜘蛛 29
2.3.3 主題蜘蛛 32
2.4 網頁搜尋算法 34
2.4.1 網頁特徵選取 34
2.4.2 網頁搜尋算法 36
2.4.3 連結分級搜尋 41
2.5 網頁相似度計算 43
2.5.1 向量空間模型 44
2.5.2 相似度計算 45
2.6 主題蜘蛛組成 48
2.6.1 系統結構 48
2.6.2 主題確立模組 49
2.6.3 爬行模組 49
2.6.4 相似度計算模組 53
2.6.5 搜尋策略模組 53
2.6.6 系統界面 54
第3章 微博網路信息傳播機制 56
3.1 引言 56
3.2 微博用戶轉發特性 57
3.2.1 轉發行為特性 57
3.2.2 轉發特性分析 61
3.3 微博轉發行為預測 66
3.3.1 預測算法 66
3.3.2 算法驗證 72
3.4 微博轉發峰值分析 76
3.4.1 時間序列概念 76
3.4.2 峰值特性分析 77
3.5 微博意見領袖識別 87
3.5.1 識別方法 87
3.5.2 算法驗證 89
第4章 網路論壇輿情傳播機制 94
4.1 引言 94
4.2 網路論壇輿情形成模型 95
4.2.1 網路論壇結構 95
4.2.2 輿情形成模型 96
4.2.3 模型驗證 98
4.3 網路論壇意見領袖識別 100
4.3.1 論壇有向網路圖模型 101
4.3.2 論壇意見領袖識別算法 102
4.3.3 算法驗證 103
4.4 網路水軍熱帖檢測 106
4.4.1 熱點話題特徵提取 107
4.4.2 水軍熱帖檢測算法 110
4.4.3 算法驗證 110
4.5 網路水軍賬號檢測 112
4.5.1 檢測算法 113
4.5.2 算法驗證 116
第5章 話題檢測與跟蹤技術 119
5.1 引言 119
5.2 基本概念 120
5.2.1 TDT目標和任務 120
5.2.2 TDT語料 122
5.2.3 TDT評價指標 122
5.3 相關技術 124
5.3.1 表示模型 124
5.3.2 相似度計算 125
5.3.3 特徵項選取 126
5.3.4 文本聚類 127
5.3.5 文本分類 130
5.4 話題檢測算法 133
5.4.1 K-MEANS算法 133
5.4.2 模糊聚類方法 135
5.4.3 蟻群聚類算法 138
5.4.4 算法驗證 139
5.5 話題跟蹤算法 145
5.5.1 KNN算法及改進 145
5.5.2 算法驗證 146
5.6 熱點話題檢測 148
5.6.1 檢測方法 148
5.6.2 算法驗證 151
第6章 文本分割技術 155
6.1 引言 155
6.2 基本概念 156
6.2.1 文本分割點 156
6.2.2 文本分割方法 157
6.2.3 文本分割算法評價 159
6.3 基於LDA模型的文本分割 161
6.3.1 LDA模型 161
6.3.2 LDA模型改進 165
6.3.3 相似度計算 167
6.3.4 邊界識別策略 168
6.3.5 算法驗證 169
6.4 基於VSM模型的文本分割 174
6.4.1 特徵項選取 174
6.4.2 語義段分割方法 176
6.4.3 算法驗證 179
第7章 文本情感分析技術 181
7.1 引言 181
7.2 基本概念 182
7.2.1 文本情感分析層次 182
7.2.2 文本情感分析方法 184
7.2.3 語言建模方法 184
7.3 句子情感分析方法 185
7.3.1 主題句識別方法 185
7.3.2 主觀句識別方法 189
7.3.3 主觀關係識別方法 192
7.3.4 算法驗證 195
7.4 段落情感分析方法 198
7.4.1 語義段句子情感標註 199
7.4.2 語義段句子權重計算 199
7.4.3 語義段情感計算方法 200
7.4.4 算法驗證 202
7.5 文本情感分析模型 205
7.5.1 文本情感模型 205
7.5.2 模型參數估計 208
7.5.3 語言模型評價 209
7.5.4 算法驗證 211
參考文獻 214