雲模型與文本挖掘

雲模型與文本挖掘

《雲模型與文本挖掘》是2013年人民郵電出版社出版的圖書,作者是代勁,宋娟,胡峰,伍建全等編著。

圖書簡介

作者:代勁,宋娟,胡峰,伍建全等編著
出版社: 人民郵電出版社
出版年: 2013-2
頁數: 170
定價: 48.00元
ISBN: 9787115300324

圖書簡介

《雲模型與文本挖掘》在當前文本挖掘領域中,傳統的數據挖掘方法依然占據著主導地位。然而隨著文本挖掘研究的深入,面臨著越來越嚴峻的挑戰。這些挑戰歸根到底是由於自然語言的不確定性造成的。藉助不確定性知識研究的重要工具——雲模型在定性概念與定量數據間的轉換作用,《雲模型與文本挖掘》作者代勁、宋娟、胡峰、伍建全將其引入到文本挖掘關鍵問題研究中,力圖降低自然語言中的不確定性知識對文本挖掘性能的影響。在充分利用現有技術的基礎上,作者進行了一些大膽的嘗試,努力探索出適用於文本挖掘的不確定性人工智慧處理方法,用以拋磚引玉,為文本挖掘技術的進一步發展提供一種新的思路與解決方法。

圖書目錄

第1章 緒論
1.1 文本挖掘的產生背景
1.2 文本挖掘的重要意義
1.2.1 推進信息化建設
1.2.2 提高信息利用效率
1.2.3 提高人工智慧水平
1.2.4 保障決策支撐
1.3 不確定性人工智慧及其研究方法
1.3.1 不確定性人工智慧概述
1.3.2 不確定性人工智慧的主要研究內容
1.3.3 不確定性人工智慧的主要研究方法
第2章 文本挖掘及其關鍵問題
2.1 引言
2.2 文本挖掘
2.2.1 文本挖掘定義
2.2.2 文本挖掘流程
2.3 文本挖掘研究基礎
2.3.1 國內外研究現狀
2.3.2 面臨的問題
2.4 文本挖掘的關鍵問題
2.4.1 文本表示及特徵提取
2.4.2 文本特徵權重計算方法
2.4.3 文本分類系統概述及套用
2.4.4 文本聚類系統概述及套用
2.5 文本挖掘面臨的機遇及挑戰
2.6 本章小結
第3章 雲模型及其在文本挖掘中的理論擴充
3.1 引言
3.2 知識的不確定性
3.2.1 知識的隨機性
3.2.2 知識的模糊性
3.2.3 隨機性與模糊性之間的內在聯繫
3.2.4 自然語言的不確定性
3.3 雲模型
3.3.1 自然語言
3.3.2 自然語言中的概念與知識表示
3.3.3 概念中隨機性與模糊性的關聯性
3.3.4 雲模型
3.3.5 雲模型數字特徵
3.3.6 雲規則發生器
3.3.7 正態雲及其普適性
3.3.8 雲模型常用算法
3.3.9 雲模型主要套用
3.4 基於雲模型的概念層次劃分
3.4.1 概念層次
3.4.2 概念層次的自動生成
3.4.3 雲變換
3.5 基於VSM模型的文本知識表示
3.5.1 基於VSM模型的文本表示
3.5.2 基於信息表的文本知識表示
3.5.3 基於雲模型的文本信息錶轉換
3.6 基於雲相似度的文本相似度量
3.6.1 文本挖掘中的相似度量
3.6.2 雲相似度及文本雲相似度量
3.7 本章小結
第4章 雲模型與粒計算
4.1 引言
4.2 粒計算及粒度原理
4.2.1 粒計算概述
4.2.2 粒計算基本問題及主要理論方法
4.2.3 粒計算研究進展
4.2.4 粒計算面臨的挑戰
4.3 基於雲模型的快速信息粒化
4.3.1 從粒計算角度看知識的不確定性
4.3.2 雲模型下的概念粒子
4.3.3 基於雲模型的信息粒化算法
4.4 套用分析與討論
4.5 本章小結
第5章 基於雲模型的文本特徵自動提取
5.1 引言
5.2 文本特徵降維
5.2.1 文本特徵矩陣降維
5.2.2 文本特徵選擇
5.2.3 常用特徵選擇方法
5.3 基於雲模型的文本特徵自動提取算法
5.3.1 基於統計量的文本特徵分布矩陣
5.3.2 算法描述
5.3.3 實驗及分析
5.4 本章小結
第6章 基於雲概念躍升的文本分類
6.1 引言
6.2 文本分類概述
6.2.1 文本分類產生背景
6.2.2 中文文本分類
6.2.3 中英文本分類的異同
6.3 文本分類常用方法
6.3.1 常用文本分類方法
6.3.2 性能分析
6.4 文本分類模型的評估
6.4.1 採樣方法
6.4.2 評估指標
6.5 基於雲概念躍升的文本分類
6.5.1 虛擬泛概念樹及概念躍升
6.5.2 算法描述
6.5.3 實驗及分析
6.6 本章小結
第7章 基於主觀信任雲的文本分類
7.1 引言
7.2 主觀信任雲及信任決策
7.2.1 信任模型
7.2.2 主觀信任雲
7.2.3 基於主觀信任雲的信任決策
7.3 基於主觀信任雲的文本分類
7.3.1 算法描述
7.3.2 實驗及分析
7.4 本章小結
第8章 基於雲相似度量的無監督文本聚類
8.1 引言
8.2 文本聚類概述
8.2.1 聚類分析定義
8.2.2 數據挖掘套用對聚類分析的要求
8.2.3 距離與相似係數
8.2.4 聚類的特徵與類間距離
8.3 聚類分析的數據類型
8.3.1 區間標度變數
8.3.2 二元變數
8.3.3 標稱型、序數型和比例標度型變數
8.3.4 混合類型變數
8.4 文本聚類常用方法
8.4.1 常用文本聚類方法
8.4.2 算法性能比較
8.5 文本聚類性能評價指標
8.6 基於雲相似度量的無監督文本聚類
8.6.1 算法提出背景
8.6.2 算法描述
8.6.3 實驗及分析
8.7 本章小結
第9章 結束語

相關詞條

熱門詞條

聯絡我們