基於遺傳算法的文本分類及聚類研究

基於遺傳算法的文本分類及聚類研究

2.2文本的表示 2.5文本分類方法 2.6文本聚類方法

基本相信

作 者:戴文華著
叢 書 名:

出 版 社:科學出版社
ISBN:9787030227416
出版時間:2008-08-01
版 次:1
頁 數:222
裝 幀:平裝
開 本:大32開
所屬分類:圖書 > 社會科學 > 人類學

內容簡介

文本分類和聚類技術是應信息檢索和查詢需要而出現的自然語言處理領域的重要研究課題。文本分類和聚類問題中的特徵選擇和抽取技術、文本特徵表示、聚類方法的選擇和實現以及分類方法的選擇和實現,都將對文本分類和聚類結果產生極大影響。針對文本分類和聚類中的文本數據的高維性和稀疏性、同義詞和近義詞問題、效率與精確度之間的搭配問題以及參數最佳化問題,本書提出了使用遺傳算法與傳統分類和聚類方法相結合的思路來進行處理,充分利用了遺傳算法的全局最佳化能力和傳統分類及聚類算法的專業知識,有效地提高了文本分類和聚類的效率與精度。

目錄


前言
第1章 緒論
1.1 研究的目的和意義
1.2 國內外研究現狀
1.3 文本分類和聚類存在的問題
1.4 本書研究內容和目標
參考文獻
第2章 文本分類和聚類的基本理論及方法
2.1 文本分類和聚類的概念
2.2 文本的表示
2.3 文本預處理
2.4 文本特徵選擇和抽取
2.5 文本分類方法
2.6 文本聚類方法
2.7 本章小結
參考文獻
第3章 遺傳算法基礎知識
3.1 遺傳算法概述
3.2 標準遺傳算法
3.3 遺傳算法染色體編碼
3.4 適應度函式
3.5 遺傳運算元
3.6 遺傳算法的改進
3.7 本章小結
參考文獻
第4章 混合並行遺傳算法及其在文本聚類中的套用
4.1 k-means算法初始聚類中心的選擇
4.2 混合併行遺傳算法
4.3 基於並行遺傳算法的文本特徵詞提取
4.4 基於混合併行遺傳算法的文本聚類
4.5 實驗設定及結果分析
4.6 本章小結
參考文獻
第5章 混合併行遺傳算法在文本分類中的套用
5.1 基於混合併行遺傳算法的潛在語義挖掘
5.2 基於混合併行遺傳聚類的KNN改進算法(HPGA-KNN)
5.3 SMO-SVM算法
5.4 SMO-SVM算法核函式參數最佳化
5.5 改進的KNN SVM文本分類方法
5.6 實驗設定及分析
5.7 本搴小結
參考文獻
第6章 總結和研究展望
6.1 總結
6.2 後續研究工作展望
附錄A k-means聚類算法關鍵代碼
附錄B 遺傳算法聚類關鍵代碼
附錄C 混合遺傳聚類關鍵代碼

前言

戴文華同志無論學習、研究還是工作,都非常勤奮、踏實、執著,研究能力和鑽研精神都非常強。四年前,他進入華中師範大學計算機科學系攻讀碩士研究生時,已經作為高校教師工作了多年,並已取得了較多的成果;然而他在自然語言處理這個研究方向上,還是一個新兵。但是,經過短短的4年,他已經在該方向做出了突出的研究成果,在文本分類和聚類的理論和方法上,做了系統深入的研究,發表了論文10多篇。現在他碩士期間的主要研究成果即將出版專著,實在是可喜可賀。文本自動分類和聚類是自然語言處理領域裡重要的研究課題,有廣泛的套用前景。

相關詞條

熱門詞條

聯絡我們