智慧型信息挖掘與處理

智慧型信息挖掘與處理

《智慧型信息挖掘與處理》是2014年9月1日化學工業出版社出版的圖書。

編輯推薦

目前數據挖掘與處理相關的理論專著、論文、科研成果較多,使得該學科得以豐富和發展,形成了許多理論、方法。本書多視角、多層次地介紹該學科知識,讓讀者能較系統地掌握本學科的理論精髓,較全面地了解和掌握相關技術。

內容簡介

本書從基於密度的空間數據流聚類、簇結構挖掘、軌跡數據流線上聚類及異常檢測四個方面,分析了現有數據流挖掘算法的挖掘效果、運行效率、可伸縮性與參數敏感性等相關問題,提出了一系列適用於海量時空數據流線上分析的方法與處理框架。然後基於可視化數據挖掘技術的城市地下空間 GIS 系統的關鍵技術和構建方法,改進機器學習算法、空間和非空間的聚類算法,研究結合挖掘算法的相關可視化技術。本書可作為高等院校計算機工程、信息工程、智慧型機器人學、工業自動化、模式識別等學科研究生的教材或教學參考書,亦可供智慧型信息挖掘與處理研究人員參考。

圖書目錄

1概論1
1.1時空數據挖掘研究概述3
1.2空間數據流聚類算法研究5
1.2.1基於密度的聚類算法5
1.2.2數據流聚類算法9
1.3時空軌跡數據挖掘研究現狀11
1.3.1軌跡距離測量方法11
1.3.2軌跡數據流聚類算法相關研究14
1.3.3移動目標軌跡模式挖掘相關研究17
1.3.4面向鄰居的實時查詢處理方法20
1.4GIS可視化空間數據挖掘技術21
1.5城市超前地質預報發展現狀22
1.6本章小結23
2基於密度的空間數據流線上聚類算法24
2.1引言24
2.2線上聚類相關定義25
2.2.1基本概念25
2.2.2線上聚類描述27
2.3OLDStream算法27
2.3.1算法思想27
2.3.2算法描述28
2.3.3時間複雜度31
2.4實驗測試及分析32
2.4.1聚類效果測試32
2.4.2性能測試34
2.4.3輸入參數敏感度分析35
2.5本章小結38
3海量軌跡數據流線上聚類算法39
3.1概述39
3.2問題定義40
3.2.1基本概念40
3.2.2CTraStream基本框架43
3.3基於密度的線段流聚類44
3.3.1新線段的影響44
3.3.2CLnStream描述45
3.4軌跡簇線上更新方法46
3.4.1TC—Tree索引結構47
3.4.2由線段簇更新軌跡簇48
3.4.3TraCluUpdate算法描述49
3.5實驗評估及分析50
3.5.1聚類效果測試50
3.5.2性能測試52
3.5.3參數敏感度分析53
3.6本章小結54
4面向實時查詢處理的時空軌跡流挖掘框架55
4.1引言55
4.2框架概述56
4.2.1問題定義56
4.2.2TSMF框架57
4.3軌跡數據流挖掘58
4.3.1軌跡數據流聚類58
4.3.2Swarm-HT線上更新59
4.4實時查詢處理方法60
4.4.1CCTC查詢60
4.4.2CCSwarm查詢61
4.4.3k-NNT查詢62
4.5實驗評估63
4.5.1挖掘效果64
4.5.2挖掘效率65
4.5.3查詢處理性能測試65
4.5.4參數敏感度分析66
4.6本章小結66
5基於GIS的可視化空間數據挖掘技術68
5.1地理信息系統68
5.1.1空間數據模型68
5.1.2空間關聯規則72
5.1.3空間資料庫74
5.2空間數據挖掘76
5.2.1空間關聯規則及其挖掘方法76
5.2.2支持向量機挖掘方法79
5.2.3聚類方法80
5.3空間數據挖掘過程81
5.4空間數據挖掘的可視化81
5.4.1基於Java3D的空間關聯規則可視化82
5.4.2基於平行坐標理論的多維多時相空間數據可視化87
5.5本章小結90
6支持向量機算法的研究91
6.1支持向量機算法91
6.1.1模式的區分91
6.1.2SVM學習模型95
6.1.3SVM算法已知的問題96
6.1.4套用SVM算法進行岩體分類96
6.2基於案例推理CBR方法102
6.2.1基於案例推理方法中的測度102
6.2.2案例庫的設計原則104
6.2.3基於CBR方法的改進SVM算法104
6.3基於空間區域劃分的SVM方法105
6.4算法分析107
6.5本章小結110
7城市地下空間GIS分類技術及分析111
7.1空間聚類111
7.2城市地下空間GIS空間聚類算法112
7.2.1統計距離方法112
7.2.2基於相似形理論的夾角餘弦方法112
7.2.3基於k中心點法的空間聚類113
7.3空間分類結果評價指標115
7.4文本分類115
7.4.1預處理技術116
7.4.2特徵提取技術117
7.4.3特徵項權重計算118
7.5城市地下空間GIS的文本分類算法119
7.6文本分類效果評價指標121
7.7分類技術的難點分析121
7.8本章小結122
8空間數據挖掘過程中的數據質量控制及改進方法123
8.1空間數據的不確定性123
8.1.1空間數據不確定性的來源124
8.1.2空間數據誤差評價指標125
8.2空間數據質量評價126
8.2.1評價的內容126
8.2.2評價的方法127
8.3城市地下空間數據獲取方法128
8.3.1城市地質工程及數據特點128
8.3.2爆破震動監測測量方法130
8.4三明治空間抽樣方法132
8.5本章小結134
9城市地下空間數據挖掘GIS原型系統構建135
9.1系統構建策略135
9.2系統功能設計136
9.3數據流程設計139
9.4外掛程式式系統集成方法139
9.5系統運行效果140
9.6本章小結142
附錄符號說明144
參考文獻145

序言

目前,在需要處理大數據量的科研領域中,數據挖掘受到越來越多的關注,同時,在實際問題中,大量成功運用數據挖掘的實例說明了數據挖掘和智慧型處理對科學研究具有很大的促進作用。數據挖掘可以幫助人們對大規模數據進行高效地分析處理,以節約時間,將更多的精力投入到更高層的研究中,從而提高科研工作的效率。因此,數據挖掘的研究與套用現已成為各個科學領域中的熱點。本著作針對海量時空數據流聚類算法和可視化數據挖掘技術在城市地下空間GIS中的套用兩個方面進行了相關理論和方法的研究。
無線位置感知技術的快速發展和廣泛套用產生了海量的時空數據流大數據,急需有效的海量數據流管理與信息提取的理論和方法。時空數據流聚類分析技術能夠發現動態變化的數據對象間的相關模式、結構特徵及演化規律等知識,因而具有重要研究意義。本書首先從基於密度的空間數據流聚類、時空軌跡數據流線上聚類及實時查詢處理方面,分析了現有數據流挖掘算法的挖掘效果、效率、可伸縮性與參數敏感性等相關問題,提出了一系列適用於海量時空數據流線上挖掘方法與智慧型處理框架。針對空間數據流聚類分析,提出了一種基於密度的空間數據流線上聚類算法OLDStream,該算法採用連通性密度概念,在先前聚類結果上聚類新空間數據點。僅對新空間點及其滿足核心點條件的鄰域數據做局部聚類更新,降低聚類的時間複雜度。針對空間數據流聚類分析,提出了一種基於密度的空間數據流線上快速聚類算法OLDStream,算法在先前聚類結果上增量更新局部簇結果,降低了聚類的時間複雜度,實現了對空間數據流的線上聚類。針對時空軌跡數據流聚類,提出了一種基於密度的軌跡流線上聚類算法CTraStream,將軌跡流聚類過程分為軌跡線段流聚類和軌跡簇線上更新兩個階段。最後,設計了一種面向移動目標鄰居實時查詢處理的時空軌跡數據流挖掘框架TSMF,能夠實時回響用戶關於軌跡簇、蜂群模式和k-NNT的查詢請求。
隨著城市地下空間工程的發展,大量的空間和非空間的數據得到採集和存儲。如何更有效的利用這些地下複雜空間數據,並服務於城市地下空間工程的超前地質預報和分析,是城市地下空間數據分析和綜合利用的重要研究方向。本書進一步將數據挖掘與可視化技術相結合,將數據挖掘和處理結果,轉換為人們容易理解的圖形、圖像的形式,顯示在螢幕上,實現數據可視化分析,以提高整個數據挖掘過程的靈活性、有效性與互動性。本書對基於可視化數據挖掘技術的城市地下空間GIS系統的關鍵技術和構建方法進行了系統討論,最佳化了機器學習算法、空間和非空間的聚類算法,研究結合挖掘算法的相關可視化技術,對城市地下空間超前地質預報展開了深入研究工作,形成了一整套支持可視化數據挖掘的城市地下空間GIS原型系統。最後,在空間數據挖掘算法設計基礎上,設計了城市地下空間GIS系統架構,並實現了基於外掛程式形式進行城市地下空間數據挖掘的GIS原型系統,套用於天津市城市地下空間超前地質預報。
本書研究內容旨在提出支持大規模空間數據挖掘和智慧型處理的高效解決方法,有助於提高海量信息挖掘和智慧型處理的水平,為城市管理套用鄰域內的各類空間數據處理提供重要的理論基礎,加快城市信息化建設、提高城市管理效率和水平,也可以為大數據的挖掘和智慧型處理技術研究提供有益參考。
本書第1~4章由煙臺大學於彥偉老師和天津城建大學張運傑老師共同編著,第5~9章由天津城建大學楊振艦老師負責編著,張運傑老師負責全書的統稿,天津城建大學胡建平教授、河北工業大學夏克文教授審閱了全書並提出了許多寶貴意見。
本書在編著過程時參考或引用了部分單位、專家學者的相關資料,得到了許多業內人士的大力支持,在此表示衷心的感謝。限於編著者水平有限和時間緊迫,書中疏漏及不當之處在所難免,敬請廣大讀者批評指正。
編著者
2014年5月

相關詞條

熱門詞條

聯絡我們