醫學數據挖掘

醫學數據挖掘

《醫學數據挖掘》是2006年 高等教育出版社出版的圖書,作者是崔雷。

基本信息

內容簡介

圖書封面

《醫學數據挖掘》是國內出版的關於醫學數據挖掘的教材。包括基礎篇、核心篇和套用篇三個部分。基礎篇介紹數據挖掘的基本概念和理論,核心篇介紹數據挖掘的主要算法和工具,套用篇則分別介紹數據挖掘在醫學臨床、分子生物學、預防醫學、醫院管理、文本和WEB挖掘中的具體套用。《醫學數據挖掘》首先強調數據挖掘的基本概念和基本方法,重點介紹該領域的基本概念、基本過程和方法;各種算法以介紹其適用條件和原理為主,儘量少涉及具體算法的數學公式。其次,《醫學數據挖掘》以套用為主,介紹數據挖掘方法在醫學研究和服務中的套用實例,為學生今後進一步從事這一方面的深入研究提供基礎。最後,《醫學數據挖掘》在內容組織上力求全面系統,突出重點。由淺入深、突出交叉學科的特色的同時,注重所介紹知識的層次,適合不同水平讀者的學習需要。

目錄

基礎篇

第一章 概述

第一節 數據挖掘與知識發現的基本概念

一、數據挖掘的產生

二、什麼是數據挖掘和知識發現

三、數據挖掘的知識表示

第二節 知識發現和數據挖掘的步驟、算法與工具

一、知識發現和數據挖掘的基本步驟

二、知識發現和數據挖掘的算法

三、數據挖掘的工具

第三節 數據挖掘系統的體系結構

一、資料庫管理模組

二、挖掘前處理模組

三、挖掘操作模組

四、模式評估模組

五、知識輸出模組

第四節 數據挖掘和知識發現的套用

一、數據挖掘和知識發現在科學研究中的套用

二、數據挖掘和知識發現在商業上的套用

三、Web挖掘

第二章 數據挖掘的對象

第一節 關係型資料庫

一、關係型資料庫的定義

二、關係組成與性質

三、關係型資料庫的數據挖掘

第二節 數據倉庫

一、數據倉庫的定義和結構

二、數據倉庫的特徵

三、多維數據模型

四、數據倉庫的數據挖掘

第三節 文本資料庫

一、語種識別

二、特徵提取

三、文本聚類

四、文本分類

第四節 複雜類型資料庫

一、空間資料庫

二、Web資料庫

三、時序資料庫

第三章 數據挖掘的步驟

第一節 跨行業數據挖掘過程標準

一、產生背景

二、CRISP-DM過程模型

三、數據挖掘工具

第二節 業務理解

一、確定商業目標

二、狀況評估

三、確定數據挖掘目標

四、建立項目計畫

第三節 數據準備

一、理解數據

二、數據選擇

三、數據清洗

四、數據轉換

五、數據集成

六、數據歸約

第四節 模型建立和評估

一、模型的種類

二、模型的精確度

三、模型評估

核心篇

第四章 關聯規則與關聯分析

第一節 關聯規則基本概念和關聯規則挖掘分類

一、關聯規則的基本概念

二、關聯規則挖掘的基本過程與分類

第二節 關聯分析的原理

一、單維布爾關聯規則挖掘

二、多層關聯規則挖掘

三、多維關聯規則挖掘

第三節 關聯分析的套用和實例

一、關聯分析的套用

二、關聯分析的套用實例

第五章 聚類分析

第一節 聚類分析概述

一、聚類分析的定義

二、聚類分析的套用

第二節 聚類分析中的數據結構和數據類型

一、數據結構

二、數據類型

第三節 聚類分析方法

一、基於劃分的聚類方法

二、基於層次的聚類方法

三、基於密度的方法

四、基汗格線的方法

五、基於模型的方法

第四節孤立點(異常數據)分析

第五節 聚類分析的套用和實例

第六章 決策樹

第一節 決策樹的概念和原理

一、決策樹的概念

二、決策樹的原理

第二節ID3算法和樹剪枝

一、ID3算法

二、樹枝修剪

第三節 決策樹的套用

一、分類規則的獲取

二、決策樹醫學領域中套用

第四節 決策樹的可擴展性和優缺點

一、決策樹的可擴展性

二、決策樹的優缺點

第七章 內容概括相關技術.

第一節 概念描述

一、概念描述的定義

二、概念描述的方法

第二節 信息抽取

一、信息抽取概述

二、信息抽取的發展歷史

三、信息抽取系統的體系結構

四、信息抽取中的關鍵技術

五、展望

第八章 人工神經網路

第一節 人工神經網路概述

一、人工神經網路的概念

二、人工神經網路的研究歷史

三、人工神經網路的屬性

第二節 神經元的結構、組成及基本模型

一、神經元的結構

二、人工神經元的組成

三、基本神經元模型

第三節 人工神經網路的結構、工作原理及模型

一、人工神經網路的結構

二、人工神經網路的工作原理

三、神經網路的學習方法

四、神經網路模型

第四節 人工神經網路在醫學中的套用

一、人工神經網路套用於臨床診斷

二、人工神經網路套用於預後研究

三、人工神經網路套用於臨床決策分析

四、人工神經網路套用於醫學信號分析處理

第九章 遺傳算法

第一節 遺傳算法概述

一、遺傳算法的產生和發展

二、遺傳算法的基本思想和原理

三、遺傳算法的特點

第二節 遺傳算法的步驟與實現

一、遺傳算法的處理步驟

二、遺傳算法的實現技術

三、遺傳算法的理論基礎

第三節 遺傳算法的套用

第十章 粗糙集理論及其套用

第一節 粗糙集理論

一、粗糙集理論的產生和發展

二、知識的概念

三、不可區分關係和基本集

四、近似空間概念

五、集合的下近似、上近似及邊界區

六、新型隸屬關係

第二節 決策表

一、信息系統概念

二、決策表的約簡

三、屬性約簡

四、決策表離散化

五、決策表規則獲取及簡化

第三節 粗糙集理論套用

一、粗糙集在醫學數據挖掘中的套用

二、基於粗糙集理論的數據挖掘系統

第四節 實例套用

一、等價集下近似和依賴度的計算

二、條件屬性c中各屬性重要度的計算

三、簡化決策表

四、約簡後的決策表等價集計算

五、決策表獲取規則

六、規則簡化

七、最後決策表獲取的規則

套用篇

第十一章 數據挖掘在臨床領域中的套用

第一節 臨床數據挖掘的特點

一、臨床數據的特點

二、臨床數據挖掘的過程

第二節 數據挖掘臨床套用領域

一、疾病診斷與治療

二、醫療管理

三、醫療資源利用評價

第三節 臨床數據挖掘套用實例

一、數據挖掘目的

二、樣本

三、數據挖掘方法

四、數據預處理

五、結果

六、結論

第十二章 數據挖掘在分子生物學領域中的套用

第一節 分子生物學數據挖掘概述

一、分子生物學數據的大量湧現

二、分子生物學領域數據挖掘研究的提出

三、分子生物學數據與信息的特點

第二節 數據挖掘在分子生物學中的套用領域和工具

一、數據挖掘在分子生物學中的套用領域

二、分子生物信息挖掘工具

第三節 分子生物學數據挖掘實例

一、數據及來源

二、方法

三、結果

第十三章 數據挖掘在預防醫學領域中的套用

第一節 預防醫學數據挖掘的意義

一、預防醫學研究重要性

二、預防醫學數據挖掘的提出

三、預防醫學數據挖掘的發展

第二節 預防醫學數據挖掘的特點

一、預防醫學的行業背景

二、預防醫學數據挖掘的特點

第三節 預防醫學數據挖掘實例

一、背景

二、方法

三、結果

第十四章 時間序列數據挖掘及其在醫院管理中的套用

第一節 時間序列的趨勢分析

一、時間序列及時間序列資料庫

二、時間序列的構成因素

三、時間序列的分析模型構成

四、時間序列預測方法

第二節 時間序列的相似性搜尋

一、時間序列相似性搜尋概述

二、基於序列變換的相似性搜尋

三、基於序列外形特徵的相似性搜尋

四、基於小波變換的相似性搜尋

第三節 時間序列模式和周期模式挖掘

一、時間序列模式挖掘

二、時間序列周期模式挖掘

第四節 時間序列數據挖掘在醫院管理中的套用實例

一、數據挖掘目的

二、數據挖掘方法

三、樣本資料

四、數據預處理

五、實驗結果

六、討論

第十五章 文本挖掘及其在生物醫學領域中的套用

第一節 文本挖掘概述

一、文本挖掘的定義

二、文本挖掘的作用

三、文本挖掘的過程

第二節 文本挖掘的關鍵技術

一、文本預處理

二、文本分類

三、文本聚類

四、文本自動摘要

第三節 文本挖掘在生物醫學領域中的套用

一、概念識別

二、發現關係

三、利用文本分析的方法最佳化生物學算法

第十六章 Web挖掘

第一節 Web挖掘概述

一、web信息的特點

二、Web挖掘的含義

三、Web挖掘的類型

四、Web挖掘的意義

第二節 web內容挖掘

一、Web內容挖掘及其類型

二、Web文本挖掘

三、web多媒體數據挖掘

第三節 web結構挖掘

一、Web的結構

二、Web結構挖掘的含義

三、Web結構挖掘的算法

四、web結構挖掘的套用

第四節 web使用挖掘

一、Web使用挖掘的特點

二、Web使用挖掘的意義

三、Web使用挖掘的數據來源

四、Web使用挖掘的基本過程

五、Web使用挖掘的套用

第十七章 數據挖掘工具概述

第一節 數據挖掘工具的分類

一、按技術層面分類

二、按套用角度分類

三、按所處理的數據類型分類

四、按所完成的任務類型分類

第二節 數據挖掘工具的選擇

一、數據挖掘工具的評估指標

二、企業自身因素對數據挖掘工具選擇的影響

第三節 幾種主流數據挖掘工具——CLEMENTINE

二、EnternoriseMiner

三、InsighnlMiner

四、IntelligentMiner

五、A丌0wsmitlI

參考文獻

序言

數據挖掘與知識發現是當前研究的熱門領域,是集信息科學、管理科學、統計學和人工智慧等學科於一身的交叉學科。數據挖掘在生物醫學領域中的套用有著廣闊的前景。對於醫學信息管理專業而言,數據挖掘研究為信息管理通向知識管理架設了一座橋樑。

正是基於這個原因,許多醫學院校的相關專業,如信息管理與信息系統、生物技術專業、計算機專業紛紛準備開設這門課程。但是,目前沒有適合醫學信息專業本科生水平的教材。為此,我們幾家醫學信息學專業的教師在高等教育出版社的組織下編寫了這部教材。

本書包括基礎篇、核心篇和套用篇三個部分。基礎篇介紹數據挖掘的基本概念和理論,核心篇介紹數據挖掘的主要算法和工具,套用篇則分別介紹數據挖掘在醫學臨床、分子生物學、預防醫學、醫院管理、文本和web挖掘中的具體套用。

本書的特點之一是強調基本概念和基本方法。由於數據挖掘和知識發現是目前新近興起的一個研究領域,很多基本概念和基本理論尚處於發展完善之中,基於該研究目前在我國的發展狀況以及目前醫學信息管理專業本科生的知識結構,本書的重點在於介紹該領域的基本概念、基本過程和方法,各種算法以介紹其適用條件和原理為主,儘量少涉及具體算法的數學公式。

本書的特點之二是以套用為主。介紹數據挖掘方法在醫學研究和服務中的套用實例,為學生今後進一步從事這方面的深入研究提供基礎。

本書的特點之三是在內容組織上力求全面系統,突出重點。本書由淺入深、突出交叉學科的特色的同時,注重介紹知識的層次,適合不同水平讀者的學習需要。

面對著這樣一門還處於蓬勃發展中的學科,對於一群對數據挖掘的理論和技術還沒能全面掌握的編者而言,這不啻一場十分艱苦的戰鬥。好在我們有著對專業的熱愛和對事業的追求,所有的編寫人員克服了重重困難,終於不辱使命,圓滿完成了任務。至於戰果如何,我們充滿信心,無論如何,這是我們所知道的國內第一部醫學數據挖掘教材,我們的努力付出了,相信大家會在字裡行間看到我們的智慧和汗水。

我們等待著讀者和教學過程的檢驗,我們期待著您的批評和建議。

崔雷

2005年10月27日於瀋陽

相關詞條

相關搜尋

熱門詞條

聯絡我們