內容簡介
《基因表達譜數據挖掘方法研究》基因表達譜數據挖掘可以幫助人們發現新的疾病亞型,提高複雜疾病診斷的正確率。因此,發展高效實用的基因表達譜數據處理方法具有十分重要的實際意義。《基因表達譜數據挖掘方法研究》首先介紹生物信息學中基因晶片和基因表達譜等一些基本概念,然後利用Re—lief、Fisher判別、Wilcoxon和Kruskal-Wallis秩和檢驗方法、信噪比方法、主成分分析方法、因子分析方法、獨立分量分析方法、經典粗糙集和鄰域粗糙集、人工神經網路和集成神經網路、小波包變換和離散餘弦變換、遺傳算法和遺傳規劃、流形學習、張量分析等方法,系統研究了基於基因表達譜的腫瘤亞型數據挖掘方法(包括特徵提取與分類識別等)。設計多種基因表達譜分類識別算法,並結合SVM、NSC、FLDA、DLDA等多種分類器及集成分類器,進行大量的基因表達譜分類識別實驗,以圖和表的形式給出大量實驗結果,同時對各種方法的性能進行比較。系統研究基於基因調控機率的腫瘤基因表達譜數據挖掘方法,結合Filter和Wrapper兩種特徵選擇方法的優點,研究基於支持向量機和懲罰策略(SVPS)的腫瘤關鍵基因選擇算法。設計基於標準遺傳算法和多目標遺傳算法的集成基因表達譜特徵選擇方法。
作者簡介
黃德雙,工學博士,中國科學技術大學博士生導師,中國科學院合肥智慧型機械研究所研究員,中國科學院研究生院教授,2000年度中國科學院
“百人計畫”人選者。Transactions of the Institute of Measurement and Control(TIMC)國際雜誌顧問編委,Advances in Artificial
Neural Systems(AANS)等國際雜誌編委,IEEE高級會員。已發表SCl收錄學術雜誌論文110多篇,SCI他引500多次,出版專著三部,獲第八屆
全國優秀科技圖書二等獎一項。曾主持國家自然科學基金項目5項,國家重點基礎研究發展計畫(973)項目子課題和國家高技術研究發展計畫
(863)項目各1項。研究興趣為模式識別、神經網路與生物信息學。
·查看全部>>
目錄
前言
第1章 緒論
1.1 生物信息學簡介
1.1.1 生物信息學概念
1.1.2 生物信息學的研究背景和意義
1.1.3 生物信息學的研究內容與方法
1.1.4 生物信息學的研究歷史和現狀
1.1.5 套用前景
1.2 基因組時代簡介
1.2.1 基因組計畫
1.2.2 基因的基本結構
1.3 基因表達譜數據挖掘的研究意義與研究現狀
1.3.1 研究意義
1.3.2 研究現狀
1.4 本章小結
參考文獻
第2章 DNA微陣列技術與基因表達譜
2.1 基因晶片與DNA微陣列
2.1.1 基因晶片介紹
2.1.2 基因晶片的特點、分類和製作
2.1.3 基因晶片製備方法
2.1.4 DNA微陣列技術的套用和研究方向
2.2 基因表達譜
2.2.1 基因表達譜的獲取與表示
2.2.2 基因表達譜的特點
2.2.3 基因表達譜的數學描述
2.2.4 常用的腫瘤基因表達譜數據集
2.3 基因表達譜數據分析
2.3.1 基因表達譜數據的預處理
2.3.2 基因表達譜數據分析的層次
2.3.3 差異基因篩選
2.3.4 基因解讀與注釋
2.3.5 基因表達調控
2.4 基因表達譜的研究方向
2.5 本章小結
參考文獻
第3章 基因表達譜數據挖掘中的模式識別基礎
3.1 模式識別的概念及其研究方向
3.2 特徵提取與選擇方法
3.2.1 特徵提取中用到的統計量
3.2.2 基因表達譜的特徵提取與選擇
3.3 常用的基因表達譜聚類與分類算法
3.3.1 基因表達譜聚類和分類的目的
3.3.2 聚類與分類算法的劃分及評估準則
3.3.3 基於類間距離的聚類算法
3.3.4 層次聚類
3.3.5 基於密度、格線和模型的聚類算法
3.3.6 K-均值法
3.3.7 仿射傳播聚類
3.3.8 K-近鄰分類方法及其改進方法
3.3.9 決策樹
3.3.10 線性判別分析
3.3.11 基因表達譜可分性判據
3.4 分類器
3.4.1 貝葉斯分類器
3.4.2 人工神經網路
3.4.3 自組織映射
3.4.4 支持向量機
3.4.5 多分類器性能比較
3.5 本章小結
參考文獻
第4章 基於因子分量分析的基因表達譜特徵提取方法
4.1 基因表達譜特徵提取方法簡介
4.2 主分量分析
4.2.1 主分量分析的基本思想
4.2.2 主分量分析算法步驟
4.3 判決主分量分析
4.3.1 判決主分量分析的基本思想
4.3.2 判決主分量分析算法步驟
4.4 因子分析
4.4.1 因子分析的基本思想
4.4.2 因子分析算法的步驟
4.5 獨立分量分析
4.5.1 獨立分量分析的基本思想
4.5.2 獨立分量分析算法的步驟
4.5.3 FastICA
4.6 因子分析、主分量分析和獨立分量分析之間的關係
4.7 基於主分量分析、判決主分量分析和因子分析的腫瘤亞型分類方法
4.7.1 算法框架模型
4.7.2 信息基因選擇
4.7.3 基於主分量分析的腫瘤亞型分類的實驗結果與分析
4.7.4 基於判決主分量分析的腫瘤亞型分類的實驗結果與分析
4.7.5 基於因子分析的腫瘤亞型分類的實驗結果與分析
4.8 基於獨立分量分析的腫瘤亞型分類方法
4.8.1 基因表達譜的IcA模型及其生物學意義
4.8.2 基於獨立分量分析的基因表達譜提取與選擇算法
4.8.3 實驗結果與分析
4.9 基於獨立分量分析的腫瘤亞型懲罰性分類方法
4.9.1 懲罰性回歸模型
4.9.2 最佳化得分算法
4.9.3 懲罰性最佳化得分分類算法
4.9.4 特徵基因的初選
4.9.5 實驗結果與分析
4.1 0本章小結
參考文獻
第5章 基於傅立葉與小波包變換的基因表達譜特徵提取方法
5.1 基於離散餘弦變換和傅立葉變換的基因表達譜特徵提取方法
5.1.1 離散傅立葉變換和離散餘弦變換
5.1.2 Relief算法
5.1.3 基因表達譜分類模型
5.1.4 實驗結果與分析
5.2 基於小波包變換的基因表達譜特徵提取與選擇
5.2.1 小波包變換
5.2.2 腫瘤亞型分類方法
5.2.3 實驗結果與分析
5.3 基因表達譜的特徵提取與選擇方法比較
5.4 本章小結
參考文獻
第6章 信息基因的啟發式搜尋算法研究
6.1 信息基因選擇問題
6.1.1 基於基因表達譜的腫瘤分類問題描述
6.1.2 腫瘤分類模型及評估
6.1.3 信息基因選擇方法簡介
6.1.4 信息基因選擇策略
6.2 基於啟發式搜尋的基因表達譜數據挖掘算法
6.2.1 腫瘤信息基因的啟發式寬度(HBSA)優先搜尋算法
6.2.2 信息基因選擇
6.2.3 HBSA算法實現
6.2.4 實驗結果與分析
6.3 基於wilcoxon秩和檢驗的信息基因選擇方法
6.3.1 算法的基本思想
6.3.2 算法的基本步驟
6.3.3 實驗結果與分析
6.4 基於Kruskal-Wallis秩和檢驗的基因選擇方法
6.4.1 算法的基本步驟
6.4.2 實驗結果與分析
6.4.3 SRCT數據集中信息基因描述及腫瘤亞型相關基因推測
6.5 本章小結
參考文獻
第7章 基於粗糙集的信息基因選擇方法
7.1 基於粗糙集的腫瘤信息基因選擇方法
7.1.1 粗糙集模型簡介
7.1.2 粗糙集屬性約簡的一般步驟和算法實現
7.1.3 基於粗糙集的信息基因選擇方法
7.1.4 實驗結果與分析
7.2 基於鄰域粗糙集的腫瘤信息基因選擇方法
7.2.1 鄰域粗糙集模型簡介
7.2.2 鄰域分類器
7.2.3 基於鄰域粗糙集模型的腫瘤分類方法
7.2.4 實驗結果與分析
7.3 基於鄰域粗糙集的多類腫瘤亞型分類方法
7.3.1 多腫瘤亞型分類算法框架和模型
7.3.2 實驗結果與分析
7.4 本章小結
參考文獻
第8章 基於基因調控機率模型的基因表達譜數據挖掘方法
8.1 基因表達調控的生物學背景
8.2 基於機率統計的基因調控機率模型
8.3 基因調控機率計算
8.3.1 基於全機率公式的基因調控機率計算
8.3.2 基於最大似然估計的基因調控機率計算
……
第9章 基於神經網路和支持向量機的基因選擇及腫瘤分類方法
第10章 基於集成分類器系統的基因表達譜數據挖掘方法研究
第11章 基於流形學習的基因表達譜特徵提取方法
第12章 基於張量分析的高階基因表達譜特徵提取方法
附錄 部分原始碼
彩圖
·收起全部<<