內容簡介
社會發展離不開數據,而數據必須使用統計方法來加以分析。自威廉,配第從最初不完整的全面調查方法到大樣本統計推斷,是統計方法的第一次革命;以大樣本統計推斷方法為基礎,進一步發展出小樣本統計推斷方法,是統計方法的第二次革命。這兩次革命都是施於用樣本數據推斷總體特徵這一思想,而抽樣誤差的干擾導致統計方法日益複雜,使其套用受到限制。目前,以數據挖掘方法為代表的統計學的第三次革命即將到來。數據挖掘是在繼承已有統計理論的基礎上,與計算機技術緊密結合,充分發揮計算機運算速度快、存儲量大的特點,將統計方法從抽樣推斷向海量數據分析推進,是統計學、計算機技術、仿真計算、機器學習、人工智慧甚至哲學思想相融合的新學科,體現了科學發展“螺旋式上升”的哲學內涵。
圖書目錄
1 緒論
1.1 研究背景
1.2 問題的提出
1.3 基本概念
1.4 本書的研究內容與方法
1.5 本書的結構安排
1.6 本書的特色與貢獻
2 文獻綜述
2.1 幾種線性規劃分類模型
2.2 多目標線性規劃分類模型
2.3 分類方法業績改進的一般技術
2.4 本章主要結論
3 MCLP的偏差和方差分析
3.1 關於MCLP三個特性的一般理論
3.2 期望預測誤差的分解
3.3 數據準備與實驗安排
3.4 實驗結果與分析
3.5 本章主要結論
4 MCLP在不平衡數據集上的業績分析
4.1 分類業績評價標準及選擇
4.2 數據不平衡對分類方法業績影響機制的一般結論
4.3 數據不平衡對MCLP業績影響機制的分析
4.4 數據不平衡對MCLP業績影響的實證分析
4.5 最優類分布結論的穩定性分析
4.6 本章主要結論
5 組合分類器方法對MCLP的業績改進分析
5.1 Bagging和Adaboost程式
5.2 數據準備與實驗安排
5.3 兩種基本組合方法對MCLP的業績改進分析
5.4 一種SmoothBoosting方法對MCLP的業績改進分析
5.5 一種Sequential:Bagging方法對MCLP的業績改進分析
5.6 隨機子空間方法對MCLP的業績改進分析
5.7 本章主要結論
6 不平衡數據處理方法對MCLP的業績改進分析
6.1 MCLP分類中對不平衡數據的一般處理
6.2 數據準備與實驗安排
6.3 基於MCLP分類結果的數據集特性分析
6.4 隨機上抽樣和隨機下抽樣方法對MCLP的業績改進分析
6.5 一種改進的單邊抽樣方法對MCLP的業績改進分析
6.6 改進的單邊抽樣+上抽樣方法對MCLP的業績改進分析
6.7 一種正類加權的MCLP模型及其業績改進分析
6.8 不同方法在信用卡數據集上的業績比較分析
6.9 本章主要結論
7 總結與展望
7.1 主要研究結論
7.2 需要進一步研究的問題
參考文獻