非參數統計(第2版)

非參數統計(第2版)

《非參數統計(第2版)》是清華大學出版社出版的圖書,作者是王星、褚挺進。

本書是非參數統計教材,內容從經典非參數統計推斷到現代前沿,包括基本概念、單一樣本的推斷問題、兩獨立樣本數據的位置和尺度推斷、多組數據位置推斷、分類數據的關聯分析、秩相關和分位數回歸、非參數密度估計、一元非參數回歸和數據挖掘與機器學習總計9章.本書配有大量與社會、經濟、金融、生物等專業相關的例題和習題,還配置了一些實驗或案例.方便結合R軟體進行探索、研究. 本書可以作為高等院校統計、經濟、金融、管理專業的本科生課程的教材,也可以作為其他相關專業研究生的教材和教學參考書,另外,對廣大從事與統計相關工作的實際工作者也極具參考價值.

前言

習慣於用數據思考和決策的人都清楚 ,和二三十年前相比 ,現在的數據分析面臨著更大的挑戰 .在諮詢領域 ,數據誤解、噪聲數據、快速成像所產生的危害呈指數增長 .研究顯示 ,今天大數據分析所涉及的數據所呈現出的複雜特徵並沒有和幾十年前小規模數據的特徵有多大區別 .此外 ,數據分析工具和封裝的程式越來越容易獲得 ,令人興奮的可視化技術越來越吸引年輕人的目光 ,越來越技術化的數據分析孤立於通過觀察並依循數據特點而進行的分析之外 .這些現象都表明我們的學生在尊重數據特點做出正確分析決定的能力方面訓練不足.

經過五年多的等待 ,《非參數統計》第二版終於面世了 ,我很欣慰 ,因為這次出版適逢大數據時代 ,算作是我和我的團隊獻給我一直深愛的數據分析事業的一份禮物吧!

《非參數統計》第一版獲得許多讀者和同行青睞 ,第二版在保留第一版全部優點和特色基礎上,作了許多最佳化、改進和創新 .這些最佳化、改進和創新包括:

(1)內容進行了全面更新 ,勘誤了每一章 ,擴充了 U統計量理論 ,添加了新的非參數回歸內容.

(2)可讀性、易讀性進一步提高 .為了做到這一點 ,我們對每一個章節的每一個句子 ,都經過了字斟句酌、反覆推敲 ,儘可能使用短句子 ,同時 ,繼續邀請優秀的本科生參與試讀教材 ,充分聽取他們的意見 ,力爭使第二版的內容更加生動、深入淺出和言簡意賅.

(3)調整結構體系 ,將原來的第一章 R基礎調整至附錄 ,原來的十章依次分九章排列 ——為每一章添加了一個實驗或案例 ,強調了結合問題背景根據複雜數據分布特點進行數據分析和信息解讀的培養思想 .這些實驗和案例可以激發學生的學習興趣,也為教師提供了豐富生動的教學內容.

在編寫和修訂的過程中 ,對我支持最多的是我的家人和我的團隊 .特別感謝我的助教王聰同學協助整理了大部分案例和勘誤表 ,許泳鐸同學調整了部分實驗 R程式,尤其是褚挺進老師加盟了我的教學團隊 ,協助修訂了第 8章和第 9章,最後,還要感謝清華大學出版社編輯負責的編輯校對工作.

王星

2014年 6月 10日於中國人民大學套用統計中心 &統計學院

目錄

第 1章基本概念 1

1.1非參數統計概念與產生.1

1.2假設檢驗回顧 5

1.3經驗分布和分布探索 10

1.3.1經驗分布 .10

1.3.2生存函式 .12

1.4檢驗的相對效率 .15

1.5分位數和非參數估計 18

1.6秩檢驗統計量 . 21

1.7 U統計量. .24

1.8實驗.29習題 . .34

第 2章單一樣本的推斷問題 . 37

2.1符號檢驗和分位數推斷 . 37

2.1.1基本概念 .37

2.1.2大樣本計算 41

2.1.3符號檢驗在配對樣本比較中的套用 43

2.1.4分位數檢驗 ——符號檢驗的推廣. .44

2.2 Cox-Staut趨勢存在性檢驗 45

2.3隨機遊程檢驗 . 49

2.4 Wilcoxon符號秩檢驗 . 52

2.4.1基本概念 .52

2.4.2 Wilcoxon符號秩檢驗和抽樣分布 55

2.5單組數據的位置參數置信區間估計. .61

2.5.1順序統計量位置參數置信區間估計 61

2.5.2基於方差估計法的位置參數置信區間估計 . 64

2.6正態記分檢驗 . 68

2.7分布的一致性檢驗 71

2.7.1 χ2擬合優度檢驗 . 71

2.7.2 Kolmogorov-Smirnov正態性檢驗.75

2.7.3 Liliefor常態分配檢驗 76

2.8單一總體漸近相對效率比較 .77

2.9實驗.80習題 . .87

第 3章兩獨立樣本數據的位置和尺度推斷 . 90

3.1 Brown-Mood中位數檢驗 . .91

3.2 Wilcoxon-Mann-Whitney秩和檢驗 93

3.3 Mood方差檢驗 . 99

3.4 Moses方差檢驗 101

3.5實驗 . 103習題.106

第 4章多組數據位置推斷 .108

4.1試驗設計和方差分析的基本概念回顧 108

4.2 Kruskal-Wallis單因素方差分析 115

4.3 Jonckheere-Terpstra檢驗.122

4.4 Friedman秩方差分析法 126

4.5隨機區組數據的調整秩和檢驗 . 131

4.6 Cochran檢驗 133

4.7 Durbin不完全區組分析法 . 136

4.8案例 . 138習題.143

第 5章分類數據的關聯分析 145

5.1 r × s列聯表和 χ2獨立性檢驗 . 145

5.2 χ2齊性檢驗 . 147

5.3 Fisher精確性檢驗 . 148

5.4 Mantel-Haenszel檢驗 151

5.5關聯規則.153

5.5.1關聯規則基本概念 153

5.5.2 Apriori算法 154

5.6 Ridit檢驗法 . 156

5.7對數線性模型 162

5.7.1對數線性模型的基本概念 . 163

5.7.2模型的設計矩陣 168

5.7.3模型的估計和檢驗 169

5.7.4高維對數線性模型和獨立性 170

5.8案例 . 173習題.177

第 6章秩相關和分位數回歸 181

6.1 Spearman秩相關檢驗. .181

6.2 Kendall τ相關檢驗 185

6.3多變數 Kendall協和係數檢驗. .189

6.4 Kappa一致性檢驗 . 192

6.5中位數回歸係數估計法 194

6.5.1 Brown-Mood方法.194

6.5.2 Theil方法 196

6.5.3關於 α和 β的檢驗 . 197

6.6線性分位回歸模型 . 199

6.7案例 . 202習題.207

第 7章非參數密度估計 . 209

7.1直方圖密度估計. .209

7.1.1基本概念. .209

7.1.2理論性質和最優頻寬 . .211

7.1.3多維直方圖 . 213

7.2核密度估計 213

7.2.1核函式的基本概念 213

7.2.2理論性質和頻寬 215

7.2.3多維核密度估計 218

7.2.4貝葉斯決策和非參數密度估計 221

7.3 k近鄰估計 .224

7.4案例 . 225習題.232

第 8章一元非參數回歸 . 234

8.1核回歸光滑模型. .235

8.2局部多項式回歸. .237

8.2.1 局部線性回歸 . 237

8.2.2 局部多項式回歸的基本原理 239

8.3 LOWESS穩健回歸 240

8.4 k近鄰回歸 .241

8.5正交序列回歸 243

8.6罰最小二乘法 245

8.7樣條回歸.246

8.7.1 模型 246

8.7.2 樣條回歸模型的節點 . .247

8.7.3 常用的樣條基函式 248

8.7.4 樣條模型的自由度 250

8.8案例 . 251習題.254

第 9章數據挖掘與機器學習 255

9.1一般分類問題 255

9.2 Logistic回歸 . 256

9.2.1 Logistic回歸模型 . 257

9.2.2 Logistic回歸模型的極大似然估計 258

9.2.3 Logistic回歸和線性判別函式 LDA的比較 259

9.3 k近鄰 . 261

9.4決策樹 . 262

9.4.1 決策樹基本概念 262 CART.264

9.4.2

9.4.3 決策樹的剪枝 . 265

9.4.4 回歸樹 266

9.4.5 決策樹的特點 . 266

9.5 Boosting . 268

9.5.1 Boosting方法 . 268

9.5.2 AdaBoost.M1算法 268

9.6支持向量機 271

9.6.1 最大邊距分類 . 271

9.6.2支持向量機問題的求解 . 273

9.6.3支持向量機的核方法 . .275

9.7隨機森林樹 277

9.7.1隨機森林樹算法的定義 . 277

9.7.2隨機森林樹算法的性質 . 277

9.7.3如何確定隨機森林樹算法中樹的節點分裂變數 . 278

9.7.4隨機森林樹的回歸算法 . 279

9.7.5有關隨機森林樹算法的一些評價 279

9.8多元自適應回歸樣條 . 280

9.8.1 MARS與 CART的聯繫 282

9.8.2 MARS的一些性質 282

9.9案例 . 283習題.294

附錄 AR基礎 297

A.1 R基本概念和操作.298

A.1.1 R環境 . 298

A.1.2常量 299

A.1.3算術運算 . 299

A.1.4賦值 300

A.2向量的生成和基本操作 300

A.2.1向量的生成.300

A.2.2向量的基本操作 302

A.2.3向量的運算.305

A.2.4向量的邏輯運算 305

A.3高級數據結構 . 306

A.3.1矩陣的操作和運算 . 306

A.3.2數組 308

A.3.3數據框 . 308

A.3.4列表 309

A.4數據處理 309

A.4.1保存數據 . 309

A.4.2讀入數據 . 310

A.4.3數據轉換 . 311

A.5編寫程式 311

A.5.1循環和控制.311

A.5.2函式 312

A.6基本統計計算 . 313

A.6.1抽樣 313

A.6.2統計分布 . 313

A.7 R的圖形功能 . 314

A.7.1 plot函式 . 315

A.7.2多圖顯示 . 315

A.8 R幫助和包 . .317

A.8.1 R幫助 . 317

A.8.2 R包 317習題.317

附錄 B常用統計分布表 . 321

參考文獻 .362

相關詞條

熱門詞條

聯絡我們