非參數與半參數統計

非參數與半參數統計

《非參數與半參數統計》是2016年清華大學出版社出版的圖書,作者是孫志華、尹俊平、 陳菲菲、葉雪。

圖書簡介

本書介紹了現代非參數和半參數統計的基於局部核方法的基本方法和基本理論,主要內容為密度函式以及相關函式的核估計、非參數局部回歸方法、生存時間函式的非參數估計以及幾類常見的半參數模型的估計和檢驗.本書特點是力求把方法的直觀背景以及來龍去脈介紹清楚,因而即使內容相對比較複雜,但仍然比較直觀易懂.本書可以作為高等院校數理統計專業、計量經濟專業以及相關專業高年級本科生及研究生的教學用書,本書對高等院校和科研機構的研究人員、工程技術人員也具有參考價值。

編輯推薦

國外非參數和半參數統計的教材和專著很多,但是國內相關的教材很少,少量幾種的內容也比較陳舊。非參數和半參數統計的套用非常廣泛,本書系統的介紹了非參核核密度估計和非參核回歸的相關理論已經生存分析中的基本非參數和半參數方法。本書注重方法的提出的直觀背景,講述方法的理論時儘量避免繁雜的不必要的理論上的複雜,使得方法的講述脈絡清晰,方法的得到非常自然,方法的理論性質是可以直觀理解的。非參數和半參數統計的套用非常廣泛,本書可以作為機率論與數理統計專業以及計量經濟專業的的教材,也可以作為很多經濟、生物以及保險等專業的參考書。

前言

非參數統計與半參數統計方法在最近的30~40年來得到非常迅猛的發展,這和其自身的特點有密切的關係.非參數方法因為其不需要模型的假定,具有穩健的特點.半參數模型綜合了參數模型和非參數模型的特點,具有靈活、容易解釋的特點.非參數統計方法和半參數統計方法不僅是目前統計研究的熱點,同時,這些方法在很多實際套用領域也得到了廣泛的套用.本書介紹非參數與半參數模型的基於局部核的估計和檢驗方法,以及生存分析中常用的非參數方法和半參數模型.

本書第1章給出必要的一些機率論知識;第2章介紹用核方法估計密度函式及其相關函式;第3章介紹與密度函式有關的檢驗;第4章介紹非參數回歸;第5章介紹生存時間的函式的非參數估計;第6~8章介紹部分線性回歸模型、單指標模型和Cox模型.本書第1章可以自學;第2~4章以及第6、7章可以作為一門40或者56學時的課程;也可以將第2~8章作為一個72或者56學時的課程.鑒於本書所考慮的變數大部分都是隨機向量,因而大部分記號均為向量或者矩陣.因此,本書沒有特別用黑體字標出向量或者矩陣.

我從2007年秋季開始在中科院研究生院講授這門課程,其後基本每年都會講一次.剛開始講課時,想找好一點的英文教材或者中文教材,但是都沒有找到.後來我就想基於講義資料自己寫一本書.寫書的另一個動因是想做電子課件,後來證明用電子課件的教學效果並不好,我又回到了板書加講授的授課模式.

於是大約從2008年底開始寫這本書,一直斷斷續續在寫,在修改.可以說這幾年來一直在琢磨,一直在查找資料,如何使書的結構更為合理,如何使書的內容更加自然易懂.寫書實在是很耗費時間和精力的事情,中間也想放棄,幸運的是終於寫完了.

從2014年開始,北京套用物理與計算數學研究所的尹俊平副研究員加入幫助我完成書稿,我的兩個學生陳菲菲和葉雪也加入到書的撰寫之中,從而使書的完成速度大大加快.本書的完成,尹俊平副研究員、陳菲菲與葉雪付出了很多心血.我的另一個學生劉智凡幫助完成了部分圖的編寫以及部分內容的編寫.我的師弟胡大海、劉小惠,上這門課的學生王苗苗、華奕州等同學提供了很多修改意見.我的博士生導師王啟華研究員給我提供了很多有用的資料.本書生存分析的很多地方借鑑了王啟華老師的文章和專著的內容.我最開始接觸這個內容是我讀博士時在北大光華管理學院旁聽蘇良軍老師的課,受益很多.再次對上述老師、朋友和學生表示真誠的感謝!

也感謝選修這門課的學生,這門課開課以後,收到很多來自學生的鼓勵和肯定的意見,很多學生也提了很多很好的建議.

本書得到了國家自然科學基金、中國科學院大學校長基金和中國科學院大數據挖掘與知識管理重點試驗室開放課題以及安徽省振興計畫團隊項目(統計學前沿問題及套用)的資助.

由於時間倉促,作者的水平有限,書中的錯誤和缺點在所難免,希望廣大讀者給予批評指正.

孫志華

2016年3月

目錄

第1章預備知識....................................................................................................1

1.1背景介紹...................................................................................................1

1.2收斂方式和極限分布..................................................................................2

1.2.1依機率收斂......................................................................................2

1.2.2幾乎必然收斂..................................................................................3

1.2.3r階收斂.........................................................................................4

1.2.4依分布收斂......................................................................................4

1.2.5收斂方式間的關係............................................................................4

1.3中心極限定理和幾個常用的定理..................................................................5

1.3.1中心極限定理..................................................................................5

1.3.2幾個常用的定理...............................................................................5

1.3.3Delta方法......................................................................................6

1.4記號op(1)和Op(1).....................................................................................6

第2章非參數核密度估計......................................................................................9

2.1介紹..........................................................................................................9

2.2單元密度函式的估計..................................................................................9

2.2.1核密度估計的提出...........................................................................9

2.2.2常用的核函式及其性質...................................................................11

2.2.3以f.n(x)作為密度函式的隨機變數的一階矩和二階矩........................12

2.2.4f.n(x)的均值、方差和均方誤差........................................................13

2.3單元核密度估計的頻寬選擇.......................................................................15

2.3.1最優頻寬.......................................................................................15

2.3.2拇指法則.......................................................................................16

2.3.3最小二乘交叉驗證法則...................................................................17

2.3.4似然交叉驗證法則..........................................................................18

2.3.5小結..............................................................................................19

2.4核函式的選取...........................................................................................19

2.4.1等價核函式....................................................................................19

2.4.2典型頻寬.......................................................................................20

2.4.3最優核函式....................................................................................20

2.5高階核函式和偏差減少..............................................................................21

2.5.1定義..............................................................................................21

2.5.2高階核函式可以減少估計的偏差......................................................22

2.5.3構建高階核函式.............................................................................23

2.6單元密度函式導數的核估計.......................................................................25

2.6.1估計的提出....................................................................................25

2.6.2均值、方差和均方誤差....................................................................26

2.6.3最優頻寬.......................................................................................28

2.7單元累積分布函式的估計...........................................................................28

2.7.1估計的提出....................................................................................28

2.7.2均值、方差和均方誤差....................................................................29

2.7.3頻寬選擇以及對均方誤差的分析......................................................30

2.8多元密度函式的估計.................................................................................31

2.8.1估計的提出....................................................................................31

2.8.2多元核函式的兩種構造方法.............................................................32

2.8.3多元核密度估計的一種推廣形式......................................................33

2.8.4均值、方差和均方誤差....................................................................34

2.9多元核密度估計的漸近性質.......................................................................36

2.9.1漸近正態性....................................................................................36

2.9.2一致收斂性....................................................................................37

2.9.3邊界效應.......................................................................................38

2.10多元核密度估計的頻寬選擇......................................................................38

2.10.1拇指法則...................................................................................38

2.10.2最小二乘交叉驗證方法...............................................................39

2.11條件密度函式的估計................................................................................40

2.11.1估計的提出................................................................................40

2.11.2頻寬選擇...................................................................................41

第3章與密度函式有關的檢驗...............................................................................43

3.1預備知識..................................................................................................43

3.1.1幾個基本概念.................................................................................43

3.1.2檢驗的一般步驟.............................................................................44

3.2與參數密度函式的比較..............................................................................45

3.3檢驗密度函式是否對稱..............................................................................47

3.4檢驗兩個未知密度函式是否相等.................................................................48

3.5檢驗兩個隨機向量是否獨立.......................................................................49

3.6自助法檢驗...............................................................................................50

第4章非參數回歸...............................................................................................53

4.1局部常數核回歸........................................................................................54

4.1.1一種直觀的推導方法.......................................................................54

4.1.2另一種推導....................................................................................55

4.1.3與參數回歸模型的比較...................................................................56

4.1.4漸近性質.......................................................................................56

4.2局部常數核方法的頻寬選擇.......................................................................61

4.2.1頻寬選擇的重要性..........................................................................61

4.2.2最優頻寬.......................................................................................62

4.2.3拇指法則.......................................................................................62

4.2.4Plug-in方法..................................................................................63

4.2.5最小二乘交叉驗證方法...................................................................63

4.3局部線性核回歸........................................................................................64

4.3.1估計的提出....................................................................................64

4.3.2漸近性質.......................................................................................65

4.3.3頻寬選擇.......................................................................................68

4.4局部多項式回歸........................................................................................69

4.4.1單元變數情形.................................................................................69

4.4.2多元情形.......................................................................................72

4.5變係數模型...............................................................................................72

4.5.1模型介紹.......................................................................................72

4.5.2局部常數核估計方法.......................................................................74

4.5.3局部線性核估計方法.......................................................................76

4.6條件分布函式的估計.................................................................................77

4.6.1一個直接的估計方法.......................................................................77

4.6.2另一個估計方法.............................................................................78

4.7非參數分位回歸模型.................................................................................79

4.7.1背景..............................................................................................79

4.7.2分位函式和check函式....................................................................79

4.7.3局部線性分位回歸方法...................................................................81

4.7.4參數分位回歸方法簡介...................................................................81

4.7.5兩種其他的非參數分位回歸方法......................................................82

4.8與非參數回歸模型有關的幾個檢驗問題.......................................................83

4.8.1參數回歸模型的檢驗.......................................................................83

4.8.2某些協變數是否可以去掉的非參數檢驗............................................87

第5章非參數生存分析.........................................................................................89

5.1基本概念..................................................................................................89

5.2生存函式的估計........................................................................................93

5.2.1估計的定義和計算..........................................................................94

5.2.2估計的漸近性質.............................................................................98

5.3機率密度函式的估計...............................................................................100

5.3.1核密度估計..................................................................................101

5.3.2近鄰估計.....................................................................................106

5.3.3直方估計.....................................................................................106

5.4危險率函式的估計...................................................................................107

5.4.1核估計方法..................................................................................108

5.4.2直方估計.....................................................................................110

5.4.3近鄰估計.....................................................................................111

5.5平均剩餘壽命函式的估計.........................................................................111

第6章部分線性模型..........................................................................................115

6.1部分線性模型可估的識別性條件...............................................................115

6.2部分線性模型參數部分的估計..................................................................116

6.2.1Robinson的方法..........................................................................116

6.2.2Li的方法.....................................................................................117

6.3非參數部分的估計...................................................................................118

6.4偏似然估計方法......................................................................................119

6.5半參有效估計.........................................................................................121

6.5.1半參效率界..................................................................................121

6.5.2半參有效估計的推導.....................................................................121

6.5.3一個可行的半參有效估計..............................................................122

6.6回響變數有缺失時部分線性模型的估計.....................................................123

6.6.1背景............................................................................................123

6.6.2插補估計方法...............................................................................124

6.6.3半參回歸替代估計方法.................................................................125

6.6.4逆機率加權估計方法.....................................................................126

6.6.5頻寬選擇.....................................................................................127

6.7部分線性模型的檢驗...............................................................................128

6.8回響變數隨機缺失時部分線性模型的檢驗.................................................130

6.8.1零假設模型的估計........................................................................130

6.8.2檢驗統計量及其漸近性質..............................................................131

第7章單指標模型.............................................................................................135

7.1單指標模型簡介......................................................................................135

7.1.1單指標模型的介紹........................................................................135

7.1.2單指標模型的識別性問題..............................................................136

7.2平均導數法.............................................................................................137

7.3非線性最小二乘法...................................................................................139

7.4聯繫函式的估計......................................................................................141

7.5精確外積導數方法(ROPG)......................................................................142

7.6最小平均條件方差估計法.........................................................................143

7.7單指標模型的檢驗問題研究.....................................................................144

第8章Cox回歸模型.........................................................................................149

8.1模型介紹................................................................................................149

8.2偏似然估計方法和檢驗............................................................................150

8.2.1回歸係數的估計...........................................................................150

8.2.2回歸係數的檢驗...........................................................................151

8.2.3基準危險率函式的估計.................................................................152

8.3Cox回歸模型的檢驗...............................................................................153

參考文獻...............................................................................................................157

相關詞條

熱門詞條

聯絡我們