內容介紹
去年年底,我翻出一本書來補自己的統計直覺,這部不推薦,是因為這書不好找了,只是個人喜歡,書也薄些,美國G.H.維恩堡等著的《數理統計初級教程》(常學將等譯,太原:山西人民出版社,1986)。這本書的扉頁,有位前讀者題辭(在圖書館的書亂塗亂畫啊):“本書給你統計學的直覺。”這書我續借超期再借在續借,已近一年,感受是,這書在培養直覺直觀方面,真是下足了功夫。美中不足的是,這個譯本沒有提到這本書的原名就叫做Statistics: An Intuitive Approach。前面我好幾處提到“直覺”。統計直覺我沒資格發言,以前念經濟學,隱隱約約能感覺到economic intuition這玩意。這東西不好說,卻也能表達一二。跟大部分學科一樣,經濟學看著也能分成兩個類型(接下來我還要強調它們不是對立的),一是專業期刊里充滿恐龍級數學符號那種,另外就是白話散文那種。分析現實問題(不必是經濟問題)時,也就相應兩種思路,一是建立數學模型,二就是拿白話解釋,偶爾再加一個簡單的圖表。這兩種方式,白話看似容易些,但也容易流於胡說八道,就要為學院人士所不齒。數學的技術活多些,容易出成果,好拿諾貝爾經濟學獎。由白話而成巨星的,我們稱之為思想家,更是難能可貴,如諾獎得主科斯,主創產權和交易成本理論的。北大出來去芝加哥大學念經濟學的王勇講了一個好故事:
白話加邏輯,不用數學而對問題有洞見,說的大概就是“直覺”吧。當然,數學公式密布的場合,直覺也有用武之地,比如,滿滿一黑板你證明出了一個複雜的定理,然後你拿白話說明為什麼會有這個結果,The intuition behind this equation is blablabla,那直覺就相當強了。
經濟學直覺完畢。關於統計學直覺,我是類似這樣理解的。對非統計科班出身的我們來說,這種訓練可能更為重要,而且更為迫切。我們對統計學抱著非常實用的態度,無暇也無力關注大多模型定理背後的推導過程,但為了解釋和理解,我們需要對它們有一個通盤的印象,其中的細節不是通過數學推導而來,但是能夠用白話明確地表達出來。比如中心極限定理,一個簡單的形式是獨立同分布的中心極限定理,大概說,如果隨機變數X1,…Xn,…相互獨立,服從同一分布,且具有相同的數學期望和方差,則隨機變數之和ΣXi的標準化變數服從標準常態分配,這可以用數學精確地證明出來。我沒有掌握這個推導,但我敢說我能理解這個定理,並且能夠明確無誤地傳達出來,用白話,而不是剛才提到的數學語言。我讀維恩堡《數理統計初級教程》,裡面是這種處理的
這就是我喜歡的Intuitive Approach。這本書行走可讀,坐臥可讀,藉助些簡單的符號,適度的圖表,統計學的基本模型都可以這樣清晰地用白話表達出來。我下功夫學習並鼓吹用白話描述統計學,是去年跟Teradata的一位朋友聊天,他提到向客戶陳述數據分析結果時,一定要用大白話明確地說出來。當時我嘗試了一下,發現自己對統計學的基本概念,都還停留在數學描述的階段。慚愧慚愧,那時的還自以為自己頗有些統計的基礎呢,從此下決心苦練基本功,目標是對所有基本的統計概念、模型,都要達到能夠清楚地向一個高年級高中生描述的程度。從套用的角度來說,這種訓練是必須的。一個統計學家,不能指望他的聽眾都一樣統計出身,同樣,對大多數需要套用統計工具的非統計學家來說,也不能假設他的客戶一樣是統計愛好者,專業辭彙只在一個很窄的圈子裡通用。
作品目錄
第一章 緒論1.1 你與統計
1.2 統計史概述
1.3 描述統計與抽樣統計
1.4 隨機樣本和分層隨機樣本
1.5 統計方法的濫用
1.6 對統計的懷疑主義與對這種觀點的反駁
習題
2.1定義
第二章 平均數,中位數,眾數
2.2 平均數的兩個性質
2.3 項的改變對平均數的影響
2.4 平均數、中位數及眾數的套用
2.5 記號
習題
第三章 可變性及兩種可變性測度
3.1 可變性
3.2 方差
3.3標準差
3.4改變分布中的項如何影響標準差及方差
3.5 方差的套用
3.6記號
3.7 方差的計算公式
習題
第四章 說明分布中項的位置的方法
4.1百分等級與百分位
4.2 z變數
4.3z變數平均數
4.4z變數與百分等級之間無固定關係
4.5z變數集合的平均數與標準差
4.6標準變數(或T變數)
4.7套用
4.8記號
習題
第五章 數據分組與作圖
5.1離散變數與連續變數
5.2 離散變數值的列表與作圖
5.3 捨入
5.4數據分組――離散情況
5.5數據分組――連續情況
5.6 作為漸近圖形的曲線
5.7面積的意義
5.8以數據確定分布圖形的形狀
習題
第六章 用分組數據計算各種指標
6.1引言
6.2用直方圖求中位數與百分位數
6.3中位數及其它百分位數的計算
6.4四分位數與十分位數
6.5由分組數據求百分等級
6.6 累積曲線
6.7分組數據的眾數
6.8分組數據的平均數――直接方法
6.9分組數據的平均數――編碼方法
6.10 關於分組數據的方差與標準差――直接方法
6.11 分組數據的方差與標準差――編碼方式
習題
總複習Ⅰ
7.1 理論分布
7.2 常態分配與正態曲線
第七章 常態分配
7.3 常態分配的四個性質
7.4 使用常態分配表作關於項的推斷
7.5 射擊的分布
7.6由百分等級確定z變數的值
習題
第八章 樣本和的分布及樣本平均數的分布
8.1中心極限定理
8.2如何實際使用定理8?1
8.3 樣本平均數的中心極限定理
8.4 樣本平均數分布的性質
8.5確定一個樣本平均數在其樣本分布中的位置
習題
第九章 機率
9.1 機率
9.2日常說法中的“機率”一詞
9.3 樣本空間和事件
9.4 機率與抽樣試驗
9.5 機率和常態分配
9.6關於樣本平均的機率陳述
9.7 二項分布的正態逼近
習題
第十章 判定和風險
10.1 引言
10.2 假設檢驗
10.3 關於均勻硬幣和有偏硬幣檢驗的最終結果
10.4 利用樣本平均值的分布計算各類錯誤
10.5 關於風險的最後的話
習題
總複習Ⅱ
11.1引言
第十一章 假設檢驗方法
11.2 零假設
11.3 什麼時候拒絕零假設,顯著性水平
11.4 三個假設檢驗問題
11.5 某些新說法
11.6 單邊檢驗
習題
第十二章 估計
12.1 引言
12.2 估計的無偏性
12.3 自由度概念
12.4 方差的估計
12.5 s2的計算公式
12.6 區間估計
12.7總體均值的區間估計
習題
第十三章 t分布與t檢驗
13.1引言
13.2 t分布
13.3 兩平均數之差的t檢驗
13.4 平均數之差的t檢驗的套用
13.5匹配分組的t檢驗
習題
第十四章 F檢驗和方差分析
14.1引言
14.2 F分布的理論模型
14.3 兩個以上的樣本均值的比較
14.4 方差分析引論
14.5 方差分析技術
習題
總複習Ⅲ
15.1 引言
第十五章 回歸與預測
15.2 盲目預測
15.3 預定變數和預測變數
15.4 回歸
習題
第十六章 相關
16.1 相關的概念
16.2 兩z變數取值集合之間的相關
16.3 相關係數
16.4 相關係數的計算
16.5 相關係數的顯著性檢驗
習題
第十七章 相關與線性回歸
17.1引言
17.2 相關係數的幾何意義
17.3 原始數據散布圖的最優擬合直線
17.4 最優擬合直線與預測
17.5 相關與線性預測的精度
習題
18.1引言
第十八章 獨立性的X2檢驗和擬合優度
18.2 獨立性
18.3相關的實例
18.4以列聯表表示調查結果
18.5期望頻數
18.6 X2檢驗
18.7 更複雜的X2檢驗
18.8 X2檢驗與“擬合優度”
習題
19.1 引言
第十九章 非參數統計檢驗
19.2 曼-惠特尼檢驗
19.3 符號檢驗――“事先”和“事後”資料
19.4 威爾柯克斯符號秩檢驗――自然對樣本
19.5 秩相關檢驗――皮爾遜相關係數r
的顯著性檢驗的另一種形式
19.6 隨機性的遊程檢驗
習題
總複習Ⅳ
附錄
索引