簡介
問題的提出
在實踐中我們常常會遇到以下一些資料,如需比較患者和正常人的血清鐵蛋白、血鉛值、不同藥物的溶解時間、實驗鼠發癌後的生存日數、護理效果評分等,這類資料有如下特點:
(1)資料的總體分布類型未知;
(2)資料的總體分布類型已知,但不符合常態分配;
(3)某些變數可能無法精確測量;
(4)方差不齊。
對於此類資料,除了進行變數變換或t’檢驗外,可採用非參數統計方法。
參數統計與非參數統計的區別
參數統計:即總體分布類型已知,用樣本指標對總體參數進行推斷或作假設檢驗的統計分析方法。
非參數統計:即不考慮總體分布類型是否已知,不比較總體參數,只比較總體分布的位置是否相同的統計方法。
類型
配對
對配對比較的資料應採用符號秩和檢驗(signed-rank test),其基本思想是:若檢驗假設成立,則差值的總體分布應是對稱的,故正負秩和相差不應懸殊。檢驗的基本步驟為:
(1)建立假設;
H0:差值的總體中位數為0;
H1:差值的總體中位數不為0;檢驗水準為0.05。
(2)算出各對值的代數差;
(3)根據差值的絕對值大小編秩;
(4)將秩次冠以正負號,計算正、負秩和;
(5)用不為“0”的對子數n及T(任取T+或T-)查檢驗界值表得到P值作出判斷。
應注意的是當n>25時,可用正態近似法計算u值進行u檢驗,當相同秩次較多時u值需進行校正。
成組
兩樣本成組資料的比較套用Wilcoxon秩和檢驗,其基本思想是:若檢驗假設成立,則兩組的秩和不應相差太大。其基本步驟是:
(1)建立假設;
H0:比較兩組的總體分布相同;
H1:比較兩組的總體分布位置不同;檢驗水準為0.05。
(2)兩組混合編秩;
(3)求樣本數最小組的秩和作為檢驗統計量T;
(4)以樣本含量較小組的個體數n1、兩組樣本含量之差n2-n1及T值查檢驗界值表;
(5)根據P值作出統計結論。
同樣應注意的是,當樣本含量較大時,套用正態近似法作u檢驗;當相同秩次較多時,套用校正公式計算u值。
多樣
多個樣本比較的秩和檢驗可用Kruskal-Wallis法,其基本步驟為:
(1)建立假設;
H0:比較各組總體分布相同;
H1:比較各組總體分布位置不同或不全相同;檢驗水準為0.05。
(2)多組混合編秩;
(3)計算各組秩和Ri;
(4)利用Ri計算出檢驗統計量H;
(5)查H界值表或利用卡方值確定機率大小。
應注意的是當相同秩次較多時,應計算校正Hc
等級
這類資料的特點是無原始值,只知其所在組段,故套用該組段秩次的平均值作為其秩次,在此基礎上計算秩和並進行假設檢驗,其步驟與兩組或多組比較秩和檢驗相同。需注意的是由於樣本含量較多,相同秩次也較多,套用校正後的u值和H值。
小結
多個樣本兩兩比較的秩和檢驗
同樣的,多個樣本組比較的秩和檢驗,如拒絕H0,只說明比較各組的總體分布位置不同或不全相同,應在此基礎上進行兩兩比較,常用Nemenyi法。
秩和檢驗的優缺點
秩和檢驗的優點是(1)不受總體分布限制,適用面廣;(2)適用於等級資料及兩端無確定值的資料;(3)易於理解,易於計算。缺點是符合參數檢驗的資料,用秩和檢驗,則不能充分利用信息,檢驗功效低。
3.套用中的注意事項:
(1)注意套用條件;
(2)編秩時相同值要取平均秩次;
(3)相同秩次較多時,統計量要校正。
秩和檢驗常用軟體
spss軟體,只要輸入數據,選擇合適的參數,就可以很快得到結果。