方差同質性檢驗的研究對象
我們經常遇到這樣的一些問題:要判斷不同的廠家生產的同一類產品的質量性能是否有本質的差異、來自不同地區的學員的某些素質是否存在顯著的差異、不同方法培育的動植物間是否有明顯的區別。這些不同的問題,當測定的指標值都來自正態總體時,可以用方差齊性檢驗和均值相等檢驗,但是對總體分布族信息掌握很少、分布不明確或數據是分組數據形式時(例如壽命試驗中定周期測試數據、截尾壽命試驗數據等),只能用非參數方法,即都可以歸結成方差同質性檢驗。
設有m個總體,分別從中各取一個樣本,第i個樣本是
Xi1、Xi2…、Xini,1=l,2,…,m
其中ni是第i個樣本量,n1+n2+…+nm=n。
如何檢驗這些樣本之間的差異是由隨機因素引起的,還是樣本間有本質的差異?如果我們能檢驗這m個樣本來自同一總體,那么它們之間的差異是由隨機因素引起的;反之,則其間存在著本質的差異。
方差齊性檢驗與Fisher檢驗
對要處理的數據是服從常態分配的情況下,我們可以充分利用正態性,簡化檢驗的方法。設m個樣本都來自正態總體,要檢驗這m個樣本是否來自同一總體,或這m個樣本間是否存在著本質的差異,那么我們既要檢驗這m個樣本的方差是否存在著顯著差異,又要檢驗其均值間是否存在著顯著的差異。
先進行方差齊性檢驗。建立假設,當m個樣本容量不全相等時,即n1、n2、…、nm不全相等,用Barlett檢驗法;
若n1=n2=…=nm=n0時,上述Barlett檢驗法仍然適用,但利用Hartley檢驗計算更簡單 。
方差同質性檢驗
如果我們對要處理的數據的分布了解甚少,或者數據是分組形式時,就需要有一種與總體分布的具體形式無關的非參數統計方法。方差同質性檢驗就是一種非參數方法。將m個樣本混合為一個合樣本:
(X11,X12,…X1ni,…Xm1,Xm2,…Xmmi)
其容量為n。試問。這m個樣本是否來自同一總體,為此假設H0:m個樣本來自同一總體。利用X2-檢驗法來研究在什麼情況下應拒絕原假設H0。具體做法:
(1)把總體的取值範圍分成l個不相交的子集:A1,A2,…,Ai
(2)記rij為第i個樣本觀察值落入Aj的個數,其中ni是第i個樣本的容量,rj是m個樣本落入Aj的頻數。
(3)在假設H0為真的情況下,求出第i個樣本落人Aj的理論頻數。在H0為真的條件下,諸樣本來自同一總體,Pi只與劃分Aj有關,與所取樣本無關,即不依賴於i=l,2,…,m。因為對總體分布沒有作任何假定,所以用頻率去估計機率Pj。
(4)考慮統計量。當n趨近於無窮時,X的極限分布為自由度f的X2分布。所以當n充分大時,可用X統計量作為方差同質性檢驗的統計量。統計量X的值愈大,說明實際頻數rij與理論頻數niPj的差愈大,m個樣本來自同一總體的可能性愈大。
(5)參數估計:經方差同質性檢驗或方差齊性檢驗、均值相等檢驗沒有顯著差異的m個樣本,我們可以視其為來自同一總體的一個合樣本進行參數估計。
方差同質性檢驗對壽命試驗分組數據的分析
當幾個樣本來自常態分配或可化為常態分配的總體時,要檢驗它們是否有本質差異。為了了解某9家漆包線廠產品耐熱性的差異,將電纜所對的9家生產的漆包線所作的熱老化試驗數據,進行統計分析。
(1)壽命試驗數據的分布
在高溫下對9家生產的漆包線各取20個試樣進行周期性老化試驗,記錄每周期內的失效數。根據國內外對絕緣熱老化有關數據的統計分析,認為絕緣的熱壽命T分布為對數常態分配。根據這一特徵,要判斷這9家漆包線的耐熱性差異,先進行對數正態性檢驗,再採用方差齊性檢驗和Fisher檢驗。
(2)失效時間的估算
對絕緣結構進行的壽命試驗是周期性的,只知受試樣品在那個試驗周期內失效,而不知具體失效時間,為此我們採用等分插值法估算失效樣品的失效時間,即如果已知在第i個周期內有r個樣品失效,則其中第i個樣品的失效時間為tij。
(3)壽命數據的對數正態性的W檢驗法
(4)方差齊性檢驗
在對數常態分配的假設下,如果9個對數方差分之間及對數均值爪之間在統計上均沒有顯著差異,就可以認為這些生產廠家的產品壽命基本上是一致的.為此先作方差齊性檢驗。
(5)Fisher檢驗:對上述7個樣本的對數均值作檢驗。
經上述檢驗,我們可以將1、2、5、…、9號樣本與3、4號樣本各作為一個合樣本進行平均壽命的估計。分析絕緣結構平均壽命可知3、4號樣本質量明顯優於其它7家產品,而這7家產品的絕緣結構之間也相似,不存在顯著差異 。