加權卡方檢驗

概念

卡方檢驗是用途很廣的一種假設檢驗方法,它在分類資料統計推斷中的套用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。

卡方檢驗基本思想

在分類資料統計分析中我們常會遇到這樣的資料,如兩組大白鼠在不同致癌劑作用下的發癌率如下表,問兩組發癌率有無差別?
--------------------------------------------------------------------------------
處理髮癌數未發癌數合計發癌率%
--------------------------------------------------------------------------------
甲組52197173.24
乙組3934292.86
--------------------------------------------------------------------------------
合計912211380.33
--------------------------------------------------------------------------------
5219
393
是表中最基本的數據,因此上表資料又被稱之為四格表資料。卡方檢驗的統計量是卡方值,它是每個格子實際頻數A與理論頻數T

差值平方與理論頻數之比的累計和。每個格子中的理論頻數T是在假定兩組的發癌率相等(均等於兩組合計的發癌率)的情況下計算出來的,如第一行第一列的理論頻數為71*91/113=57.18,故卡方值越大,說明實際頻數與理論頻數的差別越明顯,兩組發癌率不同的可能性越大。

四格表資料的卡方檢驗

四格表資料的卡方檢驗用於進行兩個率或兩個構成比的比較。

1.專用公式:若四格表資料四個格子的頻數分別為a,b,c,d,則四格表資料卡方檢驗的卡方值=(ad-bc)2*n/(a+b)(c+d)(a+c)(b+d),
自由度v=(行數-1)(列數-1)

2.套用條件:要求樣本含量應大於40且每個格子中的理論頻數不應小於5。當樣本含量大於40但理論頻數有小於5的情況時卡方值需要校正,當樣本含量小於40時只能用確切機率法計算機率。

行X列表資料的卡方檢驗

行X列表資料的卡方檢驗用於多個率或多個構成比的比較。
1.專用公式
r行c列表資料卡方檢驗的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]

2.套用條件:
要求每個格子中的理論頻數T均大於5或1<5的格子數不超過總格子數的1 5。當有T<1或1<5的格子較多時,可採用並行並列、刪行刪列、增大樣本含量的辦法使其符合行X列表資料卡方檢驗的套用條件。而多個率的兩兩比較可採用行X列表分割的辦法。
四、列聯表資料的卡方檢驗:
同一組對象,觀察每一個個體對兩種分類方法的表現,結果構成雙向交叉排列的統計表就是列聯表
1.R*C列聯表的卡方檢驗:
R*C列聯表的卡方檢驗用於R*C列聯表的相關分析,卡方值的計算和檢驗過程與行X列表資料的卡方檢驗相同。

2.2*2列聯表的卡方檢驗:
2*2列聯表的卡方檢驗又稱配對記數資料或配對四格表資料的卡方檢驗,根據卡方值計算公式的不同,可以達到不同的目的。當用一般四格表的卡方檢驗計算時,卡方值=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此時用於進行配對四格表的相關分析,如考察兩種檢驗方法的結果有無關係;當卡方值=(|b-c|-1)2/(b+c)時,此時卡方檢驗用來進行四格表的差異檢驗,如考察兩種檢驗方法的檢出率有無差別。列聯表卡方檢驗套用中的注意事項同R*C表的卡方檢驗相同。

相關詞條

相關搜尋

熱門詞條

聯絡我們