皮爾遜餘弦相關
如果兩個變數都是連續性變數且服從常態分配, 人為劃分為兩個類別,則不能用phi相關。
以下是一種近似算法:
![四格表](/img/8/a76/wZwpmL4gTOxkDN0AjMzATN1UTM1QDN5MjM5ADMwAjMwUzLwIzL4MzLt92YucmbvRWdo5Cd0FmLxE2LvoDc0RHa.jpg)
舉例:歷史成績是否及格是人為二分,地理成績是否及格也是人為二分,a代表歷史地理都及格,d代表歷史地理都不及格。
注意:性別、是否得某種疾病是真正二分,不能用這種算法
獨立二分樣本檢驗
n=a+b+c+d | 癌症 | 其他 |
吸菸 | a | b |
非吸菸 | c | d |
如果兩個變數是真正二分的不連續變數,且二者獨立
![四格表](/img/d/eaf/wZwpmL3czNwMjMyUDM0kTO0UTMyITNykTO0EDMwAjMwUzL1AzL2UzLt92YucmbvRWdo5Cd0FmLwE2LvoDc0RHa.jpg)
![四格表](/img/b/70f/wZwpmL0gTMwATM3EzMzATN1UTM1QDN5MjM5ADMwAjMwUzLxMzLyAzLt92YucmbvRWdo5Cd0FmLzE2LvoDc0RHa.jpg)
法1: 檢驗
![四格表](/img/1/122/wZwpmLyQTM2QjNwEjMzATN1UTM1QDN5MjM5ADMwAjMwUzLxIzL2YzLt92YucmbvRWdo5Cd0FmLwE2LvoDc0RHa.jpg)
法2:卡方檢驗 先計算邊際機率,再給出理論數,最後進行計算
法3:比率差異檢驗(Z檢驗)
聯繫:
![四格表](/img/d/eaf/wZwpmL3czNwMjMyUDM0kTO0UTMyITNykTO0EDMwAjMwUzL1AzL2UzLt92YucmbvRWdo5Cd0FmLwE2LvoDc0RHa.jpg)
![四格表](/img/d/0b6/wZwpmL0gTM4IDMxYjMzATN1UTM1QDN5MjM5ADMwAjMwUzL2IzLxYzLt92YucmbvRWdo5Cd0FmL0E2LvoDc0RHa.jpg)
![四格表](/img/d/eaf/wZwpmL3czNwMjMyUDM0kTO0UTMyITNykTO0EDMwAjMwUzL1AzL2UzLt92YucmbvRWdo5Cd0FmLwE2LvoDc0RHa.jpg)
![四格表](/img/d/eaf/wZwpmL3czNwMjMyUDM0kTO0UTMyITNykTO0EDMwAjMwUzL1AzL2UzLt92YucmbvRWdo5Cd0FmLwE2LvoDc0RHa.jpg)
檢驗和卡方檢驗 。 係數的優點在於小於1, 係數大於0.6表示強的相關,小於0.3表示弱的相關。卡方的優點在於有對應的機率可以查找。
Z檢驗的統計量平方就是卡方檢驗
![四格表](/img/b/56a/wZwpmLwIzNzUTM1kjMzATN1UTM1QDN5MjM5ADMwAjMwUzL5IzL4AzLt92YucmbvRWdo5Cd0FmLxE2LvoDc0RHa.jpg)
![四格表](/img/8/679/wZwpmL3ADN0MDN3gjMzATN1UTM1QDN5MjM5ADMwAjMwUzL4IzL2MzLt92YucmbvRWdo5Cd0FmLyE2LvoDc0RHa.jpg)
注意:卡方檢驗的自由度,對四格表而言R=C=2,
矯正公式
四格表有一格理論次數小於5,需要用矯正公式
![四格表](/img/a/0f1/wZwpmL4QzN4cTMyYzMzATN1UTM1QDN5MjM5ADMwAjMwUzL2MzLxMzLt92YucmbvRWdo5Cd0FmLzE2LvoDc0RHa.jpg)
相關樣本檢驗
第一次同意 | 第一次反對 | |
第二次反對 | A | B |
第二次同意 | C | D |
由McNemar提出,如果兩個變數相關(例如同一批人對同一個問題表明意見)
![四格表](/img/7/1ea/wZwpmL3ATM3MDOyQjMzATN1UTM1QDN5MjM5ADMwAjMwUzL0IzL3IzLt92YucmbvRWdo5Cd0FmLxE2LvoDc0RHa.jpg)
矯正公式
四格表有一格理論次數小於5,需要用矯正公式
![四格表](/img/9/23d/wZwpmLzYTN1UzMzkjMzATN1UTM1QDN5MjM5ADMwAjMwUzL5IzL3EzLt92YucmbvRWdo5Cd0FmLwE2LvoDc0RHa.jpg)