詳細介紹
我們在做假設檢驗的時候會犯兩種錯誤:第一,原假設是正確的,而你判斷它為錯誤的;第二,原假設是錯誤的,而你判斷它為正確的。我們分別稱這兩種錯誤為第一類錯誤(Type I error)和第二類錯誤(Type II error) 。
第一類錯誤:原假設是正確的,卻拒絕了原假設。
第二類錯誤:原假設是錯誤的,卻沒有拒絕原假設。
我們常把假設檢驗比作法庭判案,我們想知道被告是好人還是壞人。原假設是“被告是好人”,備擇假設是“被告是壞人”。法庭判案會犯兩種錯誤:如果被告真是好人,而你判他有罪,這是第一類錯誤(錯殺好人);如果被告真是壞人,而你判他無罪,這是第二類錯誤(放走壞人)。
記憶方法:我們可以把第一類錯誤記為“以真為假”,把第二類錯誤記為“以假為真”。當然我們也可以將第一類錯誤記為“錯殺好人”,把第二類錯誤記為“放走壞人”。
在其他條件不變的情況下,如果要求犯第一類錯誤機率越小,那么犯第二類錯誤的機率就會越大。這個結論比較容易理解,當我們要求“錯殺好人”的機率降低時,那么往往就會“放走壞人”。
同樣的,在其他條件不變的情況下,如果要求犯第二類錯誤機率越小,那么犯第一類錯誤的機率就會越大。當我們要求“放走壞人”的機率降低時,那么往往就會“錯殺好人”。同樣的,在其他條件不變的情況下,如果要求犯第二類錯誤機率越小,那么犯第一類錯誤的機率就會越大。當我們要求“放走壞人”的機率降低時,那么往往就會“錯殺好人”。
機率計算
假設檢驗是利用反證法,依據樣本統計量做出的統計推斷,其推斷結論有可能發生I型錯誤(第一類錯誤)和Ⅱ型錯誤(第二類錯誤)兩種錯誤,如表所示 。
I型錯誤是指拒絕了實際上成立的H0,為“棄真”的錯誤,其機率通常用α表示,這稱為顯著性水平(significance level)。α可取單側也可取雙側,可以根據需要確定α的大小,一般規定α=0.05或α=0.01。其意義為:如果假設檢驗結論拒絕H0,發生I型錯誤的機率為5%或1%,即100次拒絕H0的結論中,平均有5次或1次是錯誤的。
Ⅱ型錯誤是指不拒絕實際上不成立的H0,為“存偽”的錯誤,其機率通常用β表示。β只能取單尾,假設檢驗時一般不知道β的值,在一定條件下(如已知兩總體的差值δ、樣本含量n和檢驗水準α)可以測算出來。在假設檢驗中同時減少兩類錯誤的最好方法是適當增加樣本含量 。
檢驗的勢(power of the test)定義為在原假設是錯誤的情況下正確拒絕原假設的機率。檢驗的勢等於1減去犯第二類錯誤的機率:power=1一P(Type II error)
我們用表來更清楚地表示顯著性水平和檢驗的勢 。