介紹
參數估計的一種形式。通過從總體中抽取的樣本,根據一定的正確度與精確度的要求,構造出適當的區間,以作為總體的分布參數(或參數的函式)的真值所在範圍的估計。例如,估計一種藥品所含雜質的比率在1~2%之間;估計一種合金的斷裂強度在1000~1200千克之間,等等。在有的問題中,只需要對未知量取值的上限或下限作出估計。如前例中,一般只對上限感興趣,而在第二例中,則只對下限感興趣。
在數理統計學中,待估計的未知量是總體分布的參數或的某個函式()。區間估計問題可一般地表述為:要求構造一個僅依賴於樣本X=(1,2,…,)的適當的區間[(X),(X)],一旦得到了樣本X[2kg]的觀測值,就把區間[(),()]作為或()的估計至於怎樣的區間才算是“適當”,如何去構造它,則與所依據的原理和準則有關。這些原理、準則及構造區間估計的方法,便是區間估計理論的研究對象。作為參數估計的形式,區間估計與點估計是並列而又互相補充的,它與假設檢驗也有密切的聯繫。
置信區間理論 這是1934年,由統計學家J.奈曼所創立的一種嚴格的區間估計理論。置信係數是這個理論中最為基本的概念。
置信係數 奈曼以機率的頻率解釋為出發點,認為被估計的是一未知但確定的量,而樣本X是隨機的。區間[(X),(X)]是否真包含待估計的,取決於所抽得的樣本X。因此,區間[(X),(X)]只能以一定的機率[537-03]包含未知的。對於不同的,()之值可以不同,()對不同的取的最小值1-(0<<1)稱為區間[(X),(X)]的置信係數。與此相應,區間[(X),(X)]稱為的一個置信區間。這個名詞在直觀上可以理解為:對於“區間[(X),(X)]包含”這個推斷,可以給予一定程度的相信,其程度則由置信係數表示。
對的上、下限估計有類似的概念,以下限為例,稱(X)為的一個置信下限,若一旦有了樣本X,就認為不小於(X),或者說,把估計在無窮區間[(X),∞)內。“不小於(X)”這論斷正確的機率為[537-04][537-4])。1()對不同的[2kg][2kg]取的最小值[2kg]1-(0<<1)稱為置信下限(X)的置信係數。
在數理統計中,常稱不超過置信係數的任何非負數為置信水平。
優良性準則 置信係數1-反映了置信區間[(X),(X)]的可靠程度,1-愈大,[(X),(X)]用以估計時,犯錯誤(即並不在[(X),(X)]之內)的可能性愈小。但這只是問題的一個方面。為了使置信區間[(X),(X)]在實際問題中有用,它除了足夠可靠外,還應當足夠精確。比如說,估計某個人的年齡在5至95歲之間,雖十分可靠,但太不精確,因而無用。通常指定一個很小的正數(一般,取0.10,0.05,0.01等值),要求置信區間[(X),(X)]的置信係數不小於1-,在這個前提下使它儘可能地精確。對於“精確”的不同的解釋,可以導致種種優良性標準。比較重要的有兩個:一是考慮區間的長度(X)-(X)愈小愈好。這個值與X有關,一般用其數學期望E((X)-(X))作為衡量置信區間[(X),(X)]精確程度的指標。這個指標愈小,置信區間的精確程度就愈大。另一個是考慮置信區間[(X),(X)]包含假值(指任何不等於被估計的的值)的機率[537-5][537-05],它愈小,[(X),(X)]作為的估計的精度就愈高。
如果(X)是的置信下限,則在保證(X)的置信係數不小於1-[2kg]的前提下,(X)愈大,精確程度愈高。這也可以用[(X),∞)包含假值(<)的機率[537-5][537-06]來衡量,此機率愈小,置信下限(X)的精確程度愈高。對置信上限有類似的結果,若在某個準則下,一個置信區間(或上、下限)比其他置信區間都好,則稱它為在這個準則下是一致最優的。例如,在上述準則下,置信係數1-的一致最優置信下限(X)定義為:(X)有置信係數1-,且對任何有置信係數1-的置信下限1(X),當<時,成立[537-07]
有時,對所考慮的置信區間(或上、下限)加上某種一般性限制,在這個前提下尋。