抽樣框

抽樣框

抽樣框又稱“抽樣框架”、“抽樣結構”,是指對可以選擇作為樣本的總體單位列出名冊或排序編號,以確定總體的抽樣範圍和結構。設計出了抽樣框後,便可採用抽籤的方式或按照隨機數表來抽選必要的單位數。若沒有抽樣框,則不能計算樣本單位的機率,從而也就無法進行機率選樣。

抽樣框簡介

好的抽樣框應做到:完整而不重複。

常見的抽樣框:大學學生花名冊、城市黃頁里的電話列表、工商企業名錄、街道派出所里居民戶籍冊、意向購房人信息冊……。在沒有現成的名單的情況下,可由調查人員自己編制。應該注意的是,在利用現有的名單作為抽樣框時,要先對該名錄進行檢查,避免有重複、遺漏的情況發生。以提高樣本對總體的代表性。

例如:要從10000名職工中抽出200名組成一個樣本,則10000名職工的名冊,就是抽樣框。

確定抽樣框,即根據研究目的和內容確定抽樣總體的范同與單位。抽樣框來自抽樣總體,也就是採用一定的方法把總體巾的每一單位組合成一種可供選擇的形式。簡單的總體可直接根據其組成名單形成抽樣框(林聚任、劉玉安,2008)。

本研究的抽樣單位是個人,抽樣總體較為簡單,可直接將總體名單作為抽樣框,即本研究將在12073人中抽¨j本研究的調查對象。需要說明的是,本研究的預調查與正式調查採用的是同一抽樣框。在正式調查的抽樣中,為保證樣本的公平分布,本研究並未從該抽樣框中除去曾參與預調查的受訪者。

常見形態

抽樣框又叫抽樣構架或抽樣結構,實際上,它就是指可以備選作為樣本的全部抽樣單位(總體單位)的順序或編排形式。這個概念最早出現在美國的農業抽樣調查中。他們認為,目標總體確定後,還是比較抽象的,應該把全部應該作為備選的單位編排成目錄,使總體包括的單位的名稱、地址、編號等落實在文字上。這樣也可保證各單位既不遺漏,又不被重複抽取。

在實踐中,抽樣構架有三種形態。

1)具體的抽樣結構

即抽樣單位可列成表冊的形態。包括目錄結構、區域結構和目錄區域複合結構。例中的20 000學生花名冊即屬目錄結構。在進行整群抽樣時,我們將城市居民按習慣的區段位置排列作為備選的居民群,就是區域結構。如果對抽中的居民群不進行全面調查,而是再抽選部分居民,又需要一個居民花名冊,這就變成了複合結構。

2)抽象的抽樣結構

即抽樣單位沒有表冊而是開放的形態。只要符合調查條件就是抽樣結構中的元素。例如,在大型零售商場對購買者或消費者進行隨機訪問調查時,其抽樣結構就是抽象的,隱含的。

3)階段式抽樣結構

在採用分段抽櫸設計時,按照抽樣階段不同,可產生不同的抽樣結構。

誤差分析

抽樣框誤差便是因不準確或不完整的抽樣框而引起的誤差。問題是,從包含抽樣誤差的抽樣框中抽取的樣本有時無法正確地代表調研目標的實際情況,這就存在抽樣框誤差。舉個例子,以電話號碼薄作為抽樣框,在對某地區所有住戶進行的某種意向調查時,就存在著抽樣框誤差。

理想抽樣框的標準是能夠實現目標總體與抽樣總體的一致,然而在實踐中由於設計或是資料本身等方面的原因,目標總體與抽樣總體往往不一致,無法保證樣本的代表性,而且由於目標總體單位數不準確,對總體進行估計時就會產生估計量偏倚,增大其方差。這種誤差並不是來自抽樣的隨機性,而是產生於不完善的抽樣框,因此稱為抽樣框誤差。抽樣框誤差是一種非抽樣誤差。

誤差來源

1、丟失目標總體單位

丟失目標總體單位也被稱為“涵蓋不足”,是指抽樣框沒有覆蓋全部目標總體單位,有些目標單位沒有在抽樣框中出現,因而也就沒有機會被選人樣本,這些單位成為丟失目標單位。對丟失的總體單位不能發現並糾正會造成調查中對總量的估計偏低。

2、包含非目標單位

包含非目標單位也被稱為“過涵蓋”,是指抽樣框中包含了一些不屬於研究對象的非目標總體單位。這種偏差的影響很大,但是潛在威脅卻通常會小一些。因為可以在調查中辨認出非目標元素並把它們剔除。一般情況下,由於抽樣框中存在非目標總體單位,容易造成估計量的高估。

3、丟失和包含共存

丟失目標單位和非目標單位共存是指在抽樣框中既有丟失目標單位,也有包含非目標單位。在實際調查中,丟失目標單位不易被查覺和發現,具有較大的隱蔽性,相比之下,包含非目標單位的抽樣框誤差的威脅性要小些。因為在調查過程中,非目標單位容易被發現,並予以剔除。此外,如果丟失目標單位和非目標單位數量相當,也相互抵消,估計量是否會產生偏差也難以斷定。這要取決於丟失目標單位和非目標單位的數量特徵是否有顯著差異。

4、複合連線

複合連線是指抽樣框單元與目標總體單元不完全一一對應,而是存在一對多、多對一或是多對多模式的現象。在前一種模式中,若進行簡單隨機抽樣,能保證每個目的總體單位以同等的可能性被抽中。在後兩種模式中進行簡單隨機抽樣,每個目的總體單位被抽中的機率是不同的,從而使估計量產生偏斜。例如:若某銀行想了解其客戶的情況進行一次抽樣調查,則該行所有客戶構成目的總體。選擇的抽樣框是銀行的來往帳目,這就構成了多對一模式。若在這個框中進行抽樣,則來往帳目多的客戶被抽中的可能性則較大,反之來往帳目少的客戶被抽中的可能性很小,而兩種客戶通常會有較大差異,從而造成樣本的偏斜,使估計量產生偏差。

5、不正確的輔助信息

不正確的輔助信息誤差也被稱為稱為“內容上的偏差”,這種誤差的主要影響是降低估計的精度。許多抽樣框中包含了輔助信息,可用於特殊的抽樣設計和估計技術。可用這些輔助信息來進行分層抽樣,對規模大小的測度用於與規模成比例的機率抽樣。如果輔助信息的特徵與研究的調查變數的特徵高度相關,還可以用於比率估計和回歸估計。但是這些輔助信息可能有錯誤,或者是一些抽樣單位不具備輔助信息,那么就會對抽樣精度產生巨大的影響。

6、抽樣框老化

抽樣框老化又被稱為“抽樣框過時”或“不準確的抽樣框”,是指隨著時間的推移,抽樣總體與目標總體產生極大的偏差,即原來的抽樣框不符合實際情況,必須進行更新。最典型的例子,就是隨著城市建設的大規模展開,許多地區已被改造,地址發生了變化,如果仍按以前的抽樣框去抽樣,那么精度就會難以控制。

減少誤差

減少抽樣框誤差方法
1、
在抽選樣本之前,要對抽樣框加以檢查,發現可能存在的問題,進行識別、處理,並採取一定措施加以補救。

可以和普查或其他調查資料的總值或記錄等相比較、分析,進而查明是否存在遺漏。可以利用客觀現實的相互聯繫,找出平衡關係,推算是否有偏差。發現存在問題時,要及時進行補救。當一些目標總體單位對調查結論不會產生太大影響時,可重新把抽樣框定義為可以得到的目標總體單位,將抽樣框視為舊抽樣框所能提供的總體。當抽樣框不能涵蓋抽樣總體時,就可以採用輔助抽樣框,採用此法要避免目標單位的重疊。

2、聯接遺漏單位法,就是指把抽樣樣本遺漏的個體和抽樣樣本中某個值相聯接,其聯接規則必須在調查前明確規定。其前提條件是在抽樣過程中能發現被遺漏的單位。

此外,對抽樣框進行清查是最費力、最繁瑣也是效果最好的一種方法。在臨近調查前,重新獨立構建抽樣框的全部或部分。

單元區別

抽樣框與抽樣單元是抽樣的一對基本範疇。其單元滿足“與實際總體的每個單元之間存在確定的對應關係,憑藉這種對應關係可以找到實際總體中特定的一個或一些單元”條件的實際總體的映射總體稱為抽樣框,構成映射總體的單元則稱為抽樣單元。

換言之,包含所有抽樣單元的總體稱為抽樣框,構成抽樣框的單元稱為抽樣單元。

事實上,為了方便抽樣的實施,必須擁有一個目錄性清單,這個目錄性清單中的每個目錄項與實際總體的每個單元之間存在確定的對應關係,即根據一個目錄項總可以找到實際總體中特定的一個或一些單元。抽樣框就是這種一個目錄性清單。

抽樣框可能以各種形式出現:名單、手冊、地圖、數據包……。由於無論抽樣框採取何種形式,在抽樣之後,調查者必須能夠根據抽樣框找到具體的抽樣單元。因此,抽樣框必須是有序的,即抽樣單元必須編號,且根據某種順序進行了排列;抽樣框中包含的抽樣單元務必要“不重不漏”,否則將出現抽樣誤差。

抽樣單元不僅指構成抽樣框的目錄項,同時還表示該目錄項所對應的實際總體特定的一個或一些單元。形象地說,不僅是影子,還是影子所反映的實體。儘管抽樣文獻對此不置一詞,但讀者記住這一點仍大有裨益。為了區分抽樣單元的這兩種不同意義,實體抽樣單元又稱為樣本單元或樣本點。

抽樣單元不一定是組成總體的最小單位——基本單元。抽樣單元可能包含一個或一些基本單元,最簡單的情況是只包含一個基本單元。在簡單隨機抽樣中,抽樣單元即為基本單元;而在整群抽樣中,群即為抽樣單元,而群可能包含相當多的基本單元,比如在手機調查中我們抽中一棟居民樓,居民樓是抽樣單元,而樓中的每個居民就是基本單元。

相關詞條

相關搜尋

熱門詞條

聯絡我們