用途
之所以採用後分層抽樣,是因為在一些調查中事先無法掌握總體各層的單元數或權重i有的事先難以對總體各部分按一定分層標誌分層。比如,調查某省勞動力的有關職業情況,如果事先不知道各種職業層次的勞動力人數,就難以實施分層抽樣調查。再如,大面積的森林資源調查,如果沒有較完整的有關樹種、林齡、疏密度等資料或它們的面積統計,就很難事先分層。為解決這類問題,需要採用後分層抽樣技術。
後分層抽樣操作簡便、成本低,在總體信息不全的情況下可以套用。國際上一些國家廣泛採用後分層抽樣方法調查人口、資源、收入、衛生健康等社會經濟情況。在我國森林資源調查中,後分層抽樣用得也很多,在缺乏森林分布圖、林相圖和適合的航空相片等資料時,就只好從總體中隨機地(系統更好)抽取n個樣地,在外業調查樣本的同時,要對總體各地塊林分進行區劃,分類。在內業中,按分層方案,把n個樣地分層,由於這種抽樣把分層和調查樣本單元合併在一次外業,可節省大量費用,又能提高抽樣效果。但是這種自然資源的分層抽樣,通常抽樣比很小,不像社會經濟調查中用樣本確定層權重容易,尤其是層數太多,各層樣本單元數少,對層權重容易引起較大誤差,影響抽樣結果。
可以說,先抽樣後分層是簡單隨機抽樣和分層抽樣的有機結合,在一般情況下其估計效率比先分層抽樣差些,但又會比簡單隨機抽樣好些。
由於事後分層抽樣方法,總體只有一次抽樣,而不能滿足使各層獨立隨機抽取,同時也不能保證樣本按比例分配,所以其方差估計與比例分層抽樣不同。
特點
對於分層抽樣,需要在抽樣之前就對總體中的所有單位進行分層,然後準備好各層的抽樣框,再在各層中獨立地抽樣。在實際工作中,有時對總體的認識不夠,事先分層比較困難。此時,如果想利用分層抽樣的優點進行參數的估計,就可以考慮採用事後分層。事後分層的實施過程為:先採用簡單隨機抽樣方法從總體中抽取一個容量為n的樣本,然後對樣本中的單位按照某種特徵進行分層。例如,在某學院對過去一周教員加班情況的統計中,可採用按系和按職稱情況進行分層。但並不知道哪種分層方式更能使得“層內差異小,層間差異大”,這時就可以進行事後分層。
事後分層要求層權已知或者可以通過某種途徑獲得。當層權既未知而需要進行估計時,應確保估計得到的阢與實際值相差甚小,否則事後分層技術不能達到提高參數估計精度的目的。運用事後分層技術時,還要注意事後層不宜太多。
整群抽樣後分層
整群抽樣與分層抽樣相結合,就可以形成分層整群抽佯或整群抽樣後分層。
分層整群抽佯是以群為抽樣單位的分層抽樣,即先對總體中的群進行分層,然後每層分別隨機抽取部分群進行調查的一種抽樣形式。對群進行分層的角度有兩個:一是當各群內的個體數相同(即等群)但群標誌總值有較大差異時,按群標誌總值(或群平均數)或其他相關標誌進行分層,其目的是為了提高整群抽樣的估計精度。很顯然,只要正確分層,分層整群抽樣的估計精度一定會優於一般的整群抽樣,因為它能使層間的差異大而層內群之間的差異小,同時滿足分層抽樣和整群抽樣的要求。尤其是對於群內差異小而群間差異大的總體,分層整群抽樣尤為合適。二是當各群內的個體數不相同(即不等群)時,按群的個體數多少進行分層,其目的是為了使危內的群接近於成為等群而便於採用等機率抽樣估計。如果按個體數多少分層後,各群的群均值之間仍還有較大的差異,那么還可以再按群均值或相關標誌進行分層,這樣就可以使層內的群無論在個體數多少還是在群均值大小方面都充分接近,叭而既可以避免採用不等機率抽樣估計的麻煩,又可以大大提高抽樣估計的精度,可謂一舉兩得。
還有一種分層整群抽樣是為了解決不等群的不重複不等慨率抽樣問題。我們知道,在不等群的不重複不等機率抽樣估計中,當樣本群數大於2時,操作過程就會變得十分困難。這時可以先對總體中的群按輔助標誌大小進行分層,層數為總樣本群數的一半,然後每層分別隨機不重複抽取2個群。這樣,每層的抽樣估計就容易操作一些,同時由於經過分層,總體參數估計的精度也會有所提高。