概述
分層抽樣法,也叫類型抽樣法。就是將總體單位按其屬性特徵分成若干類型或層,然後在類型或層中隨機抽取樣本單位。分層抽樣的特點是:由於通過劃類分層,增大了各類型中單位間的共同性,容易抽出具有代表性的調查樣本。該方法適用於總體情況複雜,各單位之間差異較大,單位較多的情況。
分層抽樣的具體程式是:把總體各單位分成兩個或兩個以上的相互獨立的完全的組(如男性和女性),從兩個或兩個以上的組中進行簡單隨機抽樣,樣本相互獨立。總體各單位按主要標誌加以分組,分組的標誌與關心的總體特徵相關。例如,正在進行有關啤酒品牌知名度方面的調查,初步判別,在啤酒方面男性的知識與和女性的不同,那么性別應是劃分層次的適當標準。如果不以這種方式進行分層抽樣,分層抽樣就得不到什麼效果,花再多時間、精力和物資也是白費。
分層抽樣與簡單隨機抽樣相比,往往選擇分層抽樣,因為它有顯著的潛在統計效果。也就是說,如果從相同的總體中抽取兩個樣本,一個是分層樣本,另一個是簡單隨機抽樣樣本,那么相對來說,分層樣本的誤差更小些。另一方面,如果目標是獲得一個確定的抽樣誤差水平,那么更小的分層樣本將達到這一目標。
分層抽樣又稱分類抽樣或類型抽樣。將總體劃分為若干個同質層,再在各層內隨機抽樣或機械抽樣,分層抽樣的特點是將科學分組法與抽樣法結合在一起,分組減小了各抽樣層變異性的影響,抽樣保證了所抽取的樣本具有足夠的代表性。分層抽樣根據在同質層內抽樣方式不同,又可分為一般分層抽樣和分層比例抽樣,一般分層抽樣是根據樣品變異性大小來確定各層的樣本容量,變異性大的層多抽樣,變異性小的層少抽樣,在事先並不知道樣品變異性大小的情況下,通常多採用分層比例抽樣。
樣本數
各層樣本數的確定方法有3種:
①分層定比。即各層樣本數與該層總體數的比值相等。例如,樣本大小n=50,總體N=500,則n/N=0.1 即為樣本比例,每層均按這個比例確定該層樣本數。
②奈曼法。即各層應抽樣本數與該層總體數及其標準差的積成正比。
③非比例分配法。當某個層次包含的個案數在總體中所占比例太小時,為使該層的特徵在樣本中得到足夠的反映,可人為地適當增加該層樣本數在總體樣本中的比例。但這樣做會增加推論的複雜性。
步驟
在調查實踐中,為提高分層樣本的精確度實際上要付出一些代價。通常,現實正確的分層抽樣一般有三個步驟:
首先,辯明突出的(重要的)人口統計特徵和分類特徵,這些特徵與所研究的行為相關。例如,研究某種產品的消費率時,按常理認為男性和女性有不同的平均消費比率。為了把性別作為有意義的分層標誌,調查者肯定能夠拿出資料證明男性與女性的消費水平明顯不同。用這種方式可識別出各種不同的顯著特徵。調查表明,一般來說,識別出 6 個重要的顯著特徵後,再增加顯著特徵的辨別對於提高樣本代表性就沒有多大幫助了。
第二,確定在每個層次上總體的比例(如性別已被確定為一個顯著的特徵,那么總體中男性占多少比例,女性占多少比例呢?)。利用這個比例,可計算出樣本中每組(層)應調查的人數。
最後,調查者必須從每層中抽取獨立簡單隨機樣本。
套用
總體中賴以進行分層的變數為分層變數,理想的分層變數是調查中要加以測量的變數或與其高度相關的變數。分層的原則是增加層內的同質性和層間的異質性。常見的分層變數有性別、年齡、教育、職業等。分層隨機抽樣在實際抽樣調查中廣泛使用,在同樣樣本容量的情況下,它比純隨機抽樣的精度高,此外管理方便,費用少,效度高。
分層抽樣是將總體按照一定標誌分成若干層,分別從各層中抽檢一定數量樣本,最後匯總推算所需的總體估計量的一種統計抽樣技術。在變數抽樣稅務稽查中合理地運用分層抽樣法,可以提高抽樣的精確度,減少需要抽查的樣本。在運用分層抽樣法時,需要對總體進行重新組織整理,計算工作複雜。因此,只有當被查總體中大部分項目(的金額)分布均勻,少數項目屬於高金額或低金額之類的異常項目時,運用分層抽樣法才有意義。
運用分層抽樣稅務稽查方法時,各層樣本抽查方法是相對獨立的,可以是隨機數表法,也可以是系統選樣法。分層抽樣法研究的重點,一是如何計算總的樣本規模和如何將樣本在各層進行分配;二是如何將各層檢查結果匯總推算總體估計量。
1.樣本規模的確定及在各層間的分配
在分層抽樣法中,樣本規模仍然按照總體計算,然後再把它分配到各層。分層抽樣法中樣本規模的確定,需要首先了解各層子總體容量及其標準差。
2.各層檢查結果的匯總
決定了各層樣本規模之後,稅務稽查人員即可按照計畫的抽樣組織方式和稅務稽查檢查大綱開始實施抽樣稅務稽查。經過對選取樣本的檢查計算,可以得到各層平均值(或平均差錯額)和實際樣本標準差等項資料,在此基礎上,稅務稽查人員需要將它們匯總,形成對總體的點估計和區間估計。
與多階抽樣關係
聯繫
多階段抽樣區別於分層抽樣,其優點在於適用於抽樣調查的面特別廣,沒有一個包括所有總體單位的抽樣框,或總體範圍太大,無法直接抽取樣本等情況,可以相對節省調查費用。其主要缺點是抽樣時較為麻煩,而且從樣本對總體的估計比較複雜。
將總體分為若干個一階單元,如果在每一個一階單元中,都隨機抽取部分二階單元,由這些二階單元中的總體基本單元組成的樣本,在抽樣的方式上,就相當於分層抽樣;如果在全部的一階單元中,只抽取了部分一階單元,並對抽中的一階單元中的所有的基本單元都做全面調查,這就是整群抽樣。
因此,分層抽樣實際是第一階抽樣比為100%時的一種特殊的兩階抽樣;而整群抽樣實際上是第二階抽樣比為100%時的一種特殊的兩階抽樣,故也稱單級整群抽樣。
主要區別
多階抽樣與分層抽樣的主要區別在於:
一、分層抽樣是對總體中的每個一級樣本群體進行全面入樣,再對所有的樣本進行抽查;而兩階抽樣則把總體中所有的群體視為一階單元,對這些一階單元進行抽樣,將抽出的樣本再次進行抽樣(兩次都不是進行全面的調查),產生兩級樣本,最后綜合估算出總的一級樣本指標。
二、整群抽樣是對總體中抽取的每個樣本群體所包含的基本單元進行全面調查;而兩階抽樣則把總體中所有的群體視為一階單元,對每一個被抽中的一階單元所包含的二級單元(即基本單位),不是進行全面的調查,而是再進行一次抽樣調查(也稱抽子樣本)。即兩階抽樣,產生兩級樣本,最后綜合估算出總的一級樣本指標。至於在綜合估算的方式方法上,兩階抽樣與整群抽樣也是極其相似的,只不過前者為就被抽一級單元的樣本指標進行綜合估算,後者為就被抽樣群體單元的全體指標進行綜合估算。
分層比例抽樣
分層比例抽樣是指按各個層的單位數量占調查總體單位數量的比例分配各層的樣本數量的。在分層抽樣中,採用分層比例抽樣可以提高樣本的代表性,及對總體數量指標的估計值的確定,避免出現簡單隨機抽樣中的集中於某些特性或遺漏掉某些特性。