分類
單純隨機抽樣
又稱簡單隨機抽樣。是最基本的抽樣方法。分為重複抽樣和不重複抽樣。在重複抽樣中,每次抽中的單位仍放回總體,樣本中的單位可能不止一次被抽中。不重複抽樣中,抽中的單位不再放回總體,樣本中的單位只能抽中一次。社會調查採用不重複抽樣。純隨機抽樣的具體作法有:①抽籤法。將總體的全部單位逐一作簽,攪拌均勻後進行抽取。②隨機數字表法。將總體所有單位編號,然後從隨機數字表中一個隨機起點(任一排或一列),開始從左向右或從右向左、向上或向下抽取,直到達到所需的樣本容量為止。
純隨機抽樣必須有一個完整的抽樣框,即總體各單位的清單。總體太大時,製作這樣的抽樣框工作量巨大,加之有許多情況,使總體名單根本無法得到。故在大規模社會調查中很少採用純隨機抽樣。
分層抽樣
先依據一種或幾種特徵將總體分為若干個子總體,每一子總體稱作一個層;然後從每層中隨機抽取一個子樣本,這些子樣本合起來就是總體的樣本。各層樣本數的確定方法有 3種:①分層定比。即各層樣本數與該層總體數的比值相等。例如,樣本大小n=50,總體N=500,則n/N=0.1即為樣本比例,每層均按這個比例確定該層樣本數。②奈曼法。即各層應抽樣本數與該層總體數及其標準差的積成正比。③非比例分配法。當某個層次包含的個案數在總體中所占比例太小時,為使該層的特徵在樣本中得到足夠的反映,可人為地適當增加該層樣本數在總體樣本中的比例。但這樣做會增加推論 的複雜性。
總體中賴以進行分層的變數為分層變數,理想的分層變數是調查中要加以測量的變數或與其高度相關的變數。分層的原則是增加層內的同質性和層間的異質性。常見的分層變數有性別、年齡、教育、職業等。分層隨機抽樣在實際抽樣調查中廣泛使用,在同樣樣本容量的情況下,它比純隨機抽樣的精度高,此外管理方便,費用少,效度高。
系統抽樣
又稱等距抽樣。是純隨機抽樣的變種。在系統抽樣中,先將總體從1~N相繼編號,並計算抽樣距離K=N/n。式中N為總體單位總數,n為樣本容量。然後在1~K中抽一隨機數k1,作為樣本的第一個單位,接著取k1+K,k1+2K……,直至抽夠n個單位為止。
系統抽樣要防止周期性偏差,因為它會降低樣本的代表性。例如,軍隊人員名單通常按班排列,10人一班,班長排第 1名,若抽樣距離也取10時,則樣本或全由士兵組成或全由班長組成。
簡單的一個例子:在100個人里要抽10個人,現把他們從1號編到100號,然後分成1-10號, 11-20號, 21-30號, 31-40號, 41-50號。。。。。。91號到100號。在這10組中,第一組抽3號(其實可以選1-10號里的任意一號)。 那么第2組抽13號,第3組抽23號,第4組抽33號。。。第10組抽93號。
整群抽樣
又稱聚類抽樣。先將總體按照某種標準分群,每個群為一個抽樣單位,用隨機的方法從中抽取若干群,抽中的樣本群中所有單位都要進行調查。與分層抽樣相反,整群抽樣的分類原則是使群間異質性小,群內異質性大。分層抽樣時各群(層)都有樣本,整群抽樣時只有部分群有樣本。整群抽樣只需列出入樣群的單位,因此可節約大量財力、人力。整群抽樣的代表性低於簡單隨機抽樣。
多階段抽樣
又稱多級抽樣。前 4種抽樣方法均為一次性直接從總體中抽出樣本,稱為單階段抽樣。多階段抽樣則是將抽樣過程分為幾個階段,結合使用上述方法中的兩種或數種。例如,先用整群抽樣法從北京市某中等學校中抽出樣本學校,再用整群抽樣法從樣本學校抽選樣本班級,最後用系統或純隨機抽樣從樣本班級的學生中抽出樣本學生。當研究總體廣泛且分散時,多採用多階段抽樣,以降低調查費用。但由於每級抽樣都會產生誤差,經過多級抽樣產生的樣本,誤差也相應增大。