總體與樣本
如作水質檢驗時從井水或河水中采的水樣,臨床化驗中從病人身上采的血液或其它活體組織標本,是樣本;而整個一口井或一條河的某一段所有的水,某病人全身所有的血液或某個組織器官,則是總體。這類總體是具體存在的,但另有些總體卻是假想的,只是理論上存在的一個範圍。例如試驗某一治療流感新藥的療效,最初接受治療的一批流感患者,不論數量多少,都只是一個樣本。若該藥療效得到肯定,從而加以推廣,那么此後凡在相同條件下接受該藥治療的所有流感患者,都屬於這個總體。可是當初試用時,這個總體還並不存在,是假想的。
總體包含的觀察單位通常是大量的甚至是無限的,在實際工作中,一般不可能或不必要對每個觀察單位逐一進行研究。我們只能從中抽取一部分觀察單位加以實際觀察或調查研究,根據對這一部分觀察單位的觀察研究結果,再去推論和估計總體情況。如上述某新藥治療流感例子,試驗治療的只是少數有限的病人,而結論卻要推廣到全體,得出一個該藥對所有流感患者之療效的規律性的認識。所以說,觀察樣本的目的在於推論總體,這就是樣本與總體的辯證關係。
一般的,樣本的內容是帶著單位的,例如:調查某中學300名中學生的視力情況中,樣本是300名中學生的視力情況,而樣本容量則為300.
樣本容量
樣本容量又稱“樣本數”。指一個樣本的必要抽樣單位數目。 在組織抽樣調查時,抽樣誤差的大小直接影響樣本指標代表性的大小,而必要的樣本單位數目是保證抽樣誤差不超過某一給定範圍的重要因素之一。因此,在抽樣設計時,必須決定樣本單位數目,因為適當的樣本單位數目是保證樣本指標具有充分代表性的基本前提。
確定樣本容量的大小是比較複雜的問題,既要有定性的考慮也要有定量的考慮。從定性的方面考慮樣本量的大小,其考慮因素有:決策的重要性,調研的性質,變數個數,數據分析的性質,同類研究中所用的樣本量,發生率,完成率,資源限制等。具體地說,更重要的決策,需要更多的信息和更準確的信息,這就需要較大的樣本;探索性研究,樣本量一般較小,而結論性研究如描述性的調查,就需要較大的樣本;收集有關許多變數的數據,樣本量就要大一些,以減少抽樣誤差的累積效應;如果需要採用多元統計方法對數據進行複雜的高級分析,樣本量就應當較大;如果需要特別詳細的分析,如做許多分類等,也需要大樣本。針對子樣本分析比只限於對總樣本分析,所需樣本量要大得多。
抽樣
又稱取樣。從欲研究的全部樣品中抽取一部分樣品單位。其基本要求是要保證所抽取的樣品單位對全部樣品具有充分的代表性。抽樣的目的是從被抽取樣品單位的分析、研究結果來估計和推斷全部樣品特性,是科學實驗、質量檢驗、社會調查普遍採用的一種經濟有效的工作和研究方法。
抽樣設計在進行過程中要遵循四項原則,分別是:
1、目的性;
2、可測性;
3、可行性;
4、經濟型原則。
抽樣方法
簡單隨機抽樣
一般的,設一個總體個數為N,如果通過逐個抽取的方法抽取一個樣本,且每次抽取時,每個個體被抽到的機率相等,這樣的抽樣方法為簡單隨機抽樣。適用於總體個數較少的。
系統抽樣
當總體的個數比較多的時候,首先把總體分成均衡的幾部分,然後按照預先定的規則,從每一個部分中抽取一些個體,得到所需要的樣本,這樣的抽樣方法叫做系統抽樣。
分層抽樣
抽樣時,將總體分成互不交叉的層,然後按照一定的比例,從各層中獨立抽取一定數量的個體,得到所需樣本,這樣的抽樣方法為分層抽樣。適用於總體由差異明顯的幾部分組成。
整群抽樣
整群抽樣又稱聚類抽樣。是將總體中各單位歸併成若干個互不交叉、互不重複的集合,稱之為群;然後以群為抽樣單位抽取樣本的一種抽樣方式。套用整群抽樣時,要求各群有較好的代表性,即群內各單位的差異要大,群間差異要小。
多段抽樣
多段隨機抽樣,就是把從調查總體中抽取樣本的過程,分成兩個或兩個以上階段進行的抽樣方法。