抽樣偏差

抽樣偏差是統計學的概念,統計學中隨機抽樣的基本原則就是隨機。而抽樣偏差就是在抽樣過程由於一系列因素造成不符合隨機抽樣的原則,導致樣本失去可以估計總體的能力(失真)。

簡介

抽樣又稱取樣。從欲研究的全部樣品中抽取一部分樣品單位。其基本要求是要保證所抽取的樣品單位對全部樣品具有充分的代表性。抽樣的目的是從被抽取樣品單位的分析、研究結果來估計和推斷全部樣品特性,是科學實驗、質量檢驗、社會調查普遍採用的一種經濟有效的工作和研究方法。抽樣設計在進行過程中要遵循四項原則,分別是:1、目的性;2、可測性;3、可行性;4、經濟型原則。

抽樣偏差就是破壞了隨機抽樣的原則。

具體事例及分析

1936 年富蘭克林·迪拉諾·羅斯福(Franklin Delano Roosevelt)與艾爾弗雷德·蘭登(Alfred Landon)共同競選美國總統。

此時,美國失業人數高達九百萬,在1929--1935這段期間實際收入下降了約1/3,經濟正由大蕭條中逐漸恢復回升。蘭登競選主題為“小政府”口號為“揮霍浪費的人必須離任”“我們應該專心致力於自己的事務”羅斯福競選主題為“擴大內需”口號為“在我們能夠平衡聯邦政府的預算之前,必須先平衡美國人民的預算”。絕大多數觀察家認為羅斯福將毫不費力的獲勝,而《文學文摘》(literary Digest)雜誌根據大約240萬人參加的一次民意測驗預測,蘭登會以57%對43%的優勢獲勝。《文學文摘》的顯赫威望支持著它的預測,因為自1916年起,在歷屆總統選舉中該雜誌都能正確地預測出獲勝的一方。實際的競選結果是羅斯福以62%對38%的一邊倒優勢贏得了1936年的選舉,連任總統。
這是重要民意測驗曾作出過的最大誤差。接受民意測驗的人數這么多,但《文學文摘》這么大的預測誤差是怎么產生的呢?目前關於此問題的解釋集中在取樣策略方面。
1、取樣方法:郵寄1千萬份問卷,回收420萬份,但調查對象是從電話簿、汽車車主的登記資料以及選舉人的登記名單中選取。在經濟大蕭條時期,電話和汽車並不像現在這樣普遍,當時僅有1100 萬人擁有住宅電話,但900萬人失業,僅針對擁有汽車和電話的少數人進行調查並不具有代表性,但是這些名單比較容易得到。
2、抽樣偏差:取樣中包含過多的富人,而該年貧富間選舉傾向相距極大。那些富人支持共和黨的候選人,那些未能被調查的低收入民眾卻大部分支持民主的羅斯福,導致調查結果失真。取樣有偏差時,再多的樣本也沒有用。
3、有回答或拒回答( non-response),或低回復率( response rate) 引起偏差。郵寄發出的調查問卷大約有1000萬張,但只有少數的調查表被收回,有效回復率僅為23%。在收回的調查表中,蘭登非常受歡迎。於是,該雜誌預測蘭登將贏得選舉。以芝加哥為例,問卷寄給1/3 的登記選民,回收的20%的問卷,其中超過一半宣稱將選蘭登,但選舉結果卻是羅斯福拿到2/3的選票。對此,有的研究者認為回復此項調查的樣本對象大都心存偏見。

相關詞條

熱門詞條

聯絡我們