起源
有時要對一些非常敏感的問題進行調查,比如“你服用古柯鹼嗎?”“你曾在商店裡偷過東西嗎?”或者“你在納稅時低報了你的收入嗎?”等等。
預計那些應該回答“是”的人都有可能會撒謊,需要設計出鼓勵人們提供真實回答而又不致於尷尬的問題形式。Horvitz等(1967)對Warner(1965)最初提出的理念進行了修改,建議使用兩個問題——一個敏感性問題和一個無關緊要的問題——並由隨機化裝囂(如拋硬幣)來決定受訪者回答哪個問題。如果將拋硬幣作為隨機化裝置,當硬幣正面朝上時,受訪者需按指示回答“上周你吸食過古柯鹼嗎?”如果硬幣背面朝上,則受訪者按指示回答“你手錶上的秒針在0到30之間嗎?”訪問員並不知道硬幣是正面朝上還是背面朝上,因此也不知道受訪者回答的是哪個問題。利用隨機化裝置以及讓受訪者事先了解訪問員不會知道他回答的是哪個問題,希望這兩點可以鼓勵受訪者對上周是否曾服用古柯鹼作出真實回答。
隨機化裝置可以採用各種方式,但必須事先知道人們被問及敏感問題的機率P以及被問及無關問題的機率1-P。Fox和Tracy(1986)介紹了其他的隨機化回答形式。
特徵
在社會經濟的調查中有時會涉及一些敏感性問題。例如,市場工商管理部門要了解個體戶漏稅的比例有多大;計畫生育部門要了解在已婚的育齡婦女中有多少人採取了避孕措施;公安部門要了解吸毒者人數的比例,等等。對於這類的問題,容易引起被調查者的反感,他們或者不提供真實的情況,或者直接拒絕回答,從而使調查失敗。一般而言,調查中應儘量避免這類問題,以保證調查數據的質量。但有時,研究的題目就是這類敏感性問
題.在調查中無法迴避。
它的基本特徵是被調查者對所調查的問題採取隨機回答的方式,調查人員無法從被調查者的回答中得知對方是否具有某種特徵。這樣,就可以在一定程度上消除被調查者的擔心和顧慮,使他們參與調查。並提供真實情況。另一方面,調查人員通過對所有調查結果的匯總。利用機率原理進行推算,又可以得到總體中具有該特徵人數比例的估計值,從而實現調查的目的。因而,隨機化回答技術被認為是對敏感性問題進行調查,並對總體的特徵比例進行數量推算的有效方法。
從理論上講,隨機化回答技術既可以用於訪問調查,也可以用於郵寄問卷等其他方式的調查。但是,隨機化回答問卷的設計比其他一般性調查問卷的設計要複雜。例如,在郵寄問卷調查中,被調查者很可能因為看不懂問卷而不知如何回答,在訪問調查中,調查人員可以詳細地向被調查者說明隨機化回答技術的原理,並講解如何回答這種類型的問卷,必要時還可以進行示範,幫助被調查者理解和掌握。所以,與其他調查方法相比,訪問調查在使用隨機化回答技術方面有更多的便利條件。
混合效應隨機化回答模型
傳統的隨機化回答技術都是針對單變數數據的,其主要目的是為了獲得具有敏感特性回答的機率估計。在Warner (1965)和Greenberg等(1969)的文獻中已經詳細探討了關於估計的理論。然而,被調查者的輔助信息卻在一些情況下格外有用,以至於可以將其與肯定回答相聯繫。Maddala( 1983)以及Scheers和Dayton (1988)便將這些帶有輔助信息的解釋變數納入隨機化回答模型中。其優點在於可以減少標準誤差,並可以確立協變數信息與敏感特性的總體機率之間關係。
傳統的隨機化回答模型的另一個主要缺點是只能獲得與總體水平有關的結論——總體機率的估計和相關置信區間。這與當時僅對單變數數據進行相關與無關隨機化回答方法的發展目的一致,但卻不能滿足於調查者對單位水平參數的研究,這也導致無法對一些產生敏感特性的原因進行剖析。
注意事項
對敏感性問題採用隨機化回答技術的主要目的是為了消除被調查者的顧慮使其願意配合,並對所抽到的問題給予正確的回答。在具體設計與操作上應注意以下幾個問題:
1.要使被調查者充分理解這種方法的特點,特別是一定;要讓被調查者明白,他究竟回答的是哪一個問題,別人是不知道的,因此在正式抽取並回答問題前,要讓被調查者作幾次試驗,例如請他反覆從容器中抽取球,使他確信其中有不同顏色的球。當然隨機化裝置可以不一樣,也可用卡片等其他形式,但愈簡單愈好。
2.所提問題必須簡單明了,防止有不同的理解。例如我國在某些地區(特別是農村)也採用農曆,因此對“你是否出生在五月”這類問題若要採用,事先應明確是公曆。對涉及問題的解釋必須在抽問題以前進行,抽取問題後再詢問就暴露了抽到的是哪一個問題,也就失去了隨機化回答的意義。
3.在套用西蒙斯模型時,無關問題的選擇特別重要。一定要隱蔽性強的,即調查人無從猜測被調查人對該問題回答的答案。例如“你的身份證末位數是不是奇數”這類問題,由於我國居民身份證設計時,末位數的奇偶表示性別。並不是隨機的,而採用隨機化回答技術由於需要當面解釋,被調查人的性別不可能保密,這樣也就失去了無關問題奉來應具有的保護作用。