簡介
問卷調查法也稱問卷法,它是調查者運用統一設計的問卷向被選取的調查對象了解情況或徵詢意見的調查方法。
問卷調查是以書面提出問題的方式蒐集資料的一種研究方法。研究者將所要研究的問題編製成問題表格,以郵寄方式、當面作答或者追蹤訪問方式填答,從而了解被試對某一現象或問題的看法和意見,所以又稱問題表格法。問卷法的運用,關鍵在於編制問卷,選擇被試和結果分析。
種類
問卷調查,根據載體的不同,可分為紙質問卷調查和網路問卷調查。紙質問卷調查就是傳統的問卷調查,調查公司通過僱傭工人來分發這些紙質問卷,以回收答卷。這種形式的問卷存在一些缺點,分析與統計結果比較麻煩,成本比較高。
而另一種網路問卷調查,就是用戶依靠一些線上調查問卷網站,這些網站提供設計問卷,發放問卷,分析結果等一系列服務。這種方式的優點是無地域限制,成本相對低廉,缺點是答卷質量無法保證。目前國外的調查網站surveymonkey提供了這種方式,而國內則有問卷網、問卷星、調查派提供了這種方式。
問卷調查,按照問卷填答者的不同,可分為自填式問卷調查和代填式問卷調查。其中,自填式問卷調查,按照問卷傳遞方式的不同,可分為報刊問卷調查、郵政問卷調查和送發問卷調查;代填式問卷調查,按照與被調查者交談方式的不同,可分為訪問問卷調查和電話問卷調查。這幾種問卷調查方法的利弊,可簡略概括如下表:
問卷種類 | 報刊問卷 | 郵政問卷 | 送發問卷 | 訪問問卷 | 電話問卷 |
調查範圍 | 很廣 | 較廣 | 窄 | 較窄 | 可廣可窄 |
調查對象 | 難控制和選擇,代表性差 | 有一定控制和選擇,但回復問卷的代表性難以估計 | 可控制和選擇,但過於集中 | 可控制和選擇,代表性較強 | 可控制和選擇,代表性較強 |
影響回答的因素 | 無法了解、控制和判斷 | 難以了解、控制和判斷 | 有一定了解、控制和判斷 | 便於了解、控制和判斷 | 不太好了解、控制和判斷 |
回復率 | 很低 | 較低 | 高 | 高 | 較高 |
回答質量 | 較高 | 較高 | 較低 | 不穩定 | 很不穩定 |
投入人力 | 較少 | 較少 | 較少 | 多 | 較多 |
調查費用 | 較低 | 較高 | 較低 | 高 | 較高 |
調查時間 | 較長 | 較長 | 短 | 較短 | 較短 |
分類
從問卷調查的實際套用來看,可以分為學術性問卷調查或套用性問卷調查。前者多為學校或研究機構的研究人員所採用,後者則由市場調研人員或其它機構的人員所採用,來解決實際中的問題,如行業內的策點市場調研公司、益普索調研公司、AC尼爾森市場研究機構、蓋洛普滿意度調研公司等。
調查內容
問卷調查問題的分類
按答案看,問題的答案可以是開放式的(比如:你為什麼喜歡這家商店?) 或封閉式的 (比如:你在多大程度上喜歡這家商店?請選擇非常喜歡、有點喜歡、既不喜歡也不討厭、有點討厭、非常討厭),可以是主觀的 (比如:你們在廣告上的投資大嗎?請選擇很大,比較大,中等,比較小,很小) 或客觀的 (比如,你們2012年在廣告上投資了多少錢?),也可以是分類性的(比如:公司的行業類型,nominal) 或序列性(比如:很大,比較大,中等,比較小,很小) 或連續性的 (你們2012年在廣告上投資了多少錢?)。在心理計量中,比較常用的是主觀的封閉式的問題。雖然這類問題往往是序列性的,在統計中往往被視作連續性。我們的討論將以主觀的封閉式的問題為主。我們假定社會調查是通過調查對象自助填表的方式 (self-administeredsurvey)進行的。在自助填表的社會調查中,調查對象主要在沒有幫助的情況下獨立回答調查問卷中的所有問題。
問卷調查問題的類型
一般地,一個問卷要包括三類的問題:理論模型中的變數、輔助變數、與人口統計學特徵。
顯然,一個問卷必須首先包括理論模型中的所有變數。在行為研究中,這些變數往往是心理變數。一個心理變數是用三個或三個以上的測度問題 (measurement item) 來測量的。一個心理變數往往對應於一組、而不是單一的語義。我們把這樣的心理變數叫作一個理論構件或構件 (construct)。這些相關的細化的語義往往被叫作這個心理變數的概念空間 (concept space)。用多個問題來測量這個概念,就是要從這個概念空間中選擇合適的表達方式,使這些表達方式作為一個整體可以更好地反映一個不可以直接測量的心理變數。這些被使用的問題又叫作測度項 (measurement item)。相應地,它們的記分標準叫做刻度 (scale)。心理計量學中有兩種常見的刻度:李克特量表 (Likert scale) 與語義對比刻度 (semantic differential scale)。前者往往用“同意/不同意”來表示對一個測度項的認可程度,而後者則讓調查對象在一組反義詞中選擇合適的位置。比如,為了測量滿意度,我們的李克特量表問題可能是:
1、非常不同意
2、有點不同意
3、既不反對也不同意
4、有點同意
5、非常同意
第二類變數是人口統計特徵(年齡、性別、種族、教育程度、省份、職業等)。這些變數在心理學研究中往往並不占據主要位置。它們可以用一個測試項來測定。而且,這些變數大多比較客觀,報告誤差不大。在一個問卷中包括這些變數的目的往往是為了檢驗一個樣本是不是與群體有相似的組成,從而具有代表性。
第三類變數是輔助變數。一類重要的輔助變數是控制變數 (control variables)。控制變數並不是理論模型中的主角。但是因為一個理論模型往往只從一個角度出發,所選變數有時不能有很好的充分性。這時,包括一些控制變數就可以用來表明即使另外一些重要的變數在場,所選的理論變數仍具有重要性,並表明理論變數具有有別於控制變數的額外作用。舉例來講,在組織中,如果我們的模型是信任度影響一個人向另一個人問取知識的頻率,信任度是我們的理論變數。我們的控制變數可以包括私人友誼與業務上的相關性。這樣,如果我們用統計方法先去除私人友誼與業務上的相關性對知識問取行為的影響後,我們還能夠表明信任度可以解釋這兩個變數沒法解釋的知識問取行為,我們就可以更有力地表明信任度的作用。這樣的控制變數雖然不是一個模型的主角,卻是包括在統計分析中的。
測度
設計測度項的措詞
測度項設計的基本目的是為了測量調查對象在一個理論變數上的真實值。所以,測度項的質量可以用幾個標準來衡量:
一個測度項反映了理論變數嗎?這個一個有效性標準。
一個調查對象能否對一個測度項能做出可靠的回答?
多個調查對象對一個測度項的理解是否一致?後兩個問題是可靠性標準。
測度項的措詞會同時影響有效性與可靠性。簡單而言,有效性 (validity) 指一個或一組測度項可以真實地測量一個理論構件。在方法學中,有效性往往被稱作是構件有效性 (construct validity)。有效性的第一個要求是測度項在語義上是針對於一個理論構件。有效性是“問了該問的問題”。它首先要保證的是測度項語義內容上的正確性,或稱為內容有效性 (content validity)。比如,研究者要測度消費者對一個產品的質量評價,有兩個測度項:“這個產品的使用壽命如何? (很長—很短) ”,“您是還覺得這個產品是否值得買?(很不值得—很徝得) ”。第一個測度項反映了質量的一個方面:使用壽命(durability)。第二個反映的是產品的價值(product value)。產品價值在行銷學中是一個與質量不一樣的概念,它指的是質量與價格的綜合考慮。所以第二個測度項雖然與產品質量有關係,卻已經因為它的語義範圍過大而不合適。
可靠性 (reliability) 是“把該問的問題問好”,是一個測度項可以得到所有調查對象的真實可靠回答的程度,它的反面是測度值中偏差的程度。在這一節,我們先關注可靠性。可靠性是有效性的必要但不充分條件。可靠性與有效性不是平等概念。可靠性是有效性的一部分。有時,有效性也狹義地指不包括可靠性的那一部分。
錯誤類型
在調查對象回答一個測度項時,不準確的測度項措詞會引入以下錯誤:
調查對象缺少相關知識
措詞過於學術化、晦澀難懂
測度項不完整
語義不明確
一個測度項內含有多重語義
一個測度項內含有多個變數之間的關係
第一,調查對象缺少相關知識。如果調查對象缺少一個測度項中所要求的知識,結果就會不可靠。這個“對牛彈琴”的錯誤罪在研究者。比如你如果問一個普通市民:您覺得本市進行轉基因作物研究成功的可能性有多大?(非常小—非常大)。一個市民通常不會有這方面的知識。更多時候,一個調查對象沒法回答一個問題是因為他沒有相關的經歷,比如在商場中進行抽樣調查時,你可能會問一個根本不會用電腦的老人家:“您覺得通過網站購買日用品方便么?(非常方便—非常不方便)。
第二,措詞過於學術化、晦澀難懂。這是另一類“對牛彈琴”的錯誤。“您所在的項目小組的內聚性有多高?(非常低—非常高) ”。什麼是“內聚性”(cohesion) ?除非有一個明確的定義寫在問卷中,調查對象不會知道你在問什麼。
第三,測度項不完整。假定測度項是:你的年齡?如果年齡對這個研究很重要,這個問題就是不完整的。在國內,有人可能報虛歲,也有人報周歲。比較好的措詞是:你的出生年分?
第四,語義不明確。假定測度項是:過去一個月你向上司諮詢過幾次?這裡有幾個方面是不明確的。第一,哪些上司?是任何比你更高層的人還是你的直屬上司?第二,怎樣算是諮詢?是詢問工作中的問題還是生活中的問題?是面對面還是包括電話與電郵?一個更明確的測度項可能是:不管是以面對面還是電話或電郵的方式,過去一個月你向你的直屬上司諮詢過幾次關於你工作中的問題?這個例子也說明測度項的準確性與簡潔性往往是矛盾的。
第五,測度項內含多個問題。假定測度項是:工作帶給我很高的自信心與安全感(非常同意—非常不同意)。到底是自信心還是安全感?這種問題的一個特點是其中有“與”或“或”。如果研究者對這兩個方面都感興趣,就應該把這個問題分成兩個來問。再假定測度項是:你每個月在這家商店購物超過50元的次數是多少?調查對象要進行兩次計算:一次是一共去了幾次,另一次是超過50元的次數。分開來問會更明確。再假定測度項是:公司領導對你們的項目支持的程度是:(很高—很低,不知道)。如果研究者預計有很多人會回答“不知道”,這個問題就應該拆分成兩個:您對公司領導對這個項目的態度有沒有了解?如果有,領導對你們的項目支持的程度是:(很高—很低)。
第六,測度項內含有多個變數之間的關係。這是初學者很容易犯的一個錯誤。比如為了測試報酬與工作態度之間的因果關係,有人會為報酬設計這樣的測度項“豐厚的報酬對於增加我的工作積極性十分重要,(非常不同意—非常同意) ”。 這樣的問題在日常生活中十分普遍。但在研究中,為了驗證報酬與工作態度之間的關係,我們必須把它們分開來測量。為什麼呢?因為我們要驗證的是報酬水平與工作態度的水平之間的關係,所以我們應該測量這兩個水平的本身。在數據收集過程的本身,我們不能預先設定立場而應保持中立(但在提出假設時我們的確有一個立場)。而這種關於“重要性”的直接提問已經預先有了一個立場。這樣一個預設的立場會產生幾個問題。一,調查對象會沿著調查者的立場去回答,因而不反映他們的實際行為。二,這樣的直接測試雖然可以測量到兩個變數之間的關係水平,但反而無法在統計上支持這個關係水平的顯著程度。假定刻度細度是7,即非常不同意=1,非常同意=7。如果得到的均值是5,這個值說明了什麼呢?難道因為它大於中間點4就表明這兩個變數之間有關係了嗎?因為我們不知道在這兩個變數真的沒有因果關係時調查對象的均值是多少(也許是4,但也可能是4.5或3.6),我們無法在統計上有信心說5就表明有關係。相反,如果這兩個變數分別測量,我們可以計算它們之間的統計上的相關係數,並進行顯著度的檢驗 (比如t-test)。要注意的是,這種“重要性”並不是在所有的情況下都不可取。有時,研究者的變數就是關於重要性的感知水平,這時,這樣的測度項是可以,比如:工作的穩定性會影響報酬對於工作態度的重要性。
測度項的設計還以有其它多種多樣的問題。以上所提到只是一些最典型的錯誤。關鍵是研究者要有對測度項質量的敏感性。
測度來歷
在討論測度項的可靠性時,我們似乎是在自己設計測度項。在很多論文中,作者會提到:我們儘可能從已有的文獻中採用別人已經測試過的測度項。我的學生會說:“我在文獻中找不到這個理論構件的測度項,你能不能告訴我哪裡有?”沒有文獻支持,他們會非常不安。測度項一定要從文獻中來嗎?顯然不是。如果測度項都是從文獻中來的,那么大家會不斷在重複前人的課題,研究就不會有進步。正常情況下,你的研究會引入新的理論構件,並為它們設計測度項。如果你沒有新的理論構件,你就要問問自己的研究新意在哪裡。同時,大部分的研究都是站在巨人的肩膀上,你會採用一些前人的理論構件。對於這些理論構件,在採用過程中,你必須先看看別人以前是怎樣設計測度項的。首先,你要檢查前人的理論構件的定義與你的定義是否一致。如果是,你要判斷他的測度項的可靠性與有效性如何。如果有效與可靠性都好,你要判斷他的測度項的措詞是否可以直接套用、還是需要進行修改以適應你的特定研究環境與研究對象。你要問:以前的研究與你的是不是針對同一個目標群體?是不是在相似環境下測試個體的心理現象?你也要決定是否要採用一個構件的全部測度項還是一部分。你也要分析這些測度項會不會與其它理論構件的測度項因語義過近而產生混淆。所以採用已有的測度項是一個選擇與修改的過程。
那么新設計的測度項又從哪裡來?有幾種不同的方法。第一,對於一個理論構件,研究者可以邀請一些調查對象進行焦點小組討論(focusgroupdiscussion)。這些調查對象必須是目標群體中的成員。研究者介紹理論構件的基本定義,讓調查對象針對這些現象進行討論。這討論中間所得的記錄往往可以用來產生測度項。這樣的測度項是用生活言語對一個概念的闡述。比如,我們請討論對“信任”的看法,有些人會說他信任一個人因為那個人“本事大”,另外有人會說“可靠”,也有人會說“我們關係好”、“他一定會盡他最大的努力來幫我”等等。這些言語可以成為測度項的第一手素材。研究者會檢查這些說法與理論構件的概念一致性,去蕪存菁,得到一組測度項。有時,可能其他的研究者通過案例研究或採訪得到了一些調查對象的評論與反饋,這些評論與反饋中的語言也可以成為素材。第二,研究者也可以根據理論構件的定義直接產生一個測度項。如果我們已經知道信任涵蓋一個“能力”因素,一個“可預測性”因素,與一個“好意”因素,我們就可以針對這些因素提出一些測度項。這兩種方法可以相輔相成。還有一種需要特別小心的做法是使用詞典。有的學生會說:既然多個測度項反映同一個理論構件,我只要在詞典中找一些同意詞就好了。詞典本身並不失為一種尋找素材的資源,它反映了我們日常生活中對一個概念的不同理解。但是,第一,它只是一個“素材”。研究者要有基於定義的仔細篩選。你對一個理論構件的定義往往不同於詞典中對這個單詞的定義。第二,多個測度項是要從不同方面反映一個構件,如果是同義詞,它們很有可能因為語義重複過多,反映了一個構件的同個方面,從而不能很好覆蓋一個理論構件的內涵。第三,如果語義重複過多,調查對象會說:這些問題翻來覆去在問同一個問題,這個調查表真囉嗦。沒有好的態度,調查對象就不會在填表時思考,數據質量就會出問題。
有效性
保證測度項的有效性
我們已經提到測度項要有可靠性。但有效性不止於可靠性,還有更多的要求。有效性的基本要求是“問該問的問題”。要達到這一要求,首先,研究者對一個理論構件的定義要十分明確。一個常犯的錯誤是研究者對一個理論構件還不熟悉就急於設計問卷。只有明確一個理論構件的定義(它的內涵),它的適用範圍(外延),研究者才能判斷測度項的好壞。第二,測度項的產生過程要符合理論構件的定義。我們在討論測度項的產生方法時已經提到了一些好的與不好的做法。這些做法歸根到底是在保證測度項的有效性。第三,測度項設計好之後要進行內容有字面效性檢查、預試(pre-test)、測度項分類、或預調查(pilottest)。為什麼測度項按著明確的定義與合適的產生方法設計以後還要再做預試等等呢?這是因為產生步驟中考慮的主要是測度項與理論構件之間的關係,但沒有考慮不同理論構件的測度項之間可能的混淆。這些方法具體的操作與統計分析可以參看《社會調查研究》。
問卷調查方法
問卷設計好以後,常見的幾種定量調查方法一般是:入戶訪問、街訪、電話CATI訪問、線上調查等4種方式。
入戶訪問:入戶訪問的優點:
1、樣本具有較高的代表性,用它的結果可以進行總體推斷。由於國內各城市經濟發展、居民消費習慣和生態形態的差別,調查一般選擇有代表性的城市進行,在每個單獨城市中,調查的被訪者要能夠代表這個城市總體情況。
2、適合於訪問時間較長的問卷調查:
訪問是在受訪者熟悉的環境之中進行,問卷回答率高:
適合出示很多物品的訪問:
3、適合長期的追蹤調查
4、易於質量控制
入戶訪問的缺點:
調查成本較高
拒訪率較高
街訪:街訪的優點:
1、易操作,易控制,便於督導監督每一步操作,適用於操作複雜的訪問。例:口味測試,廣告測試,包裝測試等
2、時間短:每份問卷一般在20分鐘左右集中完成,而入戶需40分鐘左右,樣本間隔時間短,街訪在2-4天內完成,而入戶在2周內甚至更長時間完成。
3、問卷質量較易控制:能獲取到較真實地資料,客觀,實效
4、易確認被訪者特徵,容易找到被訪者
5、可隨時調整訪問技巧
6、成本低
街訪缺點:
1、非機率抽樣:街訪抽樣時配額抽樣,故必造成一些合理抽樣誤差,不能精確推斷總體市場占有率或市場規模。
2、較繁瑣,場地,租車,禮品,飲料,午餐等需要進行準備工作。
3、用具較多(特殊項目需要用到如:冰櫃、天平、溫度計等)
4、時間不宜過長:適合15-20分鐘左右
電話CATI訪問CATI系統的優點:
1、速度快、樣本代表性強、訪問質量容易控制。一般來說,能夠進行真正有代表性抽樣的數據採集方式只有入戶訪問與電話訪問。由於入戶訪問接觸率較低,因此,電話訪問就成為了樣本代表性最強的數據採集方式。
2、質量高:由於事先可對計算機進行設定,可避免一些因跳問路線或選擇答項錯誤而導致的數據差錯或丟失;此外,由於所有訪問記錄(包括錄音記錄)全程都可以保存在系統中,且訪問過程始終處於督導人員的全程監控之中,因而不會出現訪問員作弊現象。
3、靈活和可控性強:採用CATI系統,可對問卷中選擇題選項的出現順序進行隨機設定,以確保其隨機性,避免出現系統誤差;
4、成本低:採用CATI系統,可省去交通費、禮品費和問卷印刷費等。據測算:完成同樣調查項目,CATI所花費的費用要比面訪低30%左右。
CATI系統的缺點:
1、調查內容不能過多、過於複雜。通常情況,電話訪問的時間不宜超過20分鐘,內容一般為多數被訪者所熟悉或理解。
2、不能出示圖片和複雜的概念說明,對於比較抽象的測試難以進行;
3、被訪者中途拒訪後不易完成訪問,對訪問員的溝通技巧要求較高。
線上網路調查線上網路調查優點:
1、迅速:不僅單份調查的時間短而且項目的整體執行周期短;
2、準確、抽樣精確,更容易接觸到高檔消費者
對於市場研究來說,最精確的抽樣是隨機抽樣,這以入戶調查和電話調查為代表。但是,目前越來越多的小區是不允許訪問員隨意進入的,這也就使得入戶調查越來越難。現在越來越多的市場研究公司採用的是配額抽樣而配額抽樣,利用線上調研方式是完全可以做到的。抽到答卷的樣本庫成員可以在任何他方便的時候上網來完成問卷。
3、更多樣的表現形式,更中立的回答。對於某些敏感性話題,受訪者在沒有訪問員的情況下更容易回答真實的答案。
4、價格相對便宜,由於是通過線上來答題,節省了訪問員、印刷等中間環節,所以價格會相對便宜一些。
線上網路調查缺點:
1、由於線上調查依賴於網站,所以在一些大城市進行線上調查是沒有問題的。但是在一些偏遠山區及小城市沒有網路這個環境,就沒有辦法運行。
2、網民的年齡一般在15—45歲之間,其中年輕群體居多,所以相對適合於調查對象以年輕人為主的問卷項目。
調查意義
問卷調查是一種發掘事實現況的研究方式,最大的目的是蒐集,累積某一目標族群的各項科學教育屬性的基本資料,可分為描述性研究及分析性研究兩大類。在決定是否採用問卷法作為研究工具,應考量是否能順利達成研究目標以及注意研究樣本在問卷上的配合度,另外,問卷調查也有其優缺點,檢視其特性配合研究主題,方能達成其目標。
研究者把所要研究的事項,做成「問題」或「表格」,再以郵寄或訪問的方式,請有關的人照式填答的一種形式。問卷調查法,能使研究者直接由受試者獲得資料,以測量受試者個人的所知所聞,個人的喜好與價值觀或個人的態度信念,亦可以用問卷調查法去發現事實及經驗或正在進行的事。