概念
評價量表用不同的數值來代表某種態度,目的是將非數量化的問題加以量化,而不是用抽象的數值隨意排列。
形式
評價量表根據量表的形式分為:
1、圖示評價量表——要求應答者在一個有兩個固定端點的圖示連續體上進行選擇;——三種圖示評價量表。
2、列舉評價量表——要求應答者在有限類別的表格標記中進行選擇。
列舉評價量表比圖示評比量表容易構造和操作,在可靠性方面也比圖示評價量表好,但是不能像圖示評比那樣衡量出客體的細微差別。
套用注意事項
評比量表在市場調查方面套用很廣。在問卷中,調查人員根據被調查者的可能態度,擬定有關問題的答案量表,量表的兩端是極端答案,中點是中性答案,並且每個答案都事先給定一個分數。
例如:你喜歡上市場調研這一門課嗎?(請在對應的數字上劃鉤)
按圖所反映的評比量表的要求,分別進行統計,取得的平均分數值便可以代表被調查者的態度,並且還可以計算各個項目的百分率。
套用評價量表時必須注意兩點:
應注意設計量表時的定量基礎,並將調查得到的態度測量結果在定量基礎上進行分析,判斷其高低; 應注意量表所測定的數量,只說明態度的不同,並不說明其他。
優缺點
評比量表的優點:省時、有趣、用途廣、可以用來處理大量變數等。
這種方法可能會產生三種誤差:
1、仁慈誤差:有些人對客體評價時,傾向於給予較高的評價,這就產生所謂的仁慈誤差;反之,則產生負向的仁慈誤差。――如教師給學生打平時成績。
2、中間傾向誤差:有些人不原意給予被評價的客體很高或很低的評價,特別是不了解或難於用適當的方式表示出來時,往往傾向於給予中間性的評價。
防止中間傾向誤差的方法:
調整敘述性形容詞的強度; 增加中間的評價性語句在整個量表中的比例; 使靠近量表兩端的各級在語意上的差別加大,使其大於中間各級間的主意差別; 增加測量量表的層次。 3、暈輪效果:如果受測者對被評價的對象有一種整體印象,可能會導致系統偏差。
預防暈輪效果的方法:
對所有要被評價的對象,每次只評價一個變數或特性; 問卷每一頁只列一種特性。
標準
我們採用含有多個次目的量表來測量人們的意見、態度、看法等、這樣得到的結果是否準確、可靠,是否有適用性。這就需要評價量表的信度和效度。在這之前,我們先要了解測量精度和測量誤差的概念。
測量精度和測量誤差
測量值是指反映一個對象某個特殊的數值。測量值不是所感興趣的真點值,而是它們的一個觀測。有許多因素都會引起測量誤差,可將觀測值O表示成如下的形式:O=T+S+R
觀測值O和真點值T之間的差距稱為誤差,誤差的大小反映了測量的精度的高低。誤差包括兩部分:系統誤差S和系統誤差R。S是一種偏差,代表著影響觀測值的穩定性因素,每次都以相同的方式影響觀測值。可能產生系統誤差的原因很多。
隨機誤差不穩定。它代表看影響觀測值的暫時性因素,次都以不同的形式出現,例如暫時性的人員因素或環境因素等。
系統誤差和隨機誤差之間的區別對我們理解效度和信度的概念是很重要的。
從理論的觀點來看,一個良好的測量工具(量表)應具有足夠的效度和信度。效度是指量表測量的結果能夠真正反映調研人員所要了解對象特徵的程度。如果沒有任何系統誤差和隨機誤差(即O=T),則具有最高的效度。調研人員可以用內容效度、標準則效度和建構效度來評價量表。
內容效度是指量表涵蓋研究主題的程度。調研人員必須檢查量表中的項目能否是夠地覆蓋測量對象的主要方面。為了獲得足夠的內容效度,要特別注意設計量表時應遵循的程式和規則。
內容效度的主觀性使其不能單獨地用來衡量表的效度,但可以用來對觀測結果作大致的評價。一個更好的評價量是下面介紹的準則效度。
準則效度是指量表所得到的數據和其他被選擇的變數(準則變數)的值相比是否有意義。準則變數可以是人文學和心理學特好、態度和行為、以及從其他量表得到的數據。根據時間跨度的不同,準則效度可分為同時效度和預測效度。
當量表的測量數據和準則變數的值被同時收集時,使用同時效度。例如,如果一個測量消費者對彩電態度的量表能夠正確估計出市場上高、中、低所得的家庭分別擁有彩電的數目和比例,它就具有同時效度。評價量表的同時效度涉及對這兩者的比較。當量表的測量數據收集在先,過一段時間之後才收集準則變數值時,命名用預測效度。如上例中測量消費者對彩電態度的量表如能正確地預測出明年消費者明天彩電的行為,字就具有預測效度。調研人員可以在第二年收集有關實際購買的數據,和量表測量結果進行比較,用來評價量表的預測效度。
建構效度
建構效度最關心的問題是:量表實際測量的是哪些特徵?在評價建構效度時,調研人員要試圖解釋“量表為什麼有效”這一理論問題以及考慮從這一理論問題中能得出什麼推論。建構效度要求對每個特徵的測量背後有足夠的理論支持,並且這些被測量的特徵之間應該有合理的關係。建構效度包括同質效度、異質效度和語意邏輯效度。
同質效度是指量表測量同一特徵的其他測量方法相互關聯的程度。異質效度是指量表和測不同特徵的測量方法不同但理論上有關特徵的測量方法之間相互關聯的程度。在設計量表時,首先建立一個理論模型,然後從中導出一系列推論、測試,逐漸形成一個由幾個特徵系統地聯繫起來的語意邏輯網。從表面上看,就是含有多個有關測量對象測量項目的量表。評價建構效度就是要在這個量表的背景下進行。
測量的信度
信度指的是如果重複測量,量表所測結果的一致程度。系統誤差對信度沒什麼影響,因為系統誤差總是以相同的方式影響測量值的,因此不會造成不一致性。反之,隨機誤差可能導致不致性,從而降低信度。信度可以定義為隨機誤差R影響測量值的程度。如果R=0,就認為測量是完全可信的,信度最高。
一般通過使用同一量表進行不同測量,分析各測量結果之間聯繫的方法來評價信度。如果聯繫密切,各測量結果具有一致性,則認為量表是可信的。評價信度的方法主要有:再預測量、替換形式、內部一致性方法。
(1)再測信度
用同樣的量表,對同一組訪問對象在盡可量相同的情況下,在不同的時間進行兩次測量。兩次測量相距一般在兩到四周之間。用兩次測量結果間的相關分析或差異的顯著性檢驗方法,可以評價量表信度的高低。結果越是相關,差異越不顯著則信度越高。
用再次測量法評價信度存在一些問題。首先,結果與時間間隔關係密切。在其他方面都相同的情況下,時間間隔越長,信度越低。其次,最初的測量可能會改變被測特徵。例如,測量人們對低脂肪食品的態度可能會使他們更為關心健康問題,從而對低脂食品持更為肯定的態度。第三,實施重複測量有時是不可能的,例如測量消費者對某種新產品的反應。第四,第一次測量的答案可能會對以後測量有影響。受訪者可能會圖回憶第一次受測時給出的答案。第五,在兩次測量之間一個有利的信息可能會使受訪者的態度更為有利。最後,再測信度的相關係數可能會由於被測項目自身之間的相關而偏高。兩次測量中,同一項目自身之間的相關性要比不同項目間的相關性高。因此,即使不同項目之間的相關性很差,也可能得以很高的再測相關係數。
(2)替換形式信度
用兩個形式不同的等價量表,對同一組受訪者在不同的時間(通常間隔兩到四周)進行測量。兩次測量結果間的相關性被用來評價量表的信度。
這個方法存在兩個主要問題。首先,構造等價的量表不但費時,而且花錢。其次,很難構造出完全等價的量表。兩個量表在內容上應該等價。從嚴格的意義上說,兩個量表的測量項目應具有相同的均值、方差和相關性,但即使這些條件都滿足了,還是有可能出現內容不等價的情況。低相關可能是量表的信度不夠造成的,也可能是由於量表形式不等價而造成的。
(3)內部一致信度
內部一致信度用於評價累加量表的信度。在這種量表中,各個測量項目的得分被累加以得到一個總分,每個項目都測量整個量表所要測量對象的某個方面,項目之間就它們各自的特徵而言應該是一致的。內部一致信度強調的是組成量表的一組測量項目內部的一致性。
折半信度是測量內部一致性是簡單的方法。量表中的項目被分成兩半並計算測量結果的相關係數。這兩半相關係數高,則說明量表內部一致性高。量表的項目可按序號的奇、性分為兩半,也可以隨機地合。問題在於劃分兩部分的方法可能會影響到評價結果。克服這一問題的常用方法是採用X係數。
?? X係數,也稱為克朗巴哈X係數,是量表所有可能的項目劃分方法的得到的折半信度係數的平均值。X係數的值在0和1之間。如果X係數不超過0.6,一般認為內部一致信度不足。X係數的一個重要特性是它們值會隨著量表項目的增加而增加。因此,X係數可能由於量表中包含多餘的測量項目而被人為地、不適當地提高。還有一種可以和X係數同時使用的係數。係數能夠幫助評價,在計算X係數的過程中,平均數的計算是否掩蓋了某些不相關的測量項目。
有些具有多個項目的量表可能在結構上是多維的,那含有幾組,每一組項目測量一個方面的特徵。例如,商店的形象就是一種多維的結構,包括商品的、商品的花色種類、貨與保修政策、人員服務、價格、商店位置、店面局等等。用於測量商店形象的量表就要包括測量以上每個維度(方面)的測量項目。這些維度之間是比較獨立的,因此,在包含各個準度的整個表內部考察一致性是不適宜的。不過,如果每個準度是由幾個測量項目組成,可以計算每個度的內部一致性。
效度和信度的關係
效度和信度的關係可以用前面討論過的測量值的構成公式O=T+S+R來理解。如果測量是完全有效的,即0=T,S=0,R=0,此時測量必然是完全可信的,若量表的信度不足,它也不可能完全有效,因為有O=T+R。如果量表是完全可信的,可以達到完全有效,也可能達不到,因為有可能存在導致誤差,雖然缺管信度必然缺乏效度,但信度的大小並不能體現效度的大小。信度是效度的必要條件,但不是充分條件。從理論的角度來看,量應具有足夠的效度和信度;從實踐的觀點來看,一個好的量表還應該具有實用性。實用性指量表的經濟性、便利性和可解釋性。