在第一次測試較差的學生可能在第二次測試時表現好些,而第一次表現好的學生則可能相反,這種情形稱為統計回歸效應。統計回歸效應的真正原因就是偶然因素變化導致的隨機誤差,以及僅僅根據一次測試結果劃分高分組和低分組。
以下文字來源於鄧鑄先生新浪部落格,特此感謝。
今天,先就網友所提問題作一解答,僅供參考: 心理學實驗研究中,在選取被試時,常常會提到“統計回歸”,如何理解呢?
在心理學的實驗研究中,比如:在進行一項語文教學研究中,為了驗證某種教學方法是否更適合於語文成績較差者,或者說是否更有利於成績較差者的學習改進,研究者就對同一個年級的學生進行語文水平前測,根據前測的成績將排名前27%的同學作為學優組、排名後27%的同學作為學差組。然後採用這種教學方法進行一個時期的教學,接著進行語文水平後測。結果發現,學差組學生的語文成績要比學優生的成績進步更多。研究者非常滿意這樣的實驗結果,他的研究目的完全實現了!
果真如此嗎?現在,我們構想這樣一個研究:對一個年級的學生進行語文水平前測,還是根據前測成績把學生分成學優組和學差組;然後,在未經過任何教育訓練、中間時間間隔也很小的情況下,再用結構與難度相當的測試卷對學生進行後測,我們觀察學優組和學差組的成績變化。你很可能會看到:學優組平均成績有所下降、學差組平均成績有所上升,都出現了向全年級的平均成績靠攏的趨勢,這就是所謂的 “統計回歸”,它不是任何教育訓練引起。那又是由什麼因素引起的呢?這就是統計學問題啦。
學生在參加某一學業成績測試時,其成績的取得是由一些必然因素和一些偶然因素共同決定的,必然因素主要是其學業的真實水平和有效的考試技巧、智力水平等較穩定性因素;偶然因素主要是試卷內容選擇、難度、學生當時的身心狀態、環境因素等等。其中,這些偶然因素本身的變化具有隨機性,它們的作用會引起測試結果的隨機起伏,作用越大,起伏也就越明顯。而數據的起伏即可能使成績高於真實水平,出現正誤差,使測試成績偏高;也可能使測試成績低於真實水平,出現負誤差,使測試結果偏低。就一個年級同學的一次測試來說,有的同學測試結果有正誤差、有的測試結果有負誤差。
高分組同學的高分成績,可能是由於其本來的學業水平高,但也有可能是正誤差造成的;低分組同學的低分成績,可能是由於其本來的學業水平低,但也有可能是負誤差造成的。如果再進行一次測試,根據偶然因素變化及其影響變化的隨機性,第一次測試出現正誤差的同學更有可能出現負誤差、第一次出現負誤差的同學更有可能出現正誤差,於是原來的高分組成績自然會有所下降、低分組成績自然會有所上升,均向中間分數靠攏。
這樣看來, 統計回歸效應的真正原因就是偶然因素變化導致的隨機誤差,以及僅僅根據一次測試結果劃分高分組和低分組。測試中隨機誤差的影響越大,統計回歸效應也就會越大;反之越小。
在心理學研究中,如何避免這種回歸效應對實驗結果的影響呢?下列方法或許是可以採納的:
1. 精心編制測試工具,提高測試工具的信度水平;
2. 增加測試項目取樣,即從相關的多方面進行較為全面地測試;
3. 增加測試次數,以多次測試的平均成績作為分組依據。如前述的研究,以多次的語文測試成績的平均分作為分組依據,就可以在分組時控制隨機誤差的影響;
4. 在可能的情況下,儘可能地採用等組實驗。