逐步回歸

逐步回歸

逐步回歸的基本思想是將變數逐個引入模型,每引入一個解釋變數後都要進行F檢驗,並對已經選入的解釋變數逐個進行t檢驗,當原來引入的解釋變數由於後面解釋變數的引入變得不再顯著時,則將其刪除。以確保每次引入新的變數之前回歸方程中只包含顯著性變數。這是一個反覆的過程,直到既沒有顯著的解釋變數選入回歸方程,也沒有不顯著的解釋變數從回歸方程中剔除為止。以保證最後所得到的解釋變數集是最優的。 依據上述思想,可利用逐步回歸篩選並剔除引起多重共線性的變數,其具體步驟如下:先用被解釋變數對每一個所考慮的解釋變數做簡單回歸,然後以對被解釋變數貢獻最大的解釋變數所對應的回歸方程為基礎,再逐步引入其餘解釋變數。經過逐步回歸,使得最後保留在模型中的解釋變數既是重要的,又沒有嚴重多重共線性。

簡介

逐步回歸是一種線性回歸模型自變數選擇方法,其基本思想是將變數一個一個引入,引入的條件是其偏回歸平方和經驗是顯著的。同時,每引入一個新變數後,對已入選回歸模型的老變數逐個進行檢驗,將經檢驗認為不顯著的變數刪除,以保證所得自變數子集中每一個變數都是顯著的。此過程經過若干步直到不能再引入新變數為止。這時回歸模型中所有變數對因變數都是顯著的。

逐步型選元法

逐步回歸法選擇變數的過程包含兩個基本步驟:一是從回歸模型中剔出經檢驗不顯著的變數,二是引入新變數到回歸模型中,常用的逐步型選元法有向前法和向後法。

向前法:向前法的思想是變數由少到多,每次增加一個,直至沒有可引入的變數為止。具體步驟如下。

逐步回歸 逐步回歸

步驟1:對 p 個回歸自變數 分別同因變數 Y 建立一元回歸模型

逐步回歸 逐步回歸
逐步回歸 逐步回歸
逐步回歸 逐步回歸
逐步回歸 逐步回歸

計算變數 ,相應的回歸係數的 F 檢驗統計量的值,記為 ,取其中的最大值 ,即

逐步回歸 逐步回歸
逐步回歸 逐步回歸
逐步回歸 逐步回歸
逐步回歸 逐步回歸
逐步回歸 逐步回歸
逐步回歸 逐步回歸

對給定的顯著性水平 ,記相應的臨界值為 , ,則將 引入回歸模型,記 為選入變數指標集合。

逐步回歸 逐步回歸
逐步回歸 逐步回歸
逐步回歸 逐步回歸
逐步回歸 逐步回歸
逐步回歸 逐步回歸

步驟2:建立因變數 Y 與自變數子集 的二元回歸模型(即此回歸模型的回歸元為二元的),共有 個。計算變數的回歸係數 F 檢驗的統計量值,記為 ,選其中最大者,記為 ,對應自變數腳標記為 ,即

逐步回歸 逐步回歸

逐步回歸 逐步回歸
逐步回歸 逐步回歸
逐步回歸 逐步回歸
逐步回歸 逐步回歸

對給定的顯著性水平 ,記相應的臨界值為 , 則變數 引入回歸模型。否則,終止變數引入過程。

逐步回歸 逐步回歸

步驟3:考慮因變數對變數子集 的回歸重複步驟2。

依此方法重複進行,每次從未引入回歸模型的自變數中選取一個,知道經檢驗沒有變數引入為止。

向後法與向前法正好相反,它事先將全部自變數選入回歸模型,任何逐個剔除對殘差平方和貢獻較小的自變數。

實施過程

逐步回歸分析的實施過程是每一步都要對已引入回歸方程的變數計算其偏回歸平方和(即貢獻),然後選一個偏回歸平方和最小的變數,在預先給定的水平下進行顯著性檢驗,若顯著則該變數不必從回歸方程中剔除,這時方程中其他幾個變數也都不需要剔除(因為其他幾個變數的偏回歸平方和都大於最小的一個更不需要剔除)。相反,如果不顯著,則該變數需要剔除,然後按偏回歸平方和由小到大地依次對方程中其他變數進行檢驗。將對影響不顯著的變數全部剔除,保留的都是顯著的。接著再對未引入回歸方程中的變數分別計算其偏回歸平方和,並選其中偏回歸方程和最大的一個變數,同樣在給定水平下作顯著性檢驗,如果顯著則將該變數引入回歸方程,這一過程一直持續下去,直到在回歸方程中的變數都不能剔除而又無新變數可以引入時為止,這時逐步回歸過程結束。

相關詞條

相關搜尋

熱門詞條

聯絡我們