簡介
如當 自變數數目比較多,且自變數間相互關係比較複雜(如:有些自變數間的關係是相關關係,有些自變數間則可能是因果關係)或者某些自變數是通過其他的自變數間接地對應變數產生影響,這時可以採用通徑分析。
基本概念
2.1 通徑模型(path model):
通徑模型是由一組線性方程組成的,反映 自變數、中間變數、 潛變數和應變數之間相互關係的模型,是以多元線性回歸方程為基礎的模型。
2.2 通徑圖(path graph):
通徑圖(如圖1)可以直觀的表現各個變數之間的相互關係。通徑圖中的單箭頭線稱為直接通徑(如A到D),簡稱通徑(path),表示因果關係,方向由原因指向結果。雙箭頭線稱為相關線(correlation line),表示變數間互為因果,是平行關係(如A與B)。
A B C
D
е
圖1 通徑圖
其中е為 誤差項。
2.3 外生變數和 內生變數:
通徑分析中只受到模型之外的其他因素影響的變數稱為外生變數,如圖1中的A、B、C、е,通徑圖中沒有箭頭指向它們。外生變數之間如果有相關關係,則用雙箭頭線表示。
通徑分析中受到模型中某些變數影響的變數稱為 內生變數,如圖1中的D,通徑圖中有朝內的箭頭指向它們。
2.4 通徑係數(path coefficient):
通徑係數是是用來表示相關變數因果關係的 統計量,是標準化的 偏回歸係數 ,也稱作通徑權重。 通徑係數一般用 最小二乘法法(OLS)或極大似然估計法(MLE) 來估計。
2.4.1 通徑係數的數學表達式
如果我們估計的 線性回歸方程為:
= + + (1)
或
= + + + ( 為 殘差)(2)
由於 和 帶有量綱,我們不能通過 、 來比較 對 的影響大小。如果要比較 和 對 的影響,需要消除量綱的影響,需要將 、 及 標準化。
由 = + + + 可得:
= + + (3)
公式(2)與公式(3)相減得:
- = - )+ ( - )+ (4)
公式(4)可變換為下式:
= · + · + · (5)
公式(5)中 、 、 、 分別表示 、 及 的標準差。 和 分別為 自變數 、 的標準化 偏回歸係數。 為除了 自變數以外的其他因素對應變數 的影響大小。如果我們以 、 、和 分別表示 、 和 到 的 通徑係數,那么:
= , = , =
當我們估計的 線性回歸方程有多個 自變數,且自變數間兩兩相關時,各自變數及 殘差到應變數的 通徑係數的 數學表達式同上。
2.4.2 通徑係數的性質:
(1) 通徑係數具有 偏回歸係數的性質。它是變數標準化後的 偏回歸係數,能夠表示變數間的因果關係,故仍具有偏回歸係數的性質。
(2) 通徑係數具有 相關係數的性質。它是一個不帶單位的相對數,因而又具有 相關係數的性質,是具有方向性的相關係數,能表示原因與結果( 自變數與依變數)之間的關係,它是介於 回歸係數和相關係數之間的一種 統計量,可用於各種性狀間的 相關分析。
(3) 通徑係數是一個不帶單位的相對數。可以用它來估計自變數對應變數直接影響效應的大小,比較其相對重要性。
(4)利用 通徑係數分析,可以幫助我們建立“最優”多元 回歸方程。
2.5 決定係數(Determination coefficient)
通徑係數的平方稱為 決定係數,表示自變數或 誤差能夠解釋應變數總 變異的程度。
3 通徑分析的顯著性檢驗
通徑分析的 顯著性檢驗包括以下四項:
(1) 回歸方程顯著性檢驗:採用F檢驗法;
(2) 通徑係數顯著性檢驗:採用F檢驗法或T檢驗法;
(3) 通徑係數差異顯著性檢驗:採用F檢驗法或T檢驗法;
(4) 兩次通徑分析相應通徑係數顯著性檢驗:採用F檢驗法或t檢驗法。
一般情況下,第(3)種檢驗和第(4)種檢驗在一般的 多元線性回歸分析中無法實現,因為不同 偏回歸係數帶有不同 量綱,但是在通徑分析中,這兩種檢驗可以實現。