概念
判定係數(coefficient of determination,記為或)在統計學中用於度量因變數的變異中可由自變數解釋部分所占的比例,以此來判斷統計模型的解釋力。
對於簡單線性回歸而言,判定係數為樣本相關係數的平方。當加入其他回歸自變數後,決定係數相應地變為多重相關係數的平方。
假設一數據集包括 共 n個觀察值,相對應的模型預測值分別為 。定義殘差 ,平均觀察值為
於是可以得到總平方和
回歸平方和
殘差平方和
由此,判定係數可定義為
說明:圖1中判定係數,該統計量越接近於1,模型的擬合優度越高。
係數標準
判定係數只是說明列入模型的所有解釋變數對因變數的聯合的影響程度,不說明模型中單個解釋變數的影響程度。
判定係數達到多少為宜?沒有一個統一的明確界限值;若建模的目的是預測因變數值,一般需考慮有較高的判定係數。若建模的目的是結構分析,就不能只追求高的判定係數,而是要得到總體回歸係數的可信任的估計量。判定係數高並不一定說明每個回歸係數都可信任。