定義和影響
對於模型yt=b0+b1x1t+b2x2t+……bkxkt+ut如果隨機誤差項的各期望值之間存在著相關關係,即
cov(ut,us)=E(utus)≠0(t,s=1,2,……k)
這時,稱隨機誤差項之間存在自相關性(autocorrelation)或序列相關
隨機誤差項的自相關性可以有多種形式,其中最常見的類型是隨機誤差項之間存在一階自相關性或一階自回歸形式,即隨機誤差項只與它的前一期值相關:cov(ut,ut-1)=E(ut,ut-1)=/=0,或者ut=f(ut-1),則稱這種關係為一階自相關。
一階自相關性可以表示為
ut=p1ui-1+p2ui-2+p3ui-3+……pput-p+vt
稱之為p階自回歸形式,或模型存在p階自相關
由於無法觀察到誤差項ut,只能通過殘差項et來判斷ut的行為。如果ut或et呈出下圖(a)-(d)形式,則表示ut存在自相關,如果ut或et呈現圖中(e)形式,則表示ut不存在自相關線性回歸模型中的隨機誤差項的序列相關問題較為普遍,特別是在套用時間序列資料時,隨機誤差項的序列相關經常發生。
自相關性產生的原因:
線性回歸模型中隨機誤差項存在序列相關的原因很多,但主要是經濟變數自身特點、數據特點、變數選擇及模型函式形式選擇引起的。
1.經濟變數慣性的作用引起隨機誤差項自相關
2.經濟行為的滯後性引起隨機誤差項自相關
3.一些隨機因素的干擾或影響引起隨機誤差項自相關
4.模型設定誤差引起隨機誤差項自相關
5.觀測數據處理引起隨機誤差項序列相關
自相關的後果:
線性相關模型的隨機誤差項存在自相關的情況下,用OLS(普通最小二乘法)進行參數估計,會造成以下幾個方面的影響。
從高斯-馬爾可夫定理的證明過程中可以看出,只有在同方差和非自相關性的條件下,OLS估計才具有最小方差性。當模型存在自相關性時,OLS估計仍然是無偏估計,但不再具有有效性。這與存在異方差性時的情況一樣,說明存在其他的參數估計方法,其估計誤差小於OLS估計的誤差;也就是說,對於存在自相關性的模型,應該改用其他方法估計模型中的參數。
1.自相關不影響OLS估計量的線性和無偏性,但使之失去有效性
2.自相關的係數估計量將有相當大的方差
3.自相關係數的T檢驗不顯著
4.模型的預測功能失效
模型
如何判斷數據存在自相關性a.用相關計量軟體:比如說E-VIEWS檢查殘差的分布。如果殘差分布具有明顯和圓潤的線性分布圖像,說明自相關性存在的可能性很高。反之,無規則波動大的分布圖像顯示出相關性微弱。
自相關性判斷方法1例子
自相關性判斷方法1例子
比如,以上圖片,左邊較為圓潤的分布就顯示出自相關性的存在,右邊波動大的則反之。
b.Durbin-WatsonStatistics(德賓—瓦特遜檢驗):假設timeseries模型存在自相關性,我們假設誤差項可以表述為Ut=ρ*Ut-1+ε.利用統計檢測設立假設,如果ρ=o.則表明沒有自相關性。Durbin-Watson統計量(後面建成DW統計量)可以成為判斷正、負、零(無)相關性的工具。DW統計量:d=∑(Ut-Ut-1)^2/∑ut^2≈2*(1-ρ).如果d=2則基本沒有自相關關係,d靠近0存在正的相關關係,d靠近4則有負的相關關係。
c.Q-Statistics以(box-pierce)-Eviews(7thversion第七版本)為例子:很多統計計量軟體軟體提供Qtest來檢測,這裡用Eviews為例子。Q的統計量(teststatistics)為Q=n*∑ρ^2.零假設nullhypothesisH0=0和方法2的含義一樣。如果零假設證明失敗,則對立假設ρ≠0成立,意味著有自相關性。
例子圖中的Q-test就顯示出相關性。
如何減弱模型的自相關性
方法一(GLSorFGLS):假設存在自相關性的模型,誤差項之間的關係為:Ut=ρ*Ut-i+ε(ε為除了自相關性的誤差項,i.i.d~(0,σ).t時期的模型為yt=βxt+Ut,t-1時期則為ρ*yt-1=ρ*βxt-1+ρ*Ut-t。用t時期的減去t-1時期的可得出yt-yt-1=β(xt-xt-1)+(Ut-Ut-1).已知Ut-Ut-i=ε。經過整理後新的模型滿足Gauss-Makov的假設和,Whitenoisecondition(同方差性或者等分散),沒有自相關性。
方法二(HAC:HeteroscedasticityAutocorrelationconsistent):以Eviews為例子,在分析模型時選擇HAC,在模型中逐漸添加timelag的數目,來校正DW統計量達到正常值減少自相關性。