【摘要】
目的:探討季節性疾病的建模預測問題。方法:多段函式殘差辨識的灰色建模方法。結果:經後驗差比值和小誤差機率檢驗知該模型預測精度為第一級“好”。結論:實例證明該模型有計算簡便、對資料要求不嚴、適應範圍較寬、殘差信息利用率及擬合預測精度較高等特點,可用於季節性疾病發病時間序列的建模預測。
【關鍵字】
多段函式殘差辨識殘差信息季節性序列建模預測
TheApplicationoftothePartionalFunctionIdentificationGrayMethodinthepredictionoftheseasonaldisease
Yukaiwen(TheMachengCentersforDiseaseControlandPrevention,HubeiProvince438300,China)
【Abstract】
Objective:toexplorethemodelingandpredicatingprobleminseasonaldistributioncharacteristicdiseaseMethod:applytothePartionalFunctionIdentification′sgraymodelingmethodResults:theforecastprecisionisthefirst-grade“good”byposteriorerrorratioandsmallerrorprobabilitytestknowledgethat,Conclusion:Theexampleprovedthismodelhasthecomputationtobesimple,islaxtothematerialrequest,theadaptationscopeiswide,thehighutilizationrateofresidualinformationandthefittingprecisionishigheretc,canbeusedforthemodelingforecastintheseasonaltime-seriesoftheinfectiondisease.
【Keywords】
partionalfunctionidentificationresidualinformationseasonalseriesmodelingforecast
1引言
受流行因素的影響,大多數疾病的發病時間序列都呈現出季節性與周期性特徵。對這類資料進行定量分析,如用線性回歸模型、隨機時間序列模型和單區間GM(1,1)模型進行預測,則模型都僅考慮了序列的增長趨勢性,而忽視了疾病發生時間序列的季節性與周期性特徵,這顯然不是我們期望的,而另外一些模型如比例波動模型、ANN模型等也僅考慮了疾病的季節性特點,卻忽視了序列的趨勢性特徵。這同樣使我們很難得到理想的預測結果。針對這一問題,本文套用多段函式殘差辨識法,將隱藏在序列中的趨勢項、周期項和隨機項等信息挖掘出來,並利用這一信息逐步地修正、調整和提高模型的擬合性能,最後建立分段時間序列GM模型群的逐級多次殘差擬合修正模型。通過實例套用,該模型能較好地提高季節性疾病的預測精度。
2建模原理與建模過程
21設有一時序觀察列{x(t),t∈T},將其按時區周期τ分段,構造具有季節周期性特徵的數據矩陣(見表1),相應有矩陣向量序列:
Xm1(t),Xm2(t),Xm(n-1)(t),Xmn(t)
YN(t)=∑n-1i=1biXi(t)+b
對該向量序列可構造灰色模型:
22按照分段殘差的概念,對上式作如下擬合:
YN(t)=[Xn-1(t-τ)Xn-k(t-kτ)]δ1(t)+Δn+j(t)
Δn+j(t)=[Xn-2(t-τ)Xn-k-1(t-(k+1)τ)]δ2(t)+Δn+j-1(t)
Δn+j+(j-2)=[Xn-j(t-jτ)Xn-k-j+1(t-(k+j-1)τ)]δj(t)+Δn+1(t)
上述各擬合式中:k為擬合階數;j(=n-k)為擬合次數;τ為時矩;δj(t)為待辨識參數向量。[Xn-j(t-jτ)Xn-k-j+1(t-(k+j-1)τ)]為M*k階向量矩陣。Δn+j(t),Δn+j-1(t),…Δn+1(t)分別為濾出趨勢值、周期項值和隨機誤差值後的各級擬合殘差。
將上述各式綜合起來,並引入q步後移運算元q-1:q-1Xn-k(t-τ)=Xn-k(t-2)τ,可得:
Xn(t)=[Xn-1(t-τ)Xn-k(t-kτ)]δ1(t)+q-1[Xn-2(t-τ)…Xn-k-1(t-kτ)]δ2(t)+…
q-(j-1)[Xn-j(t-τ)Xn-k-j+1(t-kτ)]δj(t)+Δn+1(t)
=∑j-1v=0(q-1)[Xn-v-1(t-τ)…Xn-v-1(t-kτ)]δv+1(t)+Δn+1(t)…………(1)
此即多段函式殘差辨識擬合模型(thePartionalFunctionIdentificationmethod),記為PFI(k,j,τ)模型。式中δj(t)待辨識參數須按下面步驟依次擬合求解:
第一步求趨勢值的近似擬合值YN
N(t)=[Xn-1(t-τ)Xn-k(t-kτ)]δ1(t)………………(2)
和分離趨勢項後的一階殘差實際值:
Δn+j(t)=YN(t)-[Xn-1(t-τ)Xn-k(t-kτ)]1(t)………………(3)
第二步求一階殘差Δn+j的近似擬合值n+j:
n+j=[Xn-2(t-2τ)Xn-k-1(t-(k+1)τ]δ2(t)………………(4)
和濾出趨勢項與周期項後的實際殘差值:
Δn+j-1(t)=Δn+j(t)-[Xn-2(t-2τ)Xn-k-1(t-(k+1)τ]2(t)……………(5)
第三步求j階殘差Δn+j-(j-2)的近似擬合值:
n+j-(j-2)(t)=[Xn-j(t-jτ)Xn-k-j+1(t-(k+j-1)τ]j(t)………………(6)
和剩餘誤差的實際殘差值:
Δn+1=Δn+2[Xn-j(t-jτ)Xn-k+j+1(t-(k+j-1)τ]δj(t)………………(7)
用最小二乘法依(2)、(4)、(6)擬合式依次求得相應的待辨識參數向量δ(t)和依(7)式求得末級剩餘誤差Δn+1後,代入(1)式即可得PFI(k、j、τ)擬合模型。所得模型累減還原並將下標外推一步即得下列預測模型:
n+1(t)=∑j-1v=0(q-1)v[Xn(t-τ)Xn-k-1(t-kτ)]v+1(t)+n+1(t)……(8)
3套用實例
表1是我市1987~1991年痢疾的季節發病情況,先根據1987~1990年的資料建立PFI(k、j、τ)模型,並預測1991年的發病數。
表11987~1991年痢疾發病季節統計(圓括弧內為累加生成數)
19871988198919901991
Xm1Xm2Xm3Xm4Xm5
一季4661(107)49(156)47(203)42(248)
二季99100(199)87(286)97(383)98(481)
三季845485(1330)397(1727)471(2198)511(2709)
四季241404(645)195(840)286(1126)295(1421)
本例中擬合次數j=n-k=4-2=2次,按上述擬合步驟(1)-(8)式計算待辨識向量δ(t)與末級殘差Δn+1,得預測模型及其預測值結果(見表2)。
表21991年季度觀察值與預測值分析比較
實際值預測值差值小機率誤差P=p{︱
εn-εΙ<06745S1}
一季424100181099819<06745S1,P=1
二季981002912-229120<06745S1,P=1
三季51150062931037070<06745S1,P=1
四季2952937372126280<06745S1,P=1
均值23652339149258512——
方差根1842451——470799——
利用後驗差法檢驗上述預測結果的準確性,由表2知:後驗差比值C=S2/S1=470799/1842451=0025553,小誤差機率P=p{︱εn-Ι<06745S1}=4/4=1,>095,查精度表知,預測精度為第一級“好”,表明模型預測效果十分良好,完全可套用於實際預測工作。
4討論
多段函式殘差辨識是數據殘差辨識的發展。由本文實例知,(1)、(8)二式實為多區間向量序列去首加權累加生成模型,理論上屬於微分動態模型,但不同於其他模型的是其在建模過程中,由於該模型通過特有的多級殘差擬合有效地開發和利用了殘差信息,以不斷地調整和修正擬合模型,使模型的預測精度和效果得以提高。因此,與其他模型相比,該模型有如下許多特點:①計算簡便,有一個很方便的遞推公式;②對資料的要求不嚴,適應範圍較寬,對季節變化穩定或不穩定的序列均可適用;③模型精度較高;④殘差信息利用率高,有利於系統的量化分析;⑤不足的是預測期短,模型參數需按資料的更新而不斷調整、變化。
http://www.diqiuren.org/news_view.asp?newsid=23646