概括的說,離群點是由於系統受外部干擾而造成的。但是,形成離群點的系統外部干擾是多種多樣的。首先可能是採樣中的誤差,如記錄的偏誤,工作人員出現筆誤,計算錯誤等,都有可能產生極端大值或者極端小值。其次可能是被研究現象本身由於受各種偶然非正常的因素影響而引起的,例如。在人口死亡序列中,由於某年發生了地震,使該年度死亡人數劇增,形成離群點;在股票價格序列中,由於受某項政策出台或某種謠傳的刺激,都會出現極增,極減現象,變現為序列中的離群點。
不論是何種原因引起的離群點對以後的時間序列分析都會造成一定的影響。從造成分析的困難來看,統計分析人員說不希望序列中出現離群點,離群點會直接影響模型的擬合精度,甚至會得到一些虛偽的信息。例如,兩個相距很近的離群點將在譜分析中產生許多虛假的頻率。因此,離群點往往被分析人員看作是一個“壞值”。但是,從獲得信息來看,離群點提供了很重要的信息,它不僅提示我們認真檢查採樣中是否存在差錯,在進行時間序列分析前,認真確認序列,而且,當確認離群點是由於系統受外部突發因素刺激而引起的時候,他會提供相關的系統穩定性,靈敏性等重要信息。
在時間序列分析中通常把離群點分為四種類型進行處理。第一類是加性離群點。造成這種離群點的干擾,只影響該干擾發生的那一時刻T上的序列值,即XT而不影響該時刻以後的序列值;第二種是更新離群點,造成離群點的干擾不僅作用於XT,而且影響T時刻以後序列的所有觀察值,它的出現意味著一個外部干擾作用於系統的開始,並且其作用方式與系統的動態模型有關;第三種樹水平位移離群點,造成這種離群點的干擾素在某一時刻T,系統的結構發生了變化,並持續影響T時刻以後的所有行為,在數列上往往變現為T時刻前後的序列均值發生水平位移;第四種是暫時變更離群點,造成這種離群點的干擾是在T時刻干擾發生時具有一定初始效應,以後隨時間根據衰減因子的大小呈指數衰減的一類干擾事件。
相關詞條
-
隔離群
年底向基金委遞交了中國人類基因組計畫的重大課題建議書,提出並組織我國人類基因組計畫重大項目。 我國有七位科學家作了大會專題報告,介紹了我國人類基因組研究...
相關新聞 相關內容 -
高槓桿點
高槓桿點(high leverage case)是指自變數因子空間中的離群點,由許多異常的自變數值組合起來的,與因變數沒有關係。帽子統計量可以判斷高槓桿...
基本介紹 多元回歸中高槓桿點的辨認 異常點與強影響點 -
野值點
的一小部分數據點稱為野值點。而偽數據的特性是:(1)產生是隨機的,在一次...;(2)在某時刻偽數據相對於其它跟蹤上目標設備的測量數據可以看作是離群值...又構成一相對穩定的時序;(4)當i=j時就是野值點.可見,偽數據不同於異常...
-
點斑原海豚
atten atten atten
地理分布 形態特徵 生活習性 繁育信息 亞種分化 -
散點分析
什麼是散點分析散點分析是一種通過確定企業的業務活動量和人員水平這兩種因素之間是否相關來預測企業未來人員需求的技術。 散點分析是企業的業務活動量與人員需求...
什麼是散點分析 散點分析的局限性 散點圖的繪製方法和注意點 -
大數據挖掘:系統方法與實例分析
果與分析10.5 小結參考文獻第 11 章 診斷方法 11.1離群點診斷概要11.1.1 離群點診斷的定義11.1.2 離群點診斷的作用11.1.3 離群點診斷方法分類11.2 基於統計的離群點診斷11.2.1...
內容簡介 作者簡介 目錄 -
盒圖
各式各樣地“髒數據”,也稱為“離群點”,於是為了不因這些少數的離群數據導致整體特徵的偏移,將這些離群點單獨匯出,而盒圖中的鬍鬚的兩級修改成最小觀測...min = Q1 - 1.5*IQR,如果存在離群點小於最小觀測值,則鬍鬚下...
定義 簡介 特點 -
高維聚類知識發現關鍵技術研究及套用
數據空間的離群點檢測方法 7.1概述 7.2高維空間中的離群點發現 7.3子空間離群點發現算法綜述 7.4映射離群點發現的思考 7.5映射離群點發現算法的設計 7.5.1映射聚類算法...
作者簡介 目錄 -
黃添強
學習的流形離群點挖掘研究,福建省高校服務海西建設重點項目子項目...的離群點查找新方法,控制與決策,2006,21(5):541-545. (EI)7. 黃添強, 秦小麟, 王欽敏. 空間資料庫中離群點的度量與查找...
個人簡介 研究方向 在研項目