級聯失效時空傳播特性

級聯失效時空傳播特性

級聯失效時空傳播特性指級聯失效過程中故障傳播的時空規律。級聯失效的時空傳播行為描述了級聯失效在時間和空間的動態演化過程,重點在於研究故障傳播的空間路徑和時間特點。

簡介

級聯失效是指系統的元件故障會引起一系列的其他故障,並有可能傳播到整個系統。如美加大停電、城市擁堵、網際網路癱瘓等例子說明,級聯失效已經成為網路系統的主要故障模式。對級聯失效過程中故障傳播的時空規律,即級聯失效時空傳播特性的研究也顯得尤為重要。

級聯失效研究現狀

級聯失效是一種可以引發一系列失效,並最終在整個系統中導致故障傳播的網路故障模式。其潛在的風險和災難性的後果促使許多領域投人大量精力探究級聯失效,從而提出規避風險以及降低級聯失效災難性後果的新措施。有關級聯失效的研究主要集中在三個方面:臨界條件、故障機理和實證統計。

網路的故障過程可以看成是典型的相變過程,相變的臨界點標誌著網路的整體失效。分析網路故障的臨界點,對於預測級聯失效的發生,指導網路系統的可靠性設計等有積極意義。網路故障的臨界性分析一般基於滲流理論,通過建立網路節點之間的故障依賴顯性關係,分析整個網路功能對各類風險的容忍能力。研究通常假設各類故障依賴關係的拓撲結構和數量,並量化這些因素對網路彈性的影響能力。對於單個網路,網路的滲流臨界值取決於網路中故障依賴邊的分布和比例。而對於耦合網路,在網路間的耦合拓撲關係確定的情況下,滲流臨界值取決於禍合網路的數量。

在故障機理的研究中,重點在於對網路級聯失效的原理進行建模,得到可以較好刻畫實際網路級聯失效過程的模型。例如,過載是一種較常見的級聯失效故障機理,主要發生在電力網路、交通網路等有流量運輸任務的網路。在這些網路中,如果網路某個節點上的流量超過其闌值,那么將導致此節點上流量的重新分配,進而加劇了其他節點的負載壓力,並可能引發這些節點過載失效,最終形成故障傳播。在複雜網路研究中,主要通過用網路節點的介數來模擬流量,進而對由過載導致的級聯失效進行建模,主要的模型包括:Motter-Lai模型、Crucitti模型和OPA模型等。在這些模型中,Motter-Lai模型被廣泛用於抽象模擬各類網路的級聯失效過程,同時忽略了許多特殊的網路運行和管理細節。OPA模型則主要針對模擬電力網路中的級聯失效過程,並考慮了許多的電力網路運行特點。

級聯失效的空間規律

要做到有效的實時故障傳播控制,就必須研究故障傳播的時空規律,從根本上對故障傳播的行為進行掌握。大部分的研究集中在臨界條件、故障機理和實證統計三個方面,而級聯失效的傳播行為尚未得到充分研究。級聯失效中,故障的時空傳播行為描述了級聯失效在時間和空間的動態演化過程,重點在於研究故障傳播的空間路徑和時間特點。

已有的模型大都假設故障之間是近鄰傳播,即一個節點的故障會傳播給其一階近鄰(與此節點有連邊的節點)。而這裡發現的這種故障間呈現長程相關的特點意味著節點間的故障具有大範圍的聯動關係,一個節點的故障不僅僅會影響附近的節點,也會影響和其相距較遠的節點。而且這種聯繫會使故障聚集,並出現集團特徵。雖然交通系統和電力網路的控制模式和故障管理方式不同,但這兩個系統在級聯失效上卻表現出相似的故障長程相關特點,說明故障傳播空間特點的普適性和背後的共同失效機理。基於滲流方法,Li D進一步通過套用過載模型揭示了這類系統的級聯失效機理,發現這種在實際數據觀察到的故障長程相關性只有在模型的臨界點處才會出現,如果系統遠離自身的相變臨界點,那么故障之間的相關性範圍會大大縮短。這也再次證實了實際系統是處於其自組織臨界點運行的發現。

級聯失效的時間特點

除了故障傳播的空間路徑外,有研究關注了故障傳播的時間特點。在時間維度上,故障傳播通常被看作是一種分支過程:最初的故障(樹的根節點)會引發更多的故障(樹的葉子節點),形成故障樹,故障樹的大小即為總故障規模。最初的故障後,隨著時間的增加,每一個級聯階段故障的數目如果不減少(分支指數不小於1),那么就會形成大規模的級聯失效。在網路的故障過程中,網路的最大連通子團(系統中保持連線的最大節點集合)會由於失效的節點逐漸減小,並最終崩潰,導致系統整體失效。而在耦合網路的失效過程中,研究發現系統處在臨界點時,其最大連通子團在減小的過程中,會有一段非常緩慢的過程(子團大小降低的速度非常慢),被稱作“平台期”。在這個平台期之後,最大子團的大小急劇降低,系統迅速崩潰。系統崩潰持續的整個過程叫做故障時間,在臨界點處,系統的故障時間會發散,不存在一個特徵時間。研究發現,這些系統故障的時間特點是由於故障的分支過程中形成的故障樹的大小呈現一個冪律的分布(指數為-1.5)。

如果將網路比喻為森林,那么故障傳播就是森林火災。只有理解了火災的傳播規律,才能更好地制定滅火策略。上述關於故障傳播規律的發現可以為網路可靠性工程提供借鑑,也可以支撐未來的智慧工程。隨著工業化和信息化的深度融合,越來越多的物理系統與信息系統耦合起來,形成信息物理融合系統(CPS)。原本只在某一單一空間傳播的故障,由於信息物理空間的耦合,故障傳播的方式也將會有根本性的轉變,成為系統運行和管理的極大風險。在理解信息物理系統的特點基礎上,有針對性地研究這些系統的特有故障傳播規律,建立基於故障傳播的可靠性模型,是研究信息物理系統可靠性的基礎問題。

相關詞條

熱門詞條

聯絡我們