簡介
故障安全在計算機系統或數據通信系統中發生故障或錯誤時,為了使系統不至於完全不能工作而採取適當的對策或措施稱為故障安全。例如,執行中的程式如果發生錯誤,替代程式便會馬上投入運行,從而使系統能繼續運轉。又如用備用設備自動切入或備用計算機接替工作,使得系統能繼續運行,從而避免造成災難性損失。具有故障安全措施的系統稱為故障安全系統(failsafe system)。
當然故障安全系統的性能相對原系統而言可能有些下降。要求鐵路信號設備或系統一旦發生安全故障後,能防止出現災難性後果自動導向安全一方的重要設計原則。
故障安全系統
對於重要場合下使用的安全性相關控制系統,在系統設計中,除了一般可靠性技術外,還需要採用一種應付意外故障的手段,以使電路或系統故障後導向安全,即故障安全技術。對故障安全技術和安全系統的研究從20世紀60年代初就開始了,它主要使用在一些高危系統,例如核反應、航空航天和國防軍事等領域,以避免給人類造成巨大的損失和災難。
必要性
對故障安全技術和安全系統的研究從20世紀60年代初就開始了,它主要使用在一些高危系統,例如核反應、航空航天和國防軍事等領域,以避免給人類造成巨大的損失和災難。從系統安全的後果來分析,可以將其功能損壞和後果分成不同類型,例如以一架航空器的功能安全為例,可以分為:
(1)災難性功能破壞,航空器全部功能失效,既不能飛行,也不能著落,其後果是不可接受的;
(2)危險性功能損壞,航空器部分功能喪失,不能完成正常飛行任務;
(3)嚴重功能損壞,航空器小部分功能喪失,對飛行有一定影響;
(4)輕微功能損壞,航空器有輕微損傷和功能失效,但是基本上不影響正常飛行。
特徵
對於重要場合下使用的安全性相關控制系統,在系統設計中,除了一般可靠性技術外,還需要採用一種應付意外故障的手段,以使電路或系統故障後導向安全,即故障安全技術。
在故障安全技術的研究中,日本、歐美和我國的學者作了許多廣泛深入的理論探索,他們的研究在容錯、可靠性和故障安全理論之間建立了密切的聯繫,為故障安全技術的實際套用奠定了堅實的理論基礎。隨著微電子技術的飛速發展,一些新穎的故障安全系統已成為結構複雜的計算機系統,它們大多具備以下特徵:(1)地理上分散或者是一種集散式系統;(2)由於結構的分散性,對涉及控制安全性的信息具有更嚴格的時限要求,因而是時間相關的系統;(3)分散的子系統相互關聯,其間又有非故障安全單元(例如通信裝置)介入,各個子系統的故障安全性緊密相關。故障安全系統的這些新特徵,要求對故障安全技術作更深入的研究。
提高安全性沒能方法
數字系統的安全性可以通過以下兩種方式得到較好的保證:
(1)充分利用系統所採用技術本身固有的安全性能,保證安全性;
(2)應充分利用系統的結構冗餘技術,提高安全性。
利用固有的安全性
固有安全性是指為了保證系統的安全,對系統的每一個部件(元器件)在生產、製造過程中,都已經考慮到產品的安全性能,並且有一定的安全技術指標特徵。由於固有安全性同具體系統、產品有密切關係,因此無法提出統一的標準或解決方案。
利用結構冗餘技術的安全性
結構冗餘技術,可以提高系統的安全性,其主要原理是採用結構冗餘技術後,可以將一部分認為有嚴重後果的狀態分離出來作為是冗餘狀態,這樣就可以降低發生嚴重後果的機率。事實上,這種技術旨在(如果不能控制系統中故障本身的話)控制系統在發生故障後所產生的影響和後果,使得系統在有可能發生嚴重後果時,立即將系統從該(嚴重)狀態轉換到一種無害的“中立狀態”,以免發生這種嚴重後果。雖然系統不會繼續運行,但是也不會產生嚴重的結果。