單粒子事件

單粒子事件

單粒子事件(single event phenomena)是指空間輻射單粒子效應的另一種稱法。因為空間輻射造成的單粒子效應發生具有瞬發性和幾率性,因此將其稱為一個事件 。

基本信息

簡介

單粒子事件(single event phenomena)空間輻射單粒子效應的另一種稱法。因為空間輻射造成的單粒子效應發生具有瞬發性和幾率性,因此將其稱為一個事件 。

背景

由於近地空間和大氣環境影響空間系統的規模、重量、複雜性和價格,因而影響空間系統的運行性能和工作壽命。輻射帶中的捕獲粒子、太陽耀斑質子和銀河字宙射線能在微電子器件中誘發單粒子事件。

單粒子事件包括三種不同的效應:即單粒子翻轉、單粒子鎖定和單粒子擊穿,單粒子事件會導致星載計算機軟、硬體發生故障或失效。因此,為了實現高可靠性和高安全性,需要在程式中套用容錯、糾錯、避錯的措施,但如何驗證這些措施在系統實際運行中的效果呢?單粒子小件故障注入系統就是針對此需求而研製的一一種對容錯軟體有效性進行評價的工具,對計算機單粒子事件故障注入大致有三種不同的流行方案,即軟體注入法、硬體注入法和重離子輻射注入法 。

系統結構及功能

單粒子事件故障注入系統由資料庫伺服器、主控計算機、故障注入器、有線監控和目標系統五個分系統組成。

故障注入器根據主控計算機的故障類型設定完成單粒子事件故障的注入,同時對目標系統運行的程式進行追蹤,將追蹤得到的數據回送給主控計算機,由主控計算機對故障情況下運行的目標代碼進行分析。有線監控檢測軟體在目標系統中的運行情況,並將運行結果顯示出來,同時將數據傳送給資料庫伺服器。資料庫伺服器用來存儲目標軟體的運行信息,提供數據查詢,為人工或人工智慧進行故障判斷提供依據.主控計算機接收資料庫伺服器發來的當前目標軟體運行狀態,利用故障注入算法產生故障數據,並通過串口傳送給故障注入器,同時由於故障注入算法很難覆蓋所有的故障,因此主控計算機必須具備良好的人機互動界面,測試人員能夠很方便地設定所需注入的故障類型和數據。

在上述各分系統中,主控機通過故障注入器向目標軟體注入故障信息.故障注入器-方面進行故障注入,另一方面還實時地收集目標系統的匯流排信息,並通過串口傳送給主控計算機,由主控計算機反彙編得出當前目標系統實際運行的指令信息。因此,故障注入器是整個故障注入系統設計的重點之一 。

硬體實現技術

計算機中程式和數據都是存放在記憶體之中的, CPU則是按順序從記憶體中取出指令執行,因此只要能在記憶體中注入故障,就能模擬大部分軟體故障,在故障注入時,最好不中斷目標系統的運行,利用雙連線埠RAM的雙向同時訪問的特點就能很好地實現記憶體故障注入。但目標系統在對雙連線埠RAM進行寫操作時,注入的故障將會自動恢復,因此必須結合匯流排故障注入法來實現整個單粒子事件故障的模擬。

故障注入器共由三部分組成,分別由8086 CPU與ROM、 RAM及接口晶片等構成的8086基本系統,由雙連線埠RAM組成的記憶體故障注入部分和由現場可程式邏輯器件實現的匯流排接口與匯流排故障注入部分。

8086基本系統是一個智慧型控制模組,一方面它接收來自主控計算機的串口數據,根據數據包內的信息進行相應的單粒子事件故障注入;另一方面,它接收FPGA追蹤得到的目標系統的匯流排信息,組幀並通過串口傳送給主控計算機。

雙連線埠RAM提供實時雙向訪向功能,一方面,它通過FPGA實現的接口功能,為目標系統提供數據存儲空間;另一方面,它又是故障注入器中8086基本系統記憶體的一部分。因此當目標系統利用雙口RAM作為數據空間全速運行時,8086基本系統就可以在不中斷目標系統運行的情況下,實時、全動態地往雙口RAM 中注入故障信息(如單粒子翻轉)。當目標系統從注入故障的單元中讀取信息時,就會在目標軟體中引入單粒子事件故障。

僅僅使用雙口RAM是不夠的,因為雙口RAM只能完成記憶體故障注入,當發生往記憶體進行寫操作時,由於一般記憶體不提供防寫功能,因此注入的故障將因寫入事件而自動恢復。單粒子翻轉事件的表現恰好如此。但單粒子擊穿引起的故障是不能恢復的,這時需要在匯流排上注入故障來實現對記憶體某一位或某幾位的防寫。匯流排故障注入是利用FPGA來設計實現的,除此之外,還實現了對目標系統匯流排追蹤的功能 。

結果與討論

單粒子事件故障注入系統具有全動態實時注入單粒子事件的能力。採用了雙口RAM的優點與匯流排故障注入相結合的方法,避免了硬體注入的注入深度控制問題。為了評估軟體的抗單粒子事件能力,可以自由設定單粒子事件發生的頻度和深度,對目標系統的硬體沒有絲毫損害。同時由於採用FPGA設計了匯流排接口和轉換,因此無論目標系統採用什麼樣的CPU,都能夠對目標系統進行實時的故障注入 。

單粒子翻轉(SEU)及防護

在一些電磁、輻射環境比較惡劣的情況下,大規模積體電路(IC)常常會受到干擾,例如宇宙中單個高能粒子射入半導體器件靈敏區,使器件邏輯狀態翻轉:原來存儲的"0"變為"1",或者"1"變為"0",從而導致系統功能紊亂,嚴重時會發生災難性事故。SEU造成的邏輯錯誤不是永久性的。在特定的套用中,SEU已經成為一個不能忽視的問題。典型的SEU是,由於太空中高能粒子的轟擊,SEU已經成為星載計算機中最常見的錯誤。

降低單粒子翻轉效應發生機率的一個措施是增加冗餘度,NASA(美國國家航空航天局)在太空飛行器計算機系統中就採用這一措施。

單粒子鎖定(SEL)及防護

由於星載計算機系統大量採用了CMOS商用器件,出現SEL的危險性是客觀存在的,尤其在南大西洋地磁異常區(SAA),危險性更大。為了確保衛星安全,要避免使用容易出現SEL的器件,要把好質量關,遵守一定的篩選規則。此外還應採取必要的防護措施,以免燒毀器件,並能解除鎖定狀態,使計算機重新恢復工作。因此應採取如下措施。

(1)快速而準確的發表SEL;

(2)防止燒毀器件;

(3)防止和減少對總電源構成的威脅;

(4)隔離已損壞的器件;

(5)解除SEL狀態,使系統恢復正常工作:如關閉電源並重新上電(冷起動),或熱起動。為了確保解除SEL,要關掉所有可能為SEL提供維持電流的電源通路 。

相關詞條

熱門詞條

聯絡我們