通用診斷程式

通用診斷程式

通用診斷程式是指系統方便用戶對計算機維護、檢測計算機軟體故障和硬體故障並對故障定位的程式。通用診斷程式極大地減輕了用戶管理計算機負擔,同時加快對計算機中故障的修復。通用診斷程式一般可以分為兩大類:通用軟體故障診斷程式和通用硬體故障診斷程式。

簡介

通用診斷程式是指系統方便用戶對計算機維護、檢測計算機軟體故障和硬體故障並對故障定位的程式。通用診斷程式是一種服務程式。服務程式是面向用戶的軟體,可供用戶共享,方便用戶使用計算機和管理人員維護管理計算機 。

用通用診斷程式進行故障診斷一般有三種形式,即啟動診斷、線上診斷或稱後台診斷和離線診斷。啟動診斷指從每次通電開始至進入正常的運行準備狀態止,內部診斷程式自動執行的診斷,一般情況下數秒之內即告完成,其目的是確認系統事務主要硬體是否正常工作。主要檢查的硬體包括:CPU、存儲器、I/O單元等 。

線上診斷是指在系統通過啟動診斷進入運行狀態後對計算機中各種設備和軟體進行自動檢測和診斷。只要系統不斷電,線上診斷就不會停止,線上診斷的診斷範圍大,顯示信息的內容也很多。

故障診斷

故障是系統不能執行規定功能的狀態。通常而言,故障是指系統中部分元器件功能失效而導致整個系統功能惡化的事件。設備的故障一般具有五個基本特徵:層次性、傳播性、放射性、延時性、不確定性等。故障診斷也稱診斷,查找設備或系統的故障的過程。用來檢查尋找故障的程式稱為診斷程式,對其它 設備或系統執行診斷的系統稱為診斷系統。故障診斷的主要任務有:故障檢測、故障類型判斷、故障定位及故障恢復等。其中:故障檢測是指與系統建立連線後,周期性地向下位機傳送檢測信號,通過接收的回響數據幀,判斷系統是否產生故障;故障類型判斷就是系統在檢測出故障之後,通過分析原因,判斷出系統故障的類型;故障定位是在前兩部的基礎之上,細化故障種類,診斷出系統具體故障部位和故障原因,為故障恢復做準備;故障恢復是整個故障診斷過程中最後也是最重要的一個環節,需要根據故障原因,採取不同的措施,對系統故障進行恢復。

軟體故障

定義

軟體故障是指軟體運行過程中出現的一種不希望或不可接受的內部狀態,或是將軟體故障區分為語法大小和語義大小,語法大小為受一個故障影響的代碼行數,語義大小為其輸出結果不正確的輸入空間的大小。

原因

軟體發生故障的原因主要有兩個方面:( 1) 內部因素。隨著計算機控制對象複雜程度提高和軟體功能增強,軟體規模不斷增大。例如,Windows NT 作業系統的代碼大約有 3200萬行。並且軟體內部狀態、路徑高度複雜。參與軟體開發各個階段的人的思維和交流不可能完美無缺,在設計這樣複雜的系統時難免犯錯誤,導致軟體留下缺陷。( 2) 外部因素。通常軟體是在開發環境中進行測試,在運行環境中使用。對軟體進行充分測試往往很困難,進行窮舉測試,達到完全的路徑覆蓋、狀態覆蓋幾乎不可能。所以,即使是在開發軟體產品時進行過大量測試,也不能完全發現和消除可能存在的缺陷;同時軟體產品的開發環境與使用環境往往存在較大的差異,因此軟體產品在使用時仍然可能發生故障。

軟體故障診斷的含義

人在參與軟體生存周期各個階段工作時難免出現錯誤。因此,從廣義上說,軟體故障診斷的目標包括軟體需求分析、設計、編碼、測試、使用、維護等軟體生存周期各階段所造成的缺陷。軟體故障診斷 ,“診”在於進行客觀的狀態檢測,包括採用各種測量、分析和診別方法 ; “斷”則需要確定軟體故障特性、軟體故障模型、軟體故障部位以及說明軟體故障產生的原因,並且提出相應的糾正措施和預防措施等。軟體故障檢測是根據系統提出的軟體故障診斷請求,採取一定的檢測方法,獲取軟體中的各種信息,獲得可能出現軟體故障的徵兆,識別軟體是否正常運行或存在故障,並為軟體故障定位提供依據。這些檢測方法包括根據檢查表和規則等進行靜態測試、設計測試用例進行動態測試、建立軟體故障樹進行分析、採用變異測試方法進行軟體故障模擬或者建立系統模型進行形式化驗證等 。

硬體故障

自動重啟

在計算機使用過程中, 有時會遇到機器自動重啟的現象。有些自動重啟只是偶然的、 暫時的。但有些自動重啟則是因為某一硬體出了問題導致的。常見的, 引起自動重啟的硬體原因有以下幾種:(1) 電源。計算機電源的功率不足或性能差。這種情況比較常見,特別是當我們為自己主機增添了新的設備後就很容易出現。另外 ,當主機全速工作時,電源可能就會因瞬時功率不足而暫時停止工作,這就造成了自動重啟的現象。(2) 記憶體。記憶體上如果某個晶片不完全損壞時,可能通過自檢,但是在運行時就會因為記憶體發熱量大而導致功能失效,引起計算機自動重啟。另外,記憶體與主機板接觸不良( 金手指被氧化, 插槽進灰) , 載入到記憶體的數據過多都有可能引起機器自動重啟。(3)CPUCPU 部分功能電路損壞時,計算機也能啟動,但當進行某一特殊功能時( 如玩 3D 遊戲) 就會重啟。另外,由於機箱的原因以及CPU 散熱不良,導致 CPU 溫度過高,也可能引起保護性自動重啟。(4) 主機板。主機板導致自動重啟的事例也比較常見。特別是老主機板,上面的部分晶片不完全損壞,導致主機板運行不穩定, 容易在進入系統後,出現隨機自動重啟的現象。

當機

當計算機的配置能夠滿足應用程式的運行需要時,出現了當機情況, 一般是不正常的。導致系統當機的原因很多,這裡只討論其硬體原因, 一般有以下幾種:(1) 主機板。有些當機是由於主機板上的原因引起的,比如某些劣質電容在長時間工作後爆裂;用於給 CPU 供電的電源管理晶片性能不良;主機板 BIOS 晶片中程式出錯;AGP 匯流排到北橋之間的小 RC 元件工作不正常等。(2) 硬碟故障。主要是硬碟老化或由於使用不當造成壞道、 壞扇區。這樣機器在運行時,需要訪問和交換數據,而硬碟有壞道或者壞扇區,就很容易發生當機現象。(3)CPU 超頻或散熱不良。CPU 在記憶體中存取數據的速度本來就快於記憶體與硬碟交換數據的速度,超頻使這種矛盾更加突出,加劇了在記憶體中找不到所需數據的情況,這樣就會出現“ 異常錯誤” 。另外, CPU 的發熱量很大,如果散熱不良,CPU 就會因為過熱而停止運轉, 導致系統當機。(4) 記憶體原因。主要是記憶體條鬆動、 虛焊或記憶體晶片本身質量所致。如果記憶體中數據交換量過大,也可能導致系統當機。(5) 匹配或兼容問題。如主機板主頻和 CPU 主頻不匹配,老主機板超頻時將外頻定得太高,可能就不能保證運行的穩定性,因而導致頻繁當機;一些特殊軟體,可能在有的微機上不能正常啟動甚至安裝,這可能是軟硬體不兼容造成的,如果在這些機器上安裝或者運行這些軟體,有可能導致系統當機。

相關詞條

熱門詞條

聯絡我們