容錯性
所謂容錯是指在故障存在的情況下計算機系統不失效,仍然能夠正常工作的特性。容錯即是Fault Tolerance,確切地說是容故障(Fault),而並非容錯誤(Error)。例如在雙機容錯系統中,一台機器出現問題時,另一台機器可以取而代之,從而保證系統的正常運行。在早期計算機硬體不是特別可靠的情況下,這種情形比較常見。現在的硬體雖然較之從前穩定可靠得多,但是對於那些不允許出錯的系統,硬體容錯仍然是十分重要的途徑。計算機系統的容錯性通常可以從系統的可靠性、可用性、可測性等幾個方面來衡量。可靠性對於火箭發射之類關鍵性套用領域來說尤為重要。而對於通用計算機來說,一個重要的指標就是系統的可用性。可用性是指在一年的時間中確保系統不失效的時間比率。可測性在容錯系統的設計過程中也是一個非常重要的指標,如果我們無法對某個系統進行測試,又如何能保證它不出問題呢?此外還有MTBF(故障間的平均時間),即當系統正常運行後能堅持多長時間不失效。MTTR(故障修理的平均時間),即指系統要清除故障所需的時間。MTTR的大小直接影響著系統的可用性,而MTBF則反映了系統的可靠性。