糾錯記憶體

糾錯記憶體,即修正錯誤記憶體(英語:Error-correcting code memory,縮寫ECC memory),即能夠實現錯誤檢查和糾正錯誤技術的記憶體。

簡介

糾錯記憶體,即 修正錯誤記憶體(英語:Error-correcting code memory,縮寫 ECC memory),即能夠實現錯誤檢查和糾正錯誤技術的記憶體。

技術原理

在ECC技術出現之前,記憶體中套用最多的另外一種錯誤檢查技術,是奇偶校驗位(Parity)技術。

在數位電路中,最小的數據單位是“比特(bit)”,也叫“位元”。“比特”也是記憶體中的最小單位,它是通過“1”和“0”來表示數據高、低電平信號。在數字電路中8個連續的比特是一位元組,不帶“奇偶校驗”的記憶體中的每個位元組只有8位,若它的某一位存儲出了錯誤,就會使其中存儲的相應數據發生改變而導致應用程式發生錯誤。

而帶有“奇偶校驗”的記憶體在每一位元組(8位)外又額外增加了一位用來進行錯誤檢測。比如一個位元組中存儲了某一數值(1、0、1、0、1、0、1、1),把這每一位相加起來(1+0+1+0+1+0+1+1=5)。對於偶校驗,若其結果是奇數,校驗位就定義為1,反之則為0;對於奇校驗則相反。當CPU返回讀取存儲的數據時,它會再次相加前8位中存儲的數據,計算結果是否與校驗位相一致。當CPU發現二者不同時就會試圖糾正這些錯誤。

但奇偶校驗位技術有個缺點,當記憶體查到某個數據位有錯誤時,由於不一定能確定錯誤在哪一個位,也就不一定能修正錯誤。所以帶有奇偶校驗的記憶體的主要功能僅僅是“發現錯誤”,並能糾正部分簡單的錯誤。

此外,奇偶校驗技術是通過在原來數據位的基礎上增加一個數據位來檢查當前8位數據的正確性,但隨著數據位的增加,用來檢驗的數據位也成倍增加,就是說當數據位為16位時它需要增加2位用於檢查,當數據位為32位時則需增加4位,依此類推。特別是當數據量非常大時,數據出錯的幾率也就越大,對於只能糾正簡單錯誤的奇偶檢驗的方法就顯得力不從心了。正是基於這樣一種情況,錯誤檢查和糾正(Error Checking and Correcting)應運而生了。

ECC與奇偶校驗不同的是,如果數據位是8位,則需要增加5位來進行ECC錯誤檢查和糾正。數據位每增加一倍,ECC只增加一位檢驗位。也就是說當數據位為16位時ECC位為6位,32位時ECC位為7位,數據位為64位時ECC位為8位,依此類推。在記憶體中ECC能夠容許錯誤,並可以將錯誤自動更正,使系統得以正常的操作,不致因錯誤而中斷。

誤解

部分人認為伺服器必須使用ECC記憶體,認為ECC記憶體效能較高,其實是一種謬誤。ECC記憶體之所以廣泛套用於伺服器領域,並非其效能,而是因為ECC記憶體的糾錯能力,使伺服器保持穩定。事實上,ECC RAM要進行糾錯,它的效能比一般的non-ECC RAM還要低。

ECC本身並不是一種記憶體型號,也不是一種記憶體專用技術,它是一種廣泛套用於各種領域的計算機指令中的指令糾錯技術,確保伺服器的正常運行。之所以說它並不是一種記憶體型號,那是因為並不是一種影響記憶體結構和存儲速度的技術。它可以套用到不同的記憶體類型之中,正如上述的“奇偶校正”記憶體,它也不是一種記憶體。最開始套用這種技術的是EDO記憶體,現在的SDRAM也有套用。ECC記憶體主要是從SDRAM開始得到廣泛套用,而新的DDR、RDRAM也有相應的套用,目前主流的ECC記憶體其實是SDRAM。

備註

ECC記憶體還需要CPU和主機板支持,並在BIOS中進行相應的設定,目前只套用在大多數伺服器主機板。

相關詞條

熱門詞條

聯絡我們