漢字輸入碼
漢字輸入方法大體可分為:區位碼(數字碼)、音碼、形碼、音形碼。
區位碼
優點是無重碼或重碼率低,缺點是難於記憶;
形碼
根據漢字的字型進行編碼,編碼的規則較多,難於記憶,必須經過訓練才能較好地掌握;重碼率低;
音形碼
將音碼和形碼結合起來,輸入漢字,減少重碼率,提高漢字輸入速度。
漢字交換碼
漢字交換碼是指不同的具有漢字處理功能的計算機系統之間在交換漢字信息時所使用的代碼標準。自國家標準GB2312-80公布以來,我國一直延用該標準所規定的國標碼作為統一的漢字信息交換碼。
GB2312-80標準包括了 6763個漢字,按其使用頻度分為一級漢字 3755個和二級漢字 3008個。一級漢字按拼音排序,二級漢字按部首排序。此外,該標準還包括標點符號、數種西文字母、圖形、數碼等符號682個。
由於GB2312-80是80年代制定的標準,在實際套用時常常感到不夠,所以,建議處理文字信息的產品採用新頒布的GB18030信息交換用漢字編碼字元集,這個標準繁、簡字均處同一平台,可解決兩岸三地間GB碼與BIG5碼間的字碼轉換不便的問題。
字形存儲碼
字形存儲碼是指供計算機輸出漢字(顯示或列印)用的二進制信息,也稱字模。通常,採用的是數位化點陣字模。(如右圖)
一般的點陣規模有16×16,24×24,32×32,64×64等,每一個點在存儲器中用一個二進制位(bit)存儲。例如,在16×16的點陣中,需16×16bit=32 byte 的存儲空間。在相同點陣中,不管其筆劃繁簡,每個漢字所占的位元組數相等。
為了節省存儲空間,普遍採用了字形數據壓縮技術。所謂的矢量漢字是指用矢量方法將漢字點陣字模進行壓縮後得到的漢字字形的數位化信息。