名稱
簡體中文系統環境支持國標 GB2312、GB18030 和 Unicode (UTF-8) 編碼。它們在系統中設定的locale(亦指語言別)名稱為:
1.國標 GB2312: zh_CNhp15CN
2.國標 GB18030: zh_CNgb18030
3.Unicode (UTF-8): zh_CNutf8
編碼位元組
1.國標 GB2312 編碼 (zh_CNhp15CN)
國標 GB2312 是基於 1980 年發布的《信息交換用漢字編碼字元集基本集》,是中文信息處理的中國國家標準,是強制執行的中文編碼。
國標碼共收錄 6763 個簡體漢字、682 個符號,其中漢字部分:一級字 3755 個,以拼音排序,二級字 3008 個,以偏旁部首排序。該標準的制定和套用為規範、推動中文信息化進程起了很大作用。該標準用雙位元組表示一個漢字:
高位元組A1-F7(其中字元區 A1-F9,漢字區 B0-F7)
低位元組 A1-FE
2.國標 GB18030 編碼 (zh_CNgb18030)
國標 GB18030 基於 2000 年 3 月發布的《信息技術信息交換用漢字編碼字元集基本集的擴充》,是最新推出的中國國家強制執行中文信息處理標準編碼。
該標準涵蓋了單位元組、雙位元組、四位元組的字元和漢字,總計約 28,000 多個。