國標碼定義
中國漢字通行的國際標準為我國於1981年制訂的“信息交換用漢字編碼字元集”,其標準號為GB2312—80,簡稱國際碼,是我國套用最廣泛的漢字編碼字元集。
國標碼由來
初期的漢字系統字數不足,很多事物以通假字表示,使文字的表述存在較大歧義。為完善表述的明確性,漢字經歷了逐步複雜、字數大量增加的階段。漢字數量的過度增加又引發了漢字學習的困難,單一漢字能表示的意義有限,於是有許多單一的漢語意義是用漢語詞語表示,例如常見的雙字詞。目前漢語書寫的發展多朝向造新詞而非造新字。漢字編碼系統為進行信息交換,各漢字使用地區都制訂了一系列漢字字元集標準。
國標碼(“國標”是中華人民共和國國家標準的簡稱)在中國大陸使用。GB2312收錄6763個漢字,GBK收錄20912個漢字,最新的GB18030收錄27533個漢字。BIG5碼。收錄13053個漢字。在台灣和香港使用的一位元組或兩位元組編碼。Unicode並不被中國政府很好的接受。中國政府要求在中國大陸出售的軟體必須支持GB18030編碼。在國際通信化和軟體設計領域,CJK編碼收集了漢語、日語、韓語中的漢字集。