EUC-TW:“第一位位元組”使用0xA1-0xFE “第二位位元組”使 -百科知識中文網

EUC-TW的含義

EUC-TW本來是台灣使用的其中一個漢字儲存方法，以CNS11643字表為基礎。

但是台灣普遍使用大五碼，EUC-TW甚少使用。
CNS 11643第一字面的字元使用兩個位元組來表示。
“第一位位元組”使用0xA1-0xFE
“第二位位元組”使用0xA1-0xFE
CNS 11643其他字面的字元使用四個位元組來表示。
“第一位位元組”使用0x8E
“第二位位元組”使用0xA1-0xB0 (0xA1-0xA7分別代表第1至第7個字面，其餘未定義)
“第三位位元組”使用0xA1-0xFE
“第四位位元組”使用0xA1-0xFE
(CNS 11643第一字面可選擇使用兩個位元組或四個位元組來表示)

EUC的體系

EUC是Unix環境下的一種擴展編碼體系，

採用8位位元組編碼，支持固定位元組和可變位元組的編碼，廣泛使用在Unix環境下
對多國語言的支持，目前對於中文環境，有兩個編碼集。Unix在推廣EUC的時候是充分的借鑑，吸納多位元組編碼國家
的編碼集本地化實現，兩種中文編碼集基本上都是吸納了簡體和繁體的編碼集，很關鍵的一點就是它不是
UTF-8，Unix系統（FreeBSD）要利用NLS機制，進行多位元組和系統庫使用的寬字元之間的轉換，確切的說是euc和
UTF-8的轉換。

eucCN是什麼

EUC-TW

codeset 0 : ASCII
codeset 1 : CNS 11643-1992 plane 1
codeset 2 : CNS 11643-1992 plane 2 - 16
codeset 3 : [not used]
EUC-CN
codeset 0 : ASCII
codeset 1 : GB 2312-80
codeset 2 : [not used]
codeset 3 : [not used]
從上面看來，eucCN就是GB2312,在FreeBSD 4.11中，已經不存在GB2312這個locale，eucCN就是GB2312，使用8位的
兩位元組編碼。

EUC-TW

EUC-TW的含義

EUC的體系

eucCN是什麼

相關詞條

iconv

freebsd packages

libiconv

920文本編輯器

相關搜尋

熱門詞條