EUC-TW

“第一位位元組”使用0xA1-0xFE “第二位位元組”使用0xA1-0xFE 2312-80codeset

EUC-TW的含義

EUC-TW本來是台灣使用的其中一個漢字儲存方法,以CNS11643字表為基礎

EUC-TWEUC-TW
但是台灣普遍使用大五碼,EUC-TW甚少使用。
CNS 11643第一字面的字元使用兩個位元組來表示。
“第一位位元組”使用0xA1-0xFE
“第二位位元組”使用0xA1-0xFE
CNS 11643其他字面的字元使用四個位元組來表示。
“第一位位元組”使用0x8E
“第二位位元組”使用0xA1-0xB0 (0xA1-0xA7分別代表第1至第7個字面,其餘未定義)
“第三位位元組”使用0xA1-0xFE
“第四位位元組”使用0xA1-0xFE
(CNS 11643第一字面可選擇使用兩個位元組或四個位元組來表示)

EUC的體系

EUC是Unix環境下的一種擴展編碼體系

EUC-TWEUC-TW
採用8位位元組編碼,支持固定位元組和可變位元組的編碼,廣泛使用在Unix環境下
對多國語言的支持,目前對於中文環境,有兩個編碼集。Unix在推廣EUC的時候是充分的借鑑,吸納多位元組編碼國家
的編碼集本地化實現,兩種中文編碼集基本上都是吸納了簡體繁體的編碼集,很關鍵的一點就是它不是
UTF-8,Unix系統(FreeBSD)要利用NLS機制,進行多位元組和系統庫使用的寬字元之間的轉換,確切的說是euc和
UTF-8的轉換。

eucCN是什麼

EUC-TW

EUC-TWEUC-TW

codeset 0 : ASCII
codeset 1 : CNS 11643-1992 plane 1
codeset 2 : CNS 11643-1992 plane 2 - 16
codeset 3 : [not used]
EUC-CN
codeset 0 : ASCII
codeset 1 : GB 2312-80
codeset 2 : [not used]
codeset 3 : [not used]
從上面看來,eucCN就是GB2312,在FreeBSD 4.11中,已經不存在GB2312這個locale,eucCN就是GB2312,使用8位的
兩位元組編碼

相關詞條

相關搜尋

熱門詞條

聯絡我們