簡介
表意文字補充平面,(Supplementary Ideographic Plane,簡稱SIP),或稱第二平面(Plane 2),是Unicode中的一個編碼區段。編碼從U+20000至U+2FFFF。它是在Unicode裡面基本多文種平面以外儲存的字元。現時整個平面所配置的,全部都是一些罕用的漢字、或地區的方言用字,如粵語用字及越南語的字喃。
狀態
已分配和計畫分配的編碼區段為:
00020000-0002A6DF:中日韓統一表意文字擴展 B (CJK Unified Ideographs Extension B)Unicode的PDF檔案
0002A6E0-0002F7FF:中日韓統一表意文字擴展 C1 (CJK Unified Ideographs Extension C1)
還在草擬階段,預計最快要到2007年才可以公布最後草案(FDAM)。
0002F800-0002FA1F:中日韓兼容表意文字增補 (CJK Compatibility Ideographs Supplement)Unicode的PDF檔案
擴展B
擴展B段包含有42,711個新的漢字。根據ISO/IEC JTC1/SC2/WG2/IRG N777號檔案,這四萬多個漢字分別從以下字典或字集中取得:
CNS 11643的第4平面到第15平面所收錄的30,177個漢字;
在《漢語大字典》中出現的28,914個未收錄漢字;
在《康熙字典》中出現的18,486個未收錄漢字(包括一個在補遺篇出現漢字);
在北韓的國家標準所收錄的5,642個漢字;
在越南的國家標準所收錄的4,232個字喃;
HKSCS中出現的1,081個未收錄漢字;
《漢語大詞典》中出現的553個未收錄漢字;
《四庫全書》中出現的522個未收錄漢字;
日本國家工業標準的JIS x 0213第3平面及第4平面的302個未收錄漢字;
1980年代版本的《辭海》中出現的247個未收錄漢字;
大韓民國PKS 5700-3:1998中出現的166個未收錄漢字;
《中國大百科全書》中出現的86個未收錄漢字;
《辭源》中出現的66個未收錄漢字;
北大方正排版系統中出現的65個未收錄漢字;
這堆漢字中重覆的漢字有不少,所以經過整理之後,總數實際上只有42,711個漢字。