漢字規劃
中國語言學會副會長、北京師範大學教授王寧是這次《規範漢字表》後期研製工作的專家組組長。她介紹說,《規範漢字表》的編制工作前後歷時八年,很多專家參與,先後召開大型學術會、專題研討會、徵求意見會、鑑定會、審議會80餘次,修改70餘稿,是非常慎重的。
《規範漢字表》是對過去已有規範的整合與修訂,包括:重新複查、確定了字級、字量、字形,對姓氏、地名、科技等領域的字作出補充,對簡化類推作出嚴格限制,正體字與異體字的關係也作了一些必要的調整。
於2001年4月啟動了《規範漢字表》研製項目,該項目2002年10月列為國家語委語言文字套用研究“十五”科研規劃的“重大項目”。經過課題組五年多的艱苦工作,《規範漢字表》課題於2006年4月18日通過了結項鑑定。鑑定委員會由來自高校、出版社、研究所等領域的12名專家組成,主任委員由曹先擢先生擔任。
作用
給是否恢復繁體字給出了一個答案,即不恢復繁體字,但可以識繁寫簡;給國人今後取名用字一個有用的指引,在這8000多漢字里找。
《規範漢字表》出台後,中國小教材常用字範圍等方面可能面臨變化。
《規範漢字表》後期研製工作的專家組組長、中國語言學會副會長、北京師範大學教授王寧表示,字表一經公布,我國新生兒的取名用字必須從中選取,亂取名、取怪名的現象將得到遏制。
文字是一種社會性很強的符號系統,一定要顧及普及層面上特別是基礎教育層面上用字的習慣,維護文字的穩定性,避免“靈機一動”隨便改動帶來新矛盾。此次修訂工作經過全盤考慮,慎重從事,是不恢復繁體字的。
專家簡介
曹先擢
教授,1932年生。河南潢川人。1958年於北京大學中文系畢業,留校任教。1980年晉升為副教授,1988年晉升為教授。1986年調國家語言文字委員會任秘書長。國家語言文字委員會副主任,中國社會科學院語言文字套用研究所所長。中國語言學會理事,中國文學學會理事,中國辭書學會會長,中國地名委員會副主任,中國自然科學名詞審定委員會委員。1993~1996年為日本國立一橋大學客座教授。曾主持《新華詞典》(商務印書館1980年)編纂工作,通讀並定稿。著有《通假字釋例》 (河南人民出版社1986年)、《字里乾坤》(香港商務印書館1988年、台灣商務印書館1990年)、《古代詞書講話》(合著,上海教育出版社1990年)、《漢字文化漫筆》(語文出版社1992年)、《八千種中文辭書編目提要》(主編,北京大學出版社1992年)、《漢字形義分析字典》(主編,北京大學出版社1999年)。1983年擔任中央電大古代漢語課程主講教師,編著《古代漢語講授綱要》(合著,中央廣播電視大學出版社1983年)。
王寧
女,1936年出生於浙江海寧。1958年畢業於北京師範大學中文系。現為北京師範大學教授,博士生導師,中文系古代漢語教研室主任,漢字與中文信息處理研究所所長,國家社會科學研究基地民俗典籍文字研究中心主任,兼任全國哲學與社會科學研究規劃專家評審組成員、全國文科教學指導委員會中文專業委員、教育部高師面向21世紀教改指導委員會中文專業召集人、中國語言學會副會長等學術職務。是現代著名的文字訓詁學專家,中國傳統語言學的重要繼承人之一。曾獲北京市普通高校教學成果一等獎、國家教委普通高校教學成果二等獎等多項獎項。王寧教授是北京市人大代表,兼任全國哲學社會科學基金語言文字學專家評審組組員、全國自學聯考中文專業委員會委員、國家教委中文專業教學指導委員會委員。並擔任中國文字學會常委理事、首都女教授聯誼會副會長。同時是北京語言文化大學等數校的兼職教授。出版專著與主編教材、叢書20餘種,
主要專著有
《訓詁方法論》、《古漢語詞義答問》、《訓詁與訓詁學》(以上與其老師陸宗達教授合著)、《說文解字與漢字學》、《訓詁學原理》、《漢字構形學講座》、《漢字構形學導論》等,主編高校教材有《漢字漢語基礎》、《中國文化概論》、《漢字學概要》、《古代漢語》等。
根據字的通用程度劃分
根據字的通用程度劃分為三級:
一級字表收字3500個,是使用頻度最高的常用字,主要滿足基礎教育和文化普及層面的用字需要。一般,600個常用字就可以覆蓋書面語的80%,900多字可以覆蓋書面語的90%,2400字可覆蓋達95%。
二級字表收字3000個,使用頻度低於一級字,與一級字合起來共6500字,主要滿足現代漢語文本印刷出版用字需要。
三級字表收字1800個,是一些專門領域(姓氏人名、地名、科學技術術語、中國小語文教材文言文)使用的,未進入一、二級字表的較通用的字,主要滿足與大眾生活和文化普及密切相關的專門領域的用字需要。
相關術語
1.字集:按照一定原則選出的一定數量漢字的集合。比如1988年1月,國家語委和國家教委聯合發布的《現代漢語常用字表》就是一個一般社會領域最常用漢字的字集。
2.字量:文字的數量,一般指某一特定範圍使用到的漢字的數量。比如1988年3月,國家語委和新聞出版署聯合發布的《現代漢語通用字表》的字量是7000個。《通用規範漢字表》(徵求意見稿)的總字量為8300個。
3.字形:漢字的外形,即單個漢字在空間展現出來的形貌。比如“王”由三橫一豎組成。
4.字級:一定數量的漢字集合內部,依據某原則而分出的若干具有層級性關係的漢字集合。比如,1988年1月,國家語委和國家教委聯合發布的《現代漢語常用字表》收字3500個,其中又分為兩個字級:前面2500個是常用字,後面1000個是次常用字。《通用規範漢字表》(徵求意見稿)分為一級字、二級字、三級字3個字級。
5.字用:漢字在書面作品中使用的情況。確定字用依據的是漢字具體的使用職能。記錄同一個詞的不同字形可算同一個字(比如說“淚”和“涙”是同一個字);記錄不同詞的相同字形則可算不同的字(比如“體”,古代讀bèn,表示愚笨;現代讀tǐ,表示身體,二者雖然形體相同但可算兩個字)。
6.字樣:《通用規範漢字表》(徵求意見稿)的相關檔案中所使用的“字樣”是指漢字的外部樣態。凡是漢字中的線條、圖素、筆畫在數量、交接方式、位相或體式等方面具有差異,也就是不能同比例重合的字,都屬於不同的字樣。比如說“淚”和“涙”是兩個字樣,因為它們的外在形態不同,但字用沒有區別,因為它們的職能相同,都是記錄漢語中“眼淚”這個詞。再比如,“戶-戶-戶-戶-戶”五個形體也是5個不同的字樣,只是其間的差別主要由於字型風格形成。總之,“字樣”描述的是每個字的外形。
7.字頻:漢字的出現頻率,即某個漢字在一定語料中使用(出現)的次數與樣本總字數的比率。比如在一個一萬字的文本中,“的”字一共出現過415次,那么“的”字在該文本中的字頻便是4.15%(415÷10000×100%=4.15%)。
8.字序:漢字在辭書和各種索引中的排列順序。漢字的字序主要有音序和形序。比如“天、地、人”三字,按形序(筆畫序)排列應該是“人(2畫)、天(4畫)、地(6畫)”,按音序排列應該是“地(di)、人(ren)、天(tian)”。幾個字筆畫相同時,則依照筆順的先後順序排列(筆順的先後順序是橫1、豎2、撇3、點4、折5),如“文、王、隊、日、午”五個字全是四畫,起筆分別為點、橫、折、豎、撇,依照筆順則應排列為“王、日、午、文、隊”。
9.類推簡化:某個字形簡化了,當這個字作為其他字的構件時如果也可以跟著簡化,就形成類推簡化。《簡化字總表》規定其第二表中的132個簡化字和12個簡化偏旁,可以類推簡化。比如“嚴、龍”簡作“嚴、龍”,“儼、壟”可以類推簡化作“儼、壟”;“車”簡作“車”,則以“車”為偏旁的“軌、軍、庫、載”可以類推簡化為“軌、軍、庫、載”。
10.有限類推:類推簡化限定在一定範圍內。《通用規範漢字表》(徵求意見稿)實行的就是有限類推,即凡收進字表的字如其字形是繁體,都依據《簡化字總表》規定的原則而類推簡化。而字表以外的字,不管其形體是否含有已經簡化了的繁體字形,都不再類推簡化。比如“驦、驌、鸘、鷫”四字收進了字表,依據類推簡化原則,將們分別簡化為“驦、驌、鸘、鷫”。與其相對的說法是“無限類推”,也就是某個字不管其現在是否使用,只要其形體含有已經簡化了的繁體字形,都類推簡化。比如“驡”現在基本不用,但因為“龍”簡化作“龍”、“馬”簡作“馬”,於是把“驡”類推簡作“龍+馬”。無限類推學術界不贊成,主管部門也已明確否定。
11.異體字:“異體字”是與“正體字”相對的概念。音義和使用功能相同而字形不同於正體字的漢字。例如,“峰-峯”、“凳-櫈”、“朵-朶”、“淚-涙”等字組中,後者皆為前者的異體字。嚴格意義上的異體字,其職能不由正體字承擔,是漢字的冗餘,給記憶帶來負擔,所以有必要限制其使用。
12.宋體字形:宋代刻版印書通行的字型。結構方正勻稱,橫細直粗,便於刻版,閱讀醒目,是16世紀以來漢字的主要印刷體。當前出版物上的常用字型,除宋體外(如:小),還有仿宋體(小)、楷體(小)、黑體(小)等。
13.《第一批異體字整理表》:1955年12月22日,文化部和中國文字改革委員會聯合發布的新中國第一個漢字規範,1956年2月1日起在全國實施。該表內列810組字,每組最少2個字,最多6個字,共1865字。根據從簡從俗的原則,從中選出810個作為正體,淘汰了1055個異體字。比如“櫓—艪艣樐”為一組具有正字與異體字關係的字,該表將“櫓”定為正字,“艪艣樐”是淘汰的異體字。該表發布後,不僅精簡了漢字的字數,而且有效地遏制了漢字使用中的字型混亂現象。
14.《印刷通用漢字字形表》:1955年,中國文字改革委員會提出進行漢字字模標準化工作,以統一印刷字型和手寫正楷體的筆畫結構,精簡偏旁部件的種類,確定漢字的標準字形,並把它作為書寫的規範和設計印刷、打字字模的標準,以利學習和使用。1956年9月,標準字形研究組編成了《標準字形方案(草案)》,1957年對該草案進行修改並更名為《漢字字形整理方案(草案)》,1959年初步定稿;1960年5月,在前表的基礎上又編成《通用漢字字形表草案》;1962年3月,文化部決定把整理字形的工作確定在印刷通用漢字的範圍內,並改名為《印刷通用漢字字形表》。
整理字形的原則是:①宋體楷化;②字形結構和筆勢儘量服從橫寫的需要;③折筆儘量改為直筆;④連結個別筆畫結構;⑤精簡偏旁的數量;⑥按讀音分化原有部件。1964年5月,字形整理組擬出《印刷通用漢字字形表》,1965年發布實施。收印刷通用漢字6196個,並給每個漢字規定了筆畫數、結構和筆順。經過對字形的調整和美化,進一步取得了宋體字筆形的一致,使字形更趨於規律性、系統性。
15.《簡化字總表》:1956年1月,國務院公布《漢字簡化方案》;1964年3月,中國文字改革委員會、文化部、教育部聯合發布《關於簡化字的聯合通知》,《總表》分成三個表。第一表所收的是352個不作偏旁用的簡化字。這些字的繁體一般都不用作別的字的偏旁。個別能作別的字的偏旁,也不依簡化字簡化。如“習”簡化作“習”,但“褶”不簡化作“衤+習”。第二表所收的是132個可作偏旁用的簡化字和14個簡化偏旁。第三表所收的是套用第二表的簡化字和簡化偏旁作為偏旁得出來的簡化字。1986年10月,國家語委經國務院批准重新發布了《簡化字總表》,並作了個別調整。調整後的《總表》,實收簡化字2235個。
16.《現代漢語常用字表》:1988年1月26日,國家語委、國家教委聯合發布,目的是為了適應語文教學及其他方面的需要。字表分常用字(2500字)和次常用字(1000字)兩個部分。選字原則是:①根據漢字的使用頻率,選取使用頻率高的字;②在使用頻率相同的情況下,選取學科分布廣、使用度高的字;③根據漢字的構字能力和構詞能力,選取構字能力和構詞能力強的字;④根據漢字的實際使用(語義功能)情況斟酌取捨。其後,國家教委頒布的基礎教育教學大綱規定基礎教育階段的識字量為3500字,完全等同於本字表。
17.《現代漢語通用字表》:國家語委、新聞出版署1988年3月25日發布。共收7000字,包括《現代漢語常用字表》的3500字。本表的制訂,主要依據1965年頒布的《印刷通用漢字字形表》。根據實際需要,刪去《印刷通用漢字字形表》中的50字,增收854字。同時,本表依據《印刷通用漢字字形表》確定的字形標準,規定了漢字的字形結構、筆畫數和筆順。其後,印刷通用漢字字形即以此表為準。
18.語料庫:套用計算機技術存儲語言材料的總匯。語料範圍可以是綜合的,也可以是專項的,如國家語委“現代漢語平衡語料庫”(收1919-2002年的語料9100萬漢字)。語料庫的容量大小和編制體例可根據需要設計,內容也可以及時更新補充。
19.《GB13000.1字元集漢字字序(筆畫序)規範》:GB13000.1字元集是指國家標準漢字編碼字元集,共20902個漢字。《GB13000.1字元集漢字字序(筆畫序)規範》由國家語委1999年10月1日發布、2000年1月1日實施,編號為GF3003-1999。它是按筆畫排序的漢字字序規範,主要用於漢字的信息處理、排序檢索、辭書編纂等方面。
20.歷史通用字形:即在歷史上已經通行的漢字。一般指《康熙字典》之後、特別是《中華大字典》(1915年)之後的字形。使用歷史通用字形的原則:字形要有歷史上使用過的依據;有多個字形可以採用時,要儘量選取通行度高、易於識別的字形。這個概念主要針對這種情況:如果文章中需要使用非常生僻的字,要使用歷史上已經通行的字形,不要生造新字或亂改字形(包括類推簡化),以免增加漢字的繁複程度。比如“壣”“蘹”未收入字表,如果寫作時確需使用,則不能將其簡化為“土+聯”“艹+懷”,也不能寫成其他新造形體,而要使用古書中所使用的原字形。