漢字排檢法
正文
對漢字單字或詞組進行排序,以便查檢的方法。又稱漢字檢字法。漢字排檢法除用於詞典、百科全書等工具書的編排外,還普遍用於字順目錄、索引以及文書、檔案中各種名稱等的排序。在印刷排版、電子計算機漢字信息處理等方面也具有重要作用。中國漢代以前尚未出現正規的檢字法。當時的字書均按漢字的意義排列。東漢許慎編著的《說文解字》首創部首檢字法。梁代顧野王編《玉篇》,遼代僧人行均編《龍龕手鑒》,北宋司馬光等編《類編》,金代韓孝彥編《四聲篇海》,明代梅膺祚編《字彙》,先後對部首法進行了改進。直至清代 《康熙字典》 以及近現代《中華大字典》、《辭源》、《辭海》等都以部首法作為主要檢字法。在部首查字法盛行時,人們又根據漢語的聲韻調關係編列排檢漢字,其中以三國魏李登的《聲類》為最早,當時的聲韻調都是用漢字來代替的。爾後又出現一種作為輔助部首檢字法的筆畫法,並在此基礎上產生依漢字起筆分類,以及將筆畫、筆形相結合的檢字法。 近代西方文化輸入中國後, 受西文字典及其排序方法的影響,曾出版了多種以羅馬字拼音編制的字典。20世紀20~30年代新檢字法蓬勃發展,先後出現了高夢旦的改良部首方案、林玉堂的漢字索引制、杜定友的漢字形位排檢法。沈祖榮和胡慶生的12種筆畫檢字法、王雲五的四角號碼法等。據蔣一前《中國檢字法沿革史略》統計,至1933年共有檢字法77種。1958年以後,由於漢語拼音方案公布,遂產生多種漢語拼音排檢法。1961年11月,由文化部、教育部、中國文字改革委員會、中國科學院語言研究所聯合組成漢字查字法整理工作組,於1964年4月提出4種標準草案推薦使用,即改良部首查字法、四角號碼查字法、 筆形查字法、 拼音字母查字法。80年代,漢字排檢法研究與電子計算機技術相結合,已研製出各種漢字信息處理方法及漢字編碼技術。漢字排檢法已有數百種,但多數因使用不便而被淘汰;即使較為通用的幾種也優劣並存,須在實踐中不斷完善。漢字排檢法可分為 3種類型:義序排檢法、形序排檢法和音序排檢法。
義序排檢法 是中國古代字書的一種編排法,它將漢字按字義歸類排比,《史籀》、《爾雅》、《小爾雅》、《方言》、《釋名》、《廣雅》等書皆用此法。由於漢字存在一字多義現象,義序排檢法一般不用作正規的排檢法。
形序排檢法 根據漢字形體結構進行分類排列的方法。主要有部首法、筆劃與筆順法、號碼法等。
部首法 部首是由分析概括漢字的偏旁 (漢字的組成部分)而確定的。《說文解字》將小篆9653字分為540個部首;部首之間依字形相近為次序,也兼取字義。例如,一、上、示、三、王、玉、珏。每個部首之中以字義間的聯繫為次序。例如玉部中,自“”以下皆玉名,自“璧”以下皆玉器,自“瑳”以下皆玉事。明代梅膺祚的《字彙》依宋代印刷書籍的字型,將部首歸併為214個。《康熙字典》、 《中華大字典》等都採用部首法。20世紀50年代以後出版的字典大都對部首的數量作了調整刪減,例如,《新華字典》為189個,《 現代漢語詞典》為188個,《辭源》1979年版為 250個,部首歸屬也由以往注重字義改為依形定部,一般採取字形的上、下、左、右、外等部位偏旁作部首。使用部首法必須首先分析字形結構,熟悉部首的位置,查出部首,再按部首以外的筆畫數查字。對其中較難確定部首的字,可查“部首目錄”或“難查字表”。
筆畫與筆順法 筆畫法又稱筆數法,是按漢字筆畫多少為排列順序,筆畫數少的在前,筆畫數多的在後;筆畫數相同的,再按每個漢字的筆形或部首排列。筆順法是按筆形順序確定漢字排列先後或以點(丶)、橫(一)、豎(丨)、撇(丿)為序,或以橫(一)、豎(丨)、點(丶)、 撇(丿)為序,或以橫(一)、豎(丨)、撇(丿)、點(丶)、折(乛)為序等等。筆畫法與筆順法一般相互結合使用,即先按筆畫數排列,然後再按筆順排列。
號碼法 它把漢字的各種筆形用號碼錶示,再按各個漢字代號的大小順序編排。主要有四角號碼法、中國字庋法、起筆筆形法、起筆末筆法。近年來又出現了三角號碼法和五碼檢字法。其中採用四角號碼法較為普遍。四角號碼法是根據漢字方塊形狀的特點,以漢字字角的各種筆形配一個阿拉伯數字代號,其口訣為:橫 1,垂2,3點捺,叉4,串5,方框6,角7,八8,小是9,點下有橫變 0頭。代號按“左上角-右上角-左下角-右下角”的次序組合,然後按號碼大小依次編排。四角號碼法原稱“四角號碼查字法”,最早發表於 1926年3月出版的《東方雜誌》,兩年後又出版了“第二次改訂四角號碼檢索法”,兩次均以王雲五名義發表。該檢字法經中國文字改革委員會漢字查字法整理工作組的若干修改, 公布了新的 “四角號碼查字法”(草案)。1977年出版的《四角號碼新詞典》(修訂重排本)即以新法編排,致使四角號碼法有新法、舊法之分。四角號碼法曾在多種文史工具書中採用。
中國字庋法 是1931年由哈佛-燕京學社引得編纂處負責人洪業所創。將“庋”兩字拆散為10種筆形,各配以阿拉伯數字(0~9)號碼,再按“中國字庋”5個字的形體,分別以“1~5”數碼代表。檢查時,須先辨字形,再定取號的次序。此法僅在哈佛-燕京學社所編64種索引中使用。
起筆筆形法 將漢字起筆筆形分為5 種,每種筆形以1個號碼代替。即橫(一)為“1”, 豎(丨)為“2”,點(丶)為“3”,撇(丿)為“4”,折(乛)為 “5”。確定起筆的原則是先上後下,先左後右,先外後內,先中間後左右(如“小”、“水”、“幽”)。此法最多只取 5個字即5位數,作為書名的排檢方法。此法曾被《全國總書目》、《古今人物別名索引》採用。
起筆末筆法 將筆形分為5種。即橫(一) 為“1”,豎(丨)為“2”,點(丶)為“3”,撇 (丿)為“4”,折(乛) 為“5”。以第一個字的筆形取號,依各個筆畫筆順號碼為序。例如, “ 中”為 “2512”, “ 國” 為“25112131”。此法為《漢字屬性字典》(1987)所採用。
音序排檢法 按字音排檢漢字的方法。主要有韻部順序法、注音字母順序法和漢語拼音字母順序法等。
韻部順序法 是古代按音排列漢字的一種方法。漢字字音都是單音節,每個音節都由聲、韻、調組成。把韻母相同的字集中排列在一起就構成一個韻部。韻部順序大體可分為 3種:第一種,按漢字平、上、去、入四聲分類,同一聲調下再分韻部,韻部之內再按同聲字分類編排,例如《廣韻》(宋陳彭年等修訂)。現存韻書大都按這種方法編排,即“以聲為綱,以韻目為經”分列韻部。第二種,先分韻部,韻內分聲調,聲調內再按同聲字分類編排,如《中原音韻》(元周德清著)。第三種,先分韻部,韻內分同聲字,同聲字內再按四聲分別編排,例如《韻略易通》(明蘭茂著)。
注音字母順序法 注音字母是以北京語音為標準的一套字母。從20世紀30年代到《漢語拼音方案》(1958)公布之前,音序排檢法大都按注音順序排列。它的排列順序是先聲母,後韻母,韻母的ㄧ,ㄨ、ㄩ依1931年公布的國音字母表, 列於兒韻之後。 聲母從ㄅ(b)ㄆ(p)、ㄇ(m)、ㄈ(f)、 ㄉ(d)、ㄊ(t)、ㄋ(n)、ㄌ(l)、ㄍ(g)、ㄎ(k)、 ㄏ(h)、 ㄐ(j)、ㄑ(q)、ㄒ(x)、 ㄓ(zh)、ㄔ(ch)、ㄕ(sh)、ㄖ(r)、ㄗ(z)、ㄘ(c)、ㄙ(s)。韻母從ㄚ(a)、ㄜ(e)、ㄞ(ai)、ㄟ(ei)、ㄠ(ao)、ㄡ(ou)、ㄢ(an) 、ㄣ(en)、 ㄤ(ang)、ㄑ(eng)、 ㄦ(er)、ㄧ(i)、ㄨ(u)、ㄩ(ü)。聲母與韻母拼合注音時,按音序先後排列。 如“八”(ㄅㄚ) “撥”(ㄅㄊ)、“爬”(ㄆㄚ)、“坡”(ㄆㄛ)。同聲同韻的字母再按陰平、陽平、上聲、去聲四聲排列。如ㄌī哩、ㄌí離、ㄌǐ李、ㄌì立。
漢語拼音字母排列法 按1958年公布的《漢語拼音方案》字母表的順序排列漢字的。 在26個字母中除I、U、V三個字母外,共23個部。每個漢字排列時先以聲母與韻母所拼寫的音節為序:如啊(a)、哀(ai)、班(ban)、國(guo)、祖(zu)。位元組相同、按聲調的陰平 (├)、陽平(′)、上聲(ˇ)、去聲(`) 順次排列。如巴(bā)、拔(bá)、把(bǎ)、爸(bà)。位元組聲調都相同再按漢字的筆畫筆形排列。例如“拉、拉、啦、邋”。漢語拼音字母排列法也可以用漢字所組成詞語的音序進行排列。例如:mianhua(棉花)、mianhuahaichong(棉花害蟲)、mianhuai(棉槐)、mianhuajiagong(棉花加工)、mianhuashouhuoji(棉花收穫機)……。《漢語主題詞表》(1979)、《現代漢語詞典》(1984)等工具書都採取這一排列法。