西夏文字處理系統

在西夏文還沒有實現電腦錄入與輸出時,要想發表一篇有西夏文內容的文章很困難,只能用手寫照相排版,或在有西夏文的地方留出空格,將西夏文粘上去再照相製版。所以,當計算機被運用於文字處理時起,人們也就自然想到了西夏文數位化問題。 西夏文字處理系統是以萬能輸入法為平台而開發的西夏文字處理系統。目前,較完整的西夏文字元集共有八九套,有科研機構開發研製的,也有電腦公司研製的,還有個人或學術團隊開發研製的,以及純自己使用的。

基本信息

主 編:景永時(北方民族大學 西夏研究所)

副主編:賈常業(寧夏社會科學院 歷史所)

系統簡介

西夏文數位化概述

在西夏文還沒有實現電腦錄入與輸出時,要想發表一篇有西夏文內容的文章很困難,只能用手寫照相排版,或在有西夏文的地方留出空格,將西夏文粘上去再照相製版。一篇文章尚且如此費時費力,更不要說出版一部西夏文字方面的圖書了。李範文先生的《夏漢字典》(1997年版)僅排版、剪貼西夏文就耗費了3年零3個月的時間。因而,許多西夏研究者只能減少文章中的西夏文數量或是省去西夏文直接寫出漢譯文,要不然就用讀音字元代替。這樣做雖然減輕了難度,也是不得已而為之。從學術研究的角度看,這種做法也削弱了發表研究成果的科學性和可讀性。所以,當計算機被運用於文字處理時起,人們也就自然想到了西夏文數位化問題。

20 世紀80 年代末,荷蘭萊頓大學的藏緬語言學家范德利姆(George van Driem)與俄羅斯科學院聖彼得堡東方研究所的西夏語言學家克平(Ксения. Болисовна Кепинг)嘗試用計算機處理西夏文。不過,工作在兩年後就由於技術上的原因而中輟了。寧夏社會科學院的科研人員在20世紀90年代初試圖製作電腦西夏文字元,也因技術水平等問題而未能完成。20世紀90年代中期,電腦技術在全世界範圍內取得了極大的進展,其速度之快是令人始料不及的。由於各種字元製作工具軟體的問世,使當年難以實現的字元製作問題變得不再神秘,只要經過簡單的學習,即使是非計算機專業人員也不難在短時間內製作出一套滿足自己需求的特殊字元來,所以在世界上陸續出現了多種西夏文字元集。目前,較完整的西夏文字元集共有八九套,有科研機構開發研製的,也有電腦公司研製的,還有個人或學術團隊開發研製的,以及純自己使用的。

系統的開發與簡介

2005年,時在寧夏社會科學院的景永時主持研製成《基於北大方正典碼之上的西夏文字錄入系統》(香港社會科學出版社,2005年),該系統借用漢字GB2312楷體筆畫製作成西夏文字元集。該套字元是目前所有西夏文字元集中字形最準確、收字最多者。由於這個字元集從一開始就是以研製供公眾使用為目標,所以該套字元在準確性方面優於其他字元集,又因兼容性較好,故被廣泛使用於電腦寫作和書刊的排版印刷。國內一些西夏學者評價這套西夏文錄入系統“推動了西夏學科有了質的飛速發展”。這套軟體已經成為國內科研人員電腦寫作中錄入西夏文普遍採用的軟體,國外學者也有不少人在使用,是目前國內外套用最為廣泛、操作最為簡便、最具科學性的西夏文字處理系統。寧夏乃至全國,近年來的眾多西夏學研究成果,諸如再版的《夏漢字典》和與其他西夏文相關著作的出版,《寧夏社會社會科學》、《西夏學》、《西夏研究》等學術期刊的排版等等,無不受益於《西夏文處理系統》這套軟體。

2007年,景永時主持研製的西夏文字元集,被國際標準組織和國際電工委員會(ISO/IEC)所屬專業組織選定為《信息技術通用多八位編碼字元集(UCS)》(中國國家標準號為GB13000)之西夏文編碼字元集,從而取代了此前由美國學者用日本文字境研究會製作的西夏文字元集的提案,避免了中國少數民族文字字元採用外國人製作的字元編碼的尷尬。

西夏文字處理系統是以萬能輸入法為平台而開發的西夏文字處理系統。通過這個系統,用戶可以在掌握西夏文字字形結構規律的基礎上,在電腦上錄入、列印及輸出西夏字。本系統的西夏文編碼採用的是李範文先生所創的四角號碼編碼方案,這種方法簡便易學,用戶可在較短時間內掌握。該系統兼容性強,凡是Windows95∕98∕XP∕7∕Vista皆可安裝使用。本系統《使用手冊》提供西夏文錄入碼檢索,並附有漢文對譯及索引,可以滿足西夏文錄入碼檢索和夏—漢字義互檢,實為簡明夏漢字典。

系統升級及最新進展

這套系統到目前已經升級兩次,可以在WindowsXP和Windows7等作業系統中自如套用。正在實施的國家十二五新聞出版重大科技工程——“中華字型檔”工程第18包“少數民族古文字的蒐集整理與字型檔製作”課題中,景永時教師承擔“西夏文字的蒐集整理與字型檔製作”子課題。隨著該工程項目的實施完成,將會有新的更加準確、更加優美的西夏文字元誕生。

相關搜尋

熱門詞條

聯絡我們