漢文
正文
漢字是中國人發明的形意文字書寫系統(也稱中文)。漢字亦名列世上最古老、並惟一流傳至今的形意文字,推估可追溯至4,000年以上。漢字也被日文與朝鮮文,以及古代越南文等東亞多國語言使用。
由於表意文字特性,讓漢字可以跨語言使用,曾長期成為東亞地區交流惟一文字。今可略分為簡體中文與繁體中文兩個系統。前者用於中國大陸地區,馬來西亞與新加坡以及東南亞華人社區;後者用於台灣、香港、澳門和北美的華人圈中。另外,日本及韓國皆有其公布之官訂漢字表。
根據2005年世界主要語言實力調查報告,漢語排名世界第二。如今,中國在國外推廣漢語的“孔子學院”發展很快。有訊息稱,2008年後聯合國採用的中文將一律是簡體中文。簡體中文全面取代繁體中文作為惟一的中文交流文字將是一個不可逆轉的趨勢;繁體中文將定位於傳統文化或藝術的層面保留下來。如今,簡繁之爭成為文化界的一個熱點,民眾反映也不一而同,但持簡體中文是一種進步的觀點占絕大多數。
歷史
漢字是世界上最古老的三大文字系統之一。其中,古埃及的聖書字、兩河流域蘇美爾人的楔形文字已經失傳,僅有中國的漢字沿用至今。
傳說中,漢字起源於倉頡造字。黃帝的史官倉頡根據日月形狀、鳥獸足印創造了漢字,造字時天地震驚——“而天雨粟,鬼夜哭”。從歷史角度來看,複雜的漢字系統不可能由一個人發明,倉頡更可能在漢字的蒐集、整理、統一上做出了突出貢獻,所以《荀子·解蔽》中記載“好書者眾矣,而倉頡獨傳者,一也”。
有觀點認為《周易》中的八卦對漢字形成有較大影響,但支持者甚少。
原始文字
文字發明前的口頭知識在傳播和積累中有明顯缺點,原始人類使用了結繩、刻契、圖畫的方法輔助記事,後來用特徵圖形來簡化、取代圖畫。當圖形符號簡化到一定程度,並形成與語言的特定對應時,原始文字形成。
1994年,湖北楊家灣大溪文化遺址出土了大量陶器,其上170多種符號中,部分特徵與甲骨文有較大類似之處。這一發現將原始漢字的形成過程推定到距今6000年以前。此外,山東大汶口出土的陶器上的象形符號,西安半坡彩陶上的幾何符號,河南賈湖距今8000年前龜甲上的幾何符號賈湖契刻符號等,都可能是原始文字形成中(或形成前)不同階段的表現。
但是,商朝以後的漢字和這些幾何符號是否一脈相承?這個問題還在爭議中。許多學者提出,這些符號不一定是漢字的前身,甚至不能絕對肯定是文字元號。
從象形到表意
從甲骨文(右圖)到小篆,漢字經歷了從象形文字到意音文字的發展過程,字形逐步脫離事物的具體形象。這一時期的漢字稱為古文字。
商周時期的甲骨文已經是一種比較完整的文字型系。在已發現的4500多個甲骨文單字中,目前已能認出近2000字。與甲骨文同期,青銅器上鑄造的文字稱為金文或鐘鼎文,西周時期的《散氏盤》、《毛公鼎》具備很高的史料和藝術價值。
秦始皇統一中國後,李斯在大篆和六國古文的基礎上,進行規範和整理,制定出了小篆作為秦朝的標準書寫字型,統一了中國的文字。小篆呈長方形,筆畫圓潤流暢。
小篆解決了各國文字間出現大量異體字的情況,“書同文”的歷史從此開始。文字的統一有力促進了民族間文化傳播,對中華民族的認同和中國的統一發揮了重要作用,為世界文字史所罕見。
漢字的發展經歷了許多不同的演變。初期漢字系統的字數很少,大量事物以通假字表示,使文字表述存在較大歧義。為可以更精準的表述,以及因應隨歷史發展不斷增加的新事務,就以字根組合的方式,來細化組出大量的字出來,使得文書上可以可記載的越來越精密。例如說,最早海上的交通工具就只有:“舟”一種;但演化到現在,除了舟以外,還有“舨、艇、船、艦”等不同小大規模與形制的“舟”,這使得記載為文時,只要看一個字,我們就知道指的是那一種“舟”,這樣辨識理解的效率非常高;反過來,以組詞的方式就還要看過前後文(或短或常)才能判斷正確的意義,較缺乏辨識效率,但方便口語溝通(漢字同音字太多,聽覺不易辨識,解法一為組詞,二為如韓日語數音為一字:“浬”發音為海里)。
造字
在秦始皇統一漢字後,漢字的數量應時代需要不斷地增加,新造的字不斷出現:
* 隋文帝楊堅原為隨國公,但因“隨”字的“辶”有不穩定之意,故去掉“辶”,而造“隋”字作為國號。
* 唐朝時,武則天根據“日月當空”之意而造字“曌”(同“照”字)作為她的名字。同時發明的文字還包括圀、曌、瞾、囝、埊、玍、缶等。人稱則天文字。
* 五代劉岩取“飛龍在天”之意創了自己名字內的“”字。
在近代,由於大量西方知識的湧入,也造了許多字。例如隨著“Beer”傳入中國,如何用漢字表達是一個問題,最初譯為皮酒,後覺不妥,於1910年左右創造了“啤”字——譯為“啤酒”。為了表示英制的單位,還造了一些多音節的字,如浬(海里)、嗧(加侖)、瓩(千瓦)、呎(英尺)等。不過這些多音節的字在1977年7月20日中國文字改革委員會和國家標準計量局發出《關於部分計量單位名稱統一用字的通知》中被淘汰,在大陸地區已不再使用,但港、澳、台等地仍可見到部份此類漢字。
現代漢字形成
小篆筆畫以曲線為主,後來逐步變得直線特徵較多、更容易書寫。到漢代,隸書取代小篆成為主要書體。隸書的出現,奠定了現代漢字字形結構的基礎,成為古今文字的分水嶺。
漢代以後,漢字的書寫方式逐步從木簡和竹簡,發展到到在帛、紙上的毛筆書寫。草書、楷書、行書等字型迅速出現,不僅滿足了公文和日常需要,還形成了濃郁東方特色的書法藝術。古代印刷術發明後,出現了用於印刷的新字形宋體,在現代又陸續出現了黑體、仿宋體等字形。
漢字的語文知識
造字原理
六書是漢字組字的基本原理,在周禮中就有提到了六書,只是沒有說明具體內容。到了東漢,許慎在《說文解字》中,詳細闡述了“六書”這個漢字構造原理:象形、指事、會意、形聲、轉注、假借。
象形
這種造字法是依照物體的外貌特徵來描繪出來,所謂畫成其物,隨體詰詘是也。如日、月、山、水等四個字,最早就是描繪日、月、山、水之圖案,後來逐漸演化變成現在的造型。
指事
這是指表現抽象事情的方法,所謂“各指其事以為之”是也。如卜在其上寫作“上”,人在其下寫作“下”。
形聲
此乃文字內以特定形狀(字根)表特有的音。例如:胡,這個字也可為一個字根,結合不同的屬性字根,可合成為:蝴、蝴、湖、葫、瑚、醐等等,而以同樣的發音(也有的只有聲母一樣),表達不同的事物。但形聲字,也因古今語言音韻變遷,不少古代同類形聲字在今天的官話已無共同音素了。
會意
這個造字法,是將兩個字根組合起來,使衍生出新的含意。如“日”和“月”組起來,就是日光加月光變成“明”。“人”字和“言”字合成“信”字,意思就是人過去所言;有信,就是這個人都很遵守自己說過的話。
轉注
這是用於兩個字互為注釋,彼此同義而不同形,漢代許慎解釋道:“建類一首,同意相受,考、老是也。”,這怎么說呢?此二字,古時“考”可作“長壽”講,“老”、“考”相通,意義一致,即所謂老者考也,考者老也。詩經的《大雅·棫樸》亦云:“周王壽考。”。蘇軾的《屈原塔詩》也有古人誰不死,何必較考折。一語。其中的““考”皆“老”意,特別注意的是,後代的文字學家針對許慎的前述的定義也作了大量的解釋。其中包括“形轉說、聲轉說、義轉說”三類,只是這三種說法有人認為不夠全面,當代古文字家林沄先生也有解釋說“轉注”就是一個形體(字根)記錄兩個讀音和意義完全不同的兩個詞。例如“帚和婦”與甲骨文中的 “母和女”等等。
假借
這法簡言之,借用一字,去表達別的事物。一般來說,是有一個無法描述的新事物,就借用一個發音接近或是屬性近似的字根,來表達這個新事物。例如: “又”,本來是指右手(最早可見於甲骨文),但後來被假借當作“也是”的意思。聞,本意是用耳朵聽東西的意思。例如《大學·第七章》中有“視而不見,聽而不聞,食而不知其味”,但後來被假借成嗅覺的動詞(不過也有人認為這是錯用)。
總結以上六書,前兩項,“造字法”也;中兩項,“組字法”也;後兩項,“用字法”也。這六個原理,是古代文字學學者歸納出來的字學理論。其所含漢字構成法則,是長期演化而成的,不是任何一個人獨創的。
漢字的結構
漢字由一個或以上的字根以二維方式(歐語系是一維文字)在特定的空間、配置在一個正方塊內而組成,因此有方塊字的別稱,從結構上來看,漢字有以下特色:
1. 單一字內就有很高的信息密度,在表達同樣的事物時,可比表音文字用更短的篇幅表達同樣的訊息,所以漢字的閱讀效率很高。
2. 一個漢字乃由四百多個表意象形字母為基本字根,如金、木、水、火、土等,像積木一樣組合而成。
3. 一個未知文字的含意,可拆字,從組成字根以及空間的配置推斷出其字義。當時代演進出現新事物難以詞的方式來表達時,也能以字根組合原則,合成出新字來用,例如中文的鈾字,就是近代為了表現一種新發現的化學元素而新造的字。
4. 漢字組成的字根空間配置對字義有影響:如同樣是“心跟亡”的合體,左右排是“忙”,上下排是“忘”,排列不同,導致不同含義;文字右邊有“乂”這個字的部件,這表示右手(手的左偏旁表示左手)持某物對左邊字根作某事(金文、甲骨文考古的發現),如果右手上面拿東西就變成“攵”,有這個字根的,幾乎都是攻擊性或是用暴力達成某件事,例如攻、敗、敲、收、散、政、牧、敕等等。
字形(漢字書法)
漢字有各種不同的書寫方式,即有不同的字型;不同的字型,漢字的字形不一樣。
規整的字型(如楷書、宋體、隸書、篆書等)書寫下的漢字是一種方塊字,每個字占據同樣的空間。漢字包括獨體字和合體字,獨體字不能分割,如“文”、“中”等;合體字由基礎部件組合構成,占了漢字的 90%以上。合體字的常見組合方式有:上下結構,如“筆”、“塵”;左右結構,如“詞”、“科”;半包圍結構,如“同”、“趨”;全包圍結構,如“團”、 “回”;複合結構,如“贏”、“斑”等。漢字的基礎部件包括獨體字、偏旁部首和其他不成字部件。
漢字的最小構成單位是筆畫。
書寫漢字時,筆畫的走向和出現的先後次序,即“筆順”,是比較固定的。基本規則是,先橫後豎,先撇後捺,從上到下,從左到右,先外後內,先外後內再封口,先中間後兩邊。不同書寫體漢字的筆順可能有所差異。
讀音
漢字是多種方言的共同書寫體系,每個字代表一個音節。中國大陸現今以國語作為標準讀音,國語的音節由一個聲母、一個韻母及聲調確定,實際用到1300多個音節。由於漢字數目龐大,因而有明顯的同音字現象;同時還有同一字多音的情形,稱為多音字。這一情況在各種漢語中是普遍存在的。
漢字雖然以表意為主,但並非沒有表音成分,最常見的是人名、地名,其次就是外來詞的音譯,比如沙發。此外,還有部分原有的表音詞,如(一命)“嗚呼”、“哈哈”大笑等。但即使如此,還是有一定表意成分,特別是該國國內的人名、地名。而即使是國外的人名、地名,也存在某些表意的底線,比如“Bush”絕不能音譯成“不死”。
由於漢字本身不表音,自漢朝到20世紀漢字在數量上、寫法上雖有變遷,但無法看出發音的變化。必須進行專門的研究才能推測它們在上古漢語和中古漢語的發音。 有學者經研究認為:漢朝之前,一個漢字發音為兩個音節,次要音節和主要音節,類似今日的韓、日語。詳見上古漢語。
漢字在日語中的讀音有“音讀”和“訓讀”之分,往往一個字有很多讀法,原因來自中國不同時期傳入日本的發音。
在朝鮮語中則大致為一字一音,沒有訓讀。
除了日本以外,其他漢字使用國也有使用了一些多音節的字,如“浬”(海里)、“嗧”(加侖)、“瓩”(千瓦)等。但是在大陸地區由於官方廢除已基本不使用,台灣仍在使用,一般人也明了其意思。
注音
最早的注音方法是讀若法和直注法。讀若法就是用音近的字來注音,許慎的說文解字就採用這種注音方法,如“埻,射臬也,讀若準”。 直注法就是用另一個漢字來表明這個漢字的讀音,如“女為說己者容”中,使用“說者曰悅”來進行注音。
以上兩種方法都有先天上不完善的地方,有些字沒有同音字或是同音字過於冷僻,這就難以起到注音的作用,例如“襪音韈”等。
魏晉時期發展出了反切法,據傳是受使用拼音文字的梵文影響。漢字的發音可以通過反切法進行標註,即用第一個字的聲母和第二個字的韻母和聲調合拼來注音,使得所有漢字發音都有可能組合出來。如“練,朗甸切”,即“練”的發音是“朗”的聲母與“甸”的漢字形式的注音符號(俗稱ㄅㄆㄇㄈ)以及很多拉丁字母注音方法。注音符號仍是台灣教學的一部分,而目前中國大陸最為廣泛使用的是漢語拼音。
由於漢字以本身表義為主,注音方面較為薄弱。這個特性使得上下千年的文獻,不至於產生如同使用拼音文字的西方世界一樣,用字措辭太懸殊的差距,但也造成推斷古代聲韻的難度。例如“龐”從“龍”而得聲,但今日北京話前者讀“páng”,後者為“lóng”。如何解釋這樣的差異,就是音韻學所探討的課題。
漢字與詞語
漢字是漢文組成的最小單位。
語素是漢文表意的最小單位,類比於英語的“辭彙”和“詞組”的總稱。絕大多數漢字可以獨立構成語素,比如“我”,類比於英語中的單一字母構成的辭彙,比如 “I”。現經白話文大多數詞語都是由兩個以上的漢字構成的,不過,和英語中“辭彙”和“字母”的關係不同,語素的意思往往和其中各個漢字獨立構成語素時的意思有相關性,因此相當程度上簡化了記憶。
詞語包括語素和若干個語素形成的短語。
漢字的高效率,體現在幾百個基本象形字,可以合成表示天上地下的各種事物的上萬漢字;幾千個常用字,又可以輕鬆組合出數十萬詞語。
不過,從另一方面來說,準確掌握這數十萬詞語的搭配形式和用法也成了一種負擔。漢語常用辭彙約為幾萬條,總辭彙量約有百萬條,雖然從數量上來說顯得有些令人望而卻步,但由於大多數漢字構詞法的表意性,要基本掌握並非遙不可及。因此,僅就辭彙而言,其學習難度並不高;相比之下,掌握同樣數量外文辭彙的記憶強度則要大得多。
而從古文的角度來看,用字本義,比起五四白話文運動以降過度依賴詞語,會來的精確且有效率,例如朱邦復先生就提暢精確使用漢字的復古作為。
漢字的數量
漢字的數量並沒有準確數字,日常所使用的漢字約為幾千字。據統計,1000個常用字能覆蓋約92%的書面資料,2000字可覆蓋98%以上,3000字時已到99%,簡體與繁體的統計結果相差不大。
歷史上出現過的漢字總數有8萬多(也有6萬多的說法),其中多數為異體字和罕用字。絕大多數異體字和罕用字已自然消亡或被規範掉,除古文之外一般只在人名、地名中偶爾出現。此外,繼第一批簡化字後,還有一批“二簡字”,已被廢除,但仍有少數字在社會上流行。
漢字數量的首次統計是漢朝許慎在《說文解字》中進行的,共收錄9353字。其後,南朝時顧野王所撰的《玉篇》據記載共收16917字,在此基礎上修訂的《大廣益會玉篇》則據說有22726字。此後收字較多的是宋朝官修的《類篇》,收字31319個;另一部宋朝官修的《集韻》中收字53525個,曾經是收字最多的一部書。
另外有些字典收字也較多,如清朝的《康熙字典》收字47035個;日本的《大漢和字典》收字48902個,另有附錄1062個;台灣的《中文大字典》收字49905個;《漢語大字典》收字54678個。20世紀已出版的字數最多的是《中華字海》,收字85000個。
初期的漢字系統字數不足,很多事物以通假字表示,使文字的表述存在較大歧義。為完善表述的明確性,漢字經歷了逐步複雜、字數大量增加的階段。漢字數量的過度增加又引發了漢字學習的困難,單一漢字能表示的意義有限,於是有許多單一的漢語意義是用漢語詞語表示,例如常見的雙字詞。目前漢語書寫的發展多朝向造新詞而非造新字。
漢字的影響
衍生字
漢字書寫體系也是世界上最主要的源文字之一,在漢字的影響下,還產生過契丹文、女真文、西夏文、古壯字(方塊壯字)、古白字(方塊白字)、古布依字(方塊布依字)、字喃等文字。但它們都因各種原因而消亡,而漢語中的女書,如今也無幾人能識。日語的假名(仮名)在創製時也在很大程度上受到漢字字形的影響。
此外如蒙古文、滿文、錫伯文等也是在漢字書寫方式和書寫工具的影響下,將從右向左書寫的源自阿拉米文字的書寫方式改為從上到下書寫,文字的結構也隨之有所變化。
漢字文化圈
漢字是承載文化的重要工具,目前留有大量用漢字書寫的典籍。不同的方言、甚至語言都使用漢字作為共同書寫體系。在古代日本、朝鮮和越南,漢字都曾是該國正式文書的唯一系統,因而漢字在歷史上對文明的傳播分享有著重要作用。
由於漢字和發聲的聯繫不是非常密切,比較容易被其他民族所借用,如日本、朝鮮半島和越南都曾經有過不會說漢語,單純用漢字書寫的歷史階段。漢字的這個特點對於維繫一個統一的漢族——一個充滿各種互相不能交流的方言群體的民族——起了主要的作用。
漢字對周邊國家的文化產生過巨大的影響,形成了一個共同使用漢字的漢字文化圈,在日本、越南和朝鮮半島,漢字被融合成它們語言的文字“漢字(かんじ)”、“漢字(한자)”、“漢字(hán tự)”。直到現在,日語中仍然把漢字認為是們書寫體系的一部分。在朝鮮和越南,已經完全不再使用漢字;在韓國,漢字的使用在近幾十年來越來越多。但是由於朝鮮語/韓語中使用了大量的漢字辭彙,並且重音現象嚴重,所以在需要嚴謹表達的場合時仍然會使用漢字。雖然在通常情況下人名、公司機構名稱等均使用韓文書寫,不過大多數的人名、公司機構均有其對應的漢字名稱。
日本
漢字於公元3世紀經朝鮮半島輾轉傳入日本。二戰後日本開始限制漢字的數量和使用,頒布了《當用漢字表》及《人名用字表》等,其中簡化了部分漢字(日本新字型),不過文學創作使用的漢字,並不在限制之列。日本除從中文中傳入的漢字外,還創造和簡化了一些漢字,如“辻”(十字路口)、“栃”、“峠”(山路)和“広”(廣)、“転”(轉)、“働”(勞動)等。詳見:日文漢字。
朝鮮半島
公元3世紀左右,漢字傳入了朝鮮半島,朝鮮語/韓語曾經完全使用漢字來書寫。1444年,朝鮮世宗大王頒布《訓民正音》,發明了諺文與漢字一起使用。現在的大韓民國雖禁止在正式場合下使用漢字,並停止了在中國小中教授漢字,不過漢字在民間仍在繼續使用,且可以按照個人習慣書寫,但是現在能寫一筆漂亮漢字的韓國人越來越少。朝鮮民主主義人民共和國於1948年廢除了漢字,僅保留了十幾個漢字。詳見:韓文漢字。
越南
公元1世紀漢字便傳入了越南,越南語也曾完全使用漢字做為書寫用文字,並在漢字的基礎上創造了字喃,但是由於書寫不便,漢字仍是主要的書寫方式。1945年越南民主共和國成立後廢除了漢字,使用了稱為“國語字”的拼音文字。現在的越南文已經看不出漢字的痕跡了。詳見:喃字、儒字(字儒)
漢字民俗
射虎:就是猜燈謎,也叫打燈虎,與漢字有著密切關係。舊時的射虎??格複雜多樣謎底多為四書五經中的原句;一類是市井燈謎,謎面謎底均很通俗。射虎是元宵節的一項重要活動。
合體字:中國民間常將一些帶有吉祥含義的短語合寫為一個字,以祈求吉祥,常見的合體字如“招財進寶”、“雙喜”等。
諧音字:華人喜歡利用漢字的同音特點用諧音字取吉祥之意,比如蝙蝠的“蝠”諧音為幸福的“福”,走獸的“獸”諧音為長壽的“壽”。
九九消寒圖:中國北方地區的一項民俗在每年數九的季節寫下“庭前垂柳珍重待春風”九個雙鉤字,這九個字每字九劃,從冬至開始每天根據天氣為一個筆畫填充顏色,到數九結束完成全圖。
花鳥字:一些民間藝人用一些花卉和禽鳥的圖案拼寫成漢字,近看細節是一些花鳥畫,遠看整體卻是一幅字,這種字畫結合的藝術形式被稱作花鳥字,是一種多彩花鳥蟲魚組合書法。在中國,只有在春節廟會中,和一些節日集會中才可以看到。花鳥字在英美等西方國家也成為一種街頭藝術。早期的鳥字畫大多寫的是一些吉祥話語,以祈求吉利,現在在廟會見到的鳥字畫則以書寫顧客的姓名為主,購買者的目的也由祈求吉祥逐漸轉變為獵奇。
漢字藝術
漢字獨特優美的結構,書寫的主要工具——毛筆有多樣的表現力,因而產生了中文獨特的造型藝術——書法。而篆刻是和書法相關的藝術,用刀在石材上雕刻出篆字作為印章。
永字八法
漢字的發展
文字本身發展
組字
漢字歷史上是不斷在組新字的,目前所見的各種漢字必非一口氣完成在某一年代,而是應時代需要漸漸發展成今的面貌。例如:“人”這個字商朝就有了,凹凸這二字則是在唐朝的時候才出現。
此外不同的行業有不同的用字需求因而組字。
組字往往比組詞在表意上更有效率,但組字組得太複雜又適逢變成常用字的話,就會衍生簡化的努力。
簡化
漢字書寫複雜;傳統印刷更複雜。所以自古以來就已經有許多的簡字,但多半是人民私下使用,正式的文書仍然是用正體字,而雖然活版印刷是中國人發明的,但由於漢字的結構特性,活版印刷幫助有限。
近代,處於強勢地位的西方文明開始進入東亞,整個漢字文化圈的各個國家中紛紛掀起了學習西方的思潮。當中有人堅持漢字的傳統,但亦有不少人鼓吹放棄使用漢字。這些鼓吹放棄漢字運動的立論“漢字落後論”,內容為:跟西方拼音文字相比,漢字是繁瑣笨拙的,因為漢字不能透過打字機書寫,而必須使用巨型的排版房的鉛字,也就是說漢字已成為教育及信息化上的瓶頸。就此,許多使用漢字國家以政治推行的方式,進行了不同程度的漢字簡化,甚至還有完全拼音化的嘗試。日本的完全使用假名方案以及漢語多種拼音方案的出現都是基於這種思想。
中華人民共和國1956年1月28日發布《漢字簡化方案》,1964年5月審定通過《簡化字總表》,1986年經少量修訂後重新發表,一直在中國大陸使用至今。1977年,曾公布《第二批漢字簡化方案(草案)》,發布“二簡字”,試用一段時間(約八年)後因為字形過於簡單且混亂而於1986年正式宣布廢除。新加坡和馬來西亞分別發布了同《簡化字總表》相同的簡化字表。
日文、朝鮮文也有各自的漢字簡化。
拉丁化
近四百年來,西方人和華人本身都提出了很多漢字的拉丁化方案,主要包括:
* 威妥瑪拼音(1867年)
* 郵政式拼音(1906年)
* 國語羅馬字(1928年)
* 北方話拉丁化新文字(1931年)
* 漢語拼音方案(1958年)
* 粵語拼音(1993年)
* 通用拼音(1998年)
現在,漢語拼音方案是使用最廣且被聯合國接受的漢字拉丁化方案。
異體字整理
除了造字以外,另外還有許多異體字。他們是意義和讀音完全相同,但寫法不同的字。有的是因為歷史緣故,有的是名人造字,如“和”與“龢”,“秋”與“秌”和“龝”等。
中國大陸於1956年公布整理異體字表,廢除了大量異體字,但後來因為各種原因恢復了部份異體字。如“於”曾被當作“於”的異體字廢除掉,但在1988年發表的《現代漢語通用字表》中又恢復成為規範??,不同地區對異體字的取捨有所不同,例如:韓國就以漢字各種異體字中最早出現的樣式為標準寫法。所以,在韓語漢字的標準中,取“甛”而不取“甜”、取“幇”而不取“幫”、取“畵”而不取“畫”。
在香港和台灣地區,也有所謂的異體字,例如“臺”與“台”、“體”與“體”以及“櫃”與“櫃”等等。
計算機處理
主條目:中文信息處理
由於打字機鍵盤在設計時本身沒有考慮漢字輸入的問題,輸入漢字往往比輸入拼音文字困難。漢字沒有經過中文打字機的普及,直接進入了電腦中文信息處理階段。在電腦發明初期曾引起漢字能否適應電腦時代的問題,支持漢字拉丁化的學者甚至以此為理據。
隨著各種中文輸入法的出現,漢字的計算機輸入、存儲、輸出技術得到了基本解決,大大提高了中文寫作、出版、信息檢索等的效率。目前中文輸入法有上千種之多,主要包括表音輸入和表形輸入兩類,也有兩者兼之的。漢字的語音輸入、手寫識別和光學字元識別(OCR)技術也已得到廣泛套用。
如收錄數千字的GB 2312(中國大陸)、Big5及CNS 11643(台灣)、HKSCS(香港)、JIS(日本),以及收錄兩萬多字的GBK(中國大陸)、國際標準Unicode、ISO 10646等等。在這個過程中,因為技術及其他種種因素,在收錄字數,及收錄字型等方面或做不同層次的調整。
漢字編碼
為進行信息交換,各漢字使用地區都制訂了一系列漢字字元集標準。
* 國標碼(“國標”是中華人民共和國國家標準的簡稱)在中國大陸使用。GB 2312收錄6763個漢字,GBK收錄20912個漢字,最新的GB 18030收錄27533個漢字。
* Big5碼。收錄13053個漢字。在台灣和香港使用的一位元組或兩位元組編碼。
* Unicode:中國政府不接受。中國政府要求在中國大陸出售的軟體必須支持GB 18030編碼。
* 在國際通信化和軟體設計領域,中日韓統一表意文字編碼收集了漢語、日語、朝鮮語/韓語中的漢字集。
漢字的未來
關於“漢字落後論”
由於漢字書寫複雜,“漢字落後論”的說法存在了很長時間,認為漢字是教育及信息化瓶頸,並有“漢字拉丁化”甚至廢除漢字的推動行為。現在一般認為漢字也有突出優點,初始學習難度雖大,但掌握常用字後不存在類似海量英文單詞的繼續學習問題,且其表意特性也能充分調動人腦的學習能力。在計算機輸入問題基本解決後,“漢字落後論”及“漢字拉丁化”已實際上逐漸被大多數人拋棄。
見漢字。