概述
文字是人類用來記錄、交流的視覺符號系統,其本質功能(相對於語言這個交流工具而言),是可以超越當下時空限制。它可以和語言相互轉換,但它不是(不僅是)語言的記錄,也就是說,文字是獨立於語言而存在的。傳統西方文字學系統認為文字是語言的記錄,是基於西方的表音文字,並未充分認識到自源文字的典型性。一般認為,文字是文明社會產生的標誌。文字在發展早期都是圖畫形式的表意文字(象形文字),發展到後期都成為記錄語音的表音文字。和語言符號相比,文字元號的特點是形、音、義三結合的,字型、字音、字義是文字的三要素。
詞義
作為一個詞,“文字”具有如下含義:(1) [characters;script]∶記錄語言的符號,如漢字、拉丁字母。秦始皇統一中國後,在“琅琊山刻石”中才第一次把文字叫做字;倉頡之初作書,蓋依類象形,故謂之文,其後形聲相益,即謂之字。文者物象之本,字者言孳乳而浸多也。——《說文解字敘》 (2) [writing]∶文章、作文:文字通順 (3) [written language]∶語言的書面形式,如漢文、俄文; (4) [documents]∶文書、公文:行文字。
屬性
符號系統必須具備以下特性,才被稱作文字:1, 被人們用來在其日常生活中作口頭交流的約定中介(約定屬性);
2, 被人們用來作為書寫交流方式的記錄和表達工具(書寫屬性);
3, 每一個文字本身可歸納於其相應的音節系統和語素拼合能力(系統屬性)。
演變歷史
部分的文字史觀認為:人類的文字史分為三個階段:形意文字、意音文字和拼音文字。形意文字 又稱表意文字,是一種圖形符號只代表語素,而不代表音節的文字系統。
表意文字是文字萌芽時期的產物,是相當原始的,並不能用於記錄語言,可以分為四個層次——刻符、岩畫、文字畫和圖畫字。
意音文字 是一種圖形符號既代表語素,又代表音節的文字系統。
意音文字代表人類文字史走出原始時期,進入古典時期。發展成熟而又代表高度文化的意音文字很少,只有西亞的丁頭字、北非的聖書字和東亞的漢字。丁頭字和聖書字早已廢止使用,漢字是當今世界上唯一仍被廣泛採用的意音文字。
拼音文字 又稱字母文字,是繼形意文字和意音文字之後人類文字史的第三個階段。
字母文字的發展又分為三個時期:音節字母時期、輔音字母時期、音素字母時期;音素字母時期還可以再分出“拉丁字母國際通用時期”。
分類
書寫系統
書寫系統 每一種文字都具有其相應的書寫系統:意音書寫系統、音節書寫系統、字母書寫系統(全音素文字、輔音音素文字)。書寫特徵 輔音音素文字對每種子音都有一個符號,元音符號通常不標示。
某些輔音音素文字有元音的符號,但只用在特殊場合,如教學。
文字的圖像上分類
也許,最主要以圖像上區別來分類的是線條。線條書寫系統是指字元由許多線條所組成,如拉丁字母和漢字。漢字如果是用原子筆、毛筆或鑄刻在青銅器上,則視為是線性的。類似地,埃及象形文字和瑪雅文字則通常是描繪線性外框,但在正式場合,他們雕刻在bas-relief中。另一方面,非線性系統則如盲文,不論是用什麼材質,都非由線條構成。最早的例子則是線條的:公元前 3300 年的蘇美文字是線條的,雖然從它衍生的楔形文字不是。楔形文字也許是最早的非線條文字。它的字形是由蘆葦筆尖所壓制在潮濕泥板而成,而非之前在泥板上用筆尖描繪線條。 最後變成其文字的字根外觀上的變化。
盲文則是拉丁文字的非線條版本,它完全放棄拉丁文字的外形。字母是由凸塊所組成,其基底可以是皮革(劉易斯•布萊葉原本採用的材質),堅硬塑膠或金屬。
也有拉丁文字的非線條的短暫性版本,包含摩爾斯電碼,手語的manual alphabet版本和藉由旗幟或布條放置在不同角度旗語。然而,如果文字是定義成永久紀錄信息的能力的話,因為這些符號很快就會消失,則這些系統根本並非文字。
書寫方向
文稿的一項特徵是它們書寫的方向。埃及聖書體可以任一方向橫寫,只要動物或人的字形面向書寫它們的方向。早期的字母可以被以很多方向書寫,包含橫向(左至右或右至左)或縱向(上或下)。它一般是用牛耕式轉行書寫法。由一個(水平)方向開始,然後在一行結尾轉折以反方向書寫。希臘字母和其後繼者則是左至右的模式,然後在一頁中由上往下寫。在 Timed Text (TT) Authoring Format 中,這個模式被簡稱為LRTB[1]。其它文字,如阿拉伯文字和希伯來語則由右至左書寫。漢字傳統上是縱向書寫(上至下),接著在頁中由右至左排列。但近年來因為西方文化的影響,為了能使用羅馬字母的術語及電子檔案的技術上限制,則逐漸由左至右,上而下的方式書寫。維吾爾字母和其後繼者則是唯一一個現存由上至下,右至左的文字;這種方向源自於將祖傳閃語方向90° 逆時針方向以便在外觀上適合中文書寫。一些菲律賓和印度尼西亞的文字文字,如Hanunó'o,則是以遠離寫者方向,由下而上的方式書寫。
另見東亞文字排列方向、雙向文稿和鏡像文字
最常見幾種文字
世界上有文字的語言裡,絕大多數都是用以下文字形式寫成的:拉丁字母
歐洲(除東歐外),非洲(撒哈拉沙漠以南),南北美洲,大洋洲,東南亞(越南、印度尼西亞、馬來西亞、菲律賓)幾乎所有的非拉丁字母語言,都有官方的或約定俗成的拉丁字母轉寫方式;大多數非音節語言的拼音系統採用拉丁字母。
基里爾字母
東歐,前蘇聯的一些衛星國也曾採用斯拉夫字母拼寫語言,如蒙古等。阿拉伯字母
阿拉伯地區、北非、伊朗、巴基斯坦等伊斯蘭國家;中亞、中國的新疆等。印度式字母
印度半島(除巴基斯坦外)的絕大多數國家,東南亞(緬甸、寮國、泰國、高棉);中國的西藏等。漢字系統
漢字系統不僅包括漢字,還包括漢字的延展如假名、注音符號。中國大陸、香港、澳門、台灣、新加坡和其它使用漢語的華人地區、日本、韓國等。採用其它(往往是孤立的)文字形式的語言
韓語(南韓部分採用漢字系統)、蒙古語(舊蒙文)、希伯來語等。文字對人類影響
文字的出現,使歷史脫離了口傳身授的階段,得以記錄歷史。人類的思想、文化由於文字的出現而不會失傳中斷。同時,人類透過文字這種高效的信息傳播工具,大大提高了文化、思想、藝術、技術等人類文明的傳播速度和效率。文字與史學、文學
全世界從古到今浩如煙海的文學作品,無不以文字這樣一種“簡單”而神奇的記錄符號,記載了長久以來人類及其環境(動植物、甚至外太空等)所發生過的相關經歷;另一方面,文學家們也將文字原本看來固定而乏味的記載符號,創造出一系列的神奇作品。其中,文學除了準確地運用了相關的基本語法,還漸生出一整套完美的文學修辭系統;更因文學作品本身其寫作手法的豐富和發展,令文字的本身,融入了鮮明的生命特性。文字列表
在當今大的語種里,文字主要分為如下種類:意音文字
漢字(中文) 、日文漢字、韓文漢字、西夏文、女真文、契丹文、埃及文、楔形文字、音節文字、日文假名、彝文等。元音附標文字
(用上加字或下加字或左加字或右加字來標註元音)天城文、泰文、緬甸文、寮國文、高棉文、藏文、印地文、梵文、悉曇文字等。
輔音音素文字
阿拉伯文、希伯來文全音素文字
拉丁字母、西里爾字母、希臘文、亞美尼亞文、喬治亞文、蒙古文、朝鮮文、它拿字母(馬爾地夫文)等。中國文字(漢字)
歷史起源
從目前我們能看到的最早的有規模成體系的文字資料──商代甲骨文字算起,中文字已有3000年的歷史。由於甲骨文字已經是相當成熟的文字型系,我們可以推斷漢字的發生一定遠在3000年以前,儘管有很多仰韶文化中的陶器刻付符還不能有堅強的說服力。中國文字的發展可以劃分為三個大階段。從甲骨文字到西周銘文是一個階段,屬於上古文字,以圖形、會意為基礎;周宣王以後的籀文到秦小篆是第二個階段,以轉注、形聲為主,對物理世界的形態的依賴大大減弱,抽象性更強,秦漢時代的隸書以下是最後一個階段,這個階段已經少有新文字的創造,更多是對字的寫法(筆法與結構)的關注。大體說來,從隸書到今天使用的現代中文字形體上沒有太大的變化,屬於同一個辨識系統。中文漢字種類
從中文字跟漢語的關係看,中文字是一種語素文字。從中文字本身的構造看,中文字是由表意、表音的偏旁(形旁、聲旁)和既不表意也不表音的記號組成的文字型系。中文字起源於圖畫。在中文字產生的早期階段,象形字的字形跟它所代表的語素的意義直接發生聯繫。雖然每個字也都有自己固定的讀音,但是字形本身不是表音的符號,跟拼音文字的字母的性質不同。象形字的讀音是它所代表的語素轉嫁給它的。隨著字形的演變,象形字變得越來越不象形。結果是字形跟它所代表的語素在意義上也失去了原有的聯繫。這個時候,字形本身既不表音,也不表義,變成了抽象的記號。如果漢語裡所有的語素都是由這種既不表音也不表義的記號代表的,那么中文字可以說是一種純記號文字。
中文字具有獨體字與合體字的區別。只有獨體字才是純粹的記號文字(被稱作“文”)。合體字(被稱作“字”)是由獨體字組合造成的。從構造上說,合體字比獨體字高一個層次。因為組成合體字的獨體字本身雖然也是記號,可是當它作為合體字的組成成分時,它是以有音有義的“字”的身份參加的。 合體字可以分成以下3類:
形聲字
形聲字由表示意義的形旁和表示讀音的聲旁兩部分組成。拿構造最簡單的形聲字來說,形旁和聲旁都是由獨體字充當的。作為形聲字的組成部分,這些獨體字都是有音有義的字。不過形旁只取其義,不取其音,例如“鳩”字的偏旁“鳥”;聲旁則只取其音,不取其義,例如“鳩”字的偏旁“九”。 由於字義和字音的演變,有些形聲字的形旁或聲旁現在已失去了表意或表音的功能。例如“球”本來是一種玉的名稱,所以以“玉”為形旁。現在“球”字不再指玉,這個形旁就沒有作用了。再如“海”字本來以“每”為聲旁。由於字音的變化,現在“海”和“每”的讀音相去甚遠,聲旁“每”也就不起作用了。有的時候,形旁和聲旁都喪失了原來的功能,例如“給、等、短”。這一類字已經不能再作為形聲字看待了合體會意字
古人說“止戈為武”,“人言為信”。對於“武”、“信”兩個字來說,這種解釋是錯誤的。不過漢字型系裡確實有按照這種方式造的字,例如“不正為歪”,“不好為孬”。這一類字的特點是會合偏旁的字義來表現整個合體字的意義。這種字為數很少,只有個別的例子。形聲字和非形聲字之間並沒有明確的界限。造字之初,形聲字和它的聲旁的讀音本來就不一定密合。發展到現代漢字,出入就更大了。有人拿7500多個現代合體漢字進行統計。就國語讀音來說,合體字跟聲旁完全同音(聲母、韻母、聲調全同)的不到 5%。聲母、韻母相同而聲調不同的約占10%。只有韻母一項相同的約占20%。如果我們只把前兩類看作形聲字,那么形聲字大概只占通行漢字的15%。如果把以上三類全看作形聲字,形聲字大概會占通行漢字35%的樣子。要是把標準再放寬或者完全根據來歷確定形聲字,那么通行漢字中形聲字的百分比還要高得多。
以上兩類合體字里的偏旁有的有表意作用,有的有表音作用。下邊一類的情形不同。
合體記號字
這一類合體字的偏旁既不表意,也不表音。這主要有兩種情形。一是由於字音和字義的變化,原來的聲旁和形旁已經不再表音、表意了。例如上文舉過的“給、等、 短”一類字。 另一種情形可以舉“章”字為例。 按照漢代許慎《說文解字》的分析,“章”字從“音”從“十”。 可是現在一般人說“立早章” (以區別於“弓長張”)的時候,是把它分析成“立”和“早”兩部分。其實從古文字看,“章”本來是一個獨體象形字,跟“音、十、立、早”都沒有關係。中國現代文字
漢字用來記錄漢語已經有3000年以上的歷史,一直沿用到今天,沒有中斷過。在如此長的歷史時期里,漢字不僅為人們的現實生活服務,而且記錄下極其豐富的文化資料;甚至跨越國界,被日本、朝鮮、越南等鄰國借去記錄非漢語語言。50年代開始進行簡化漢字的工作。1986年重新公布的《簡化字總表》規定了2200多個簡化漢字(包括用簡化偏旁類推的字)。這項工作目前已告一段落,今後在一個時期內將保持穩定,不繼續簡化。因為不斷簡化會破壞文字的穩定性,而且簡化一批字以後,原來的繁體字並不能廢除。結果是漢字的總數有增無減,反而加重了學習和使用的人的負擔。
關於文字拼音化問題,長期以來一直有爭論。但是,漢語拼音方案的推出,是新中國對語言文字系統發展的巨大貢獻,將漢語的發音與文字建立了密切的聯繫,使語言文字一體化,促進了不同民族、不同方言的人與人的交流,中華民族的統一,至少也是建立在語言統一的物質基礎之上。另外,客觀上也實現了今天計算機的簡單快速錄入。從理論上說,由於漢字歷史悠久,大量的文獻都是用漢字記錄的。一旦改弦易轍,勢必在文獻的廣泛利用上造成一定困難,在社會心理和民族感情上也可能引起波動。所以,一場轟轟烈烈的漢字拉丁化思潮被化解為漢語拼音方案而不是漢字拼音化。毛澤東對吳玉章關於文字改革的幾個重要意見起到了決定性的作用。(參見http://wenku.baidu.com/view/2f9fa58302d276a200292eaa.html)
文字改革
新中國成立後,政府相關部門從1955年開始,結合當時的文字使用狀況並結合一定時期的文字長遠考慮,相繼頒布了多種各類語言文字規範標準;至2005年,已頒布137部。規範標準大多從漢語拼音及漢字簡化的角度,對不適合於當時社會生活的一些文字進行相應的規範;但是,時至今日伴隨著全球漢語熱潮的興起、以及與台灣地區社會文化交往的迅速走高,要求恢復繁體字、或者識繁用簡的民間呼聲日益升高,這顯然已經不合時宜,因為文字僅僅是交流工具,作為傳承文化的載體的文字,是學術領域的事情,而不能強加於普通教育領域。
中國有多少種民族文字
中國境內有56個民族。漢、回、滿3個民族通用漢文,蒙古、藏、維吾爾、哈薩克、柯爾克孜、朝鮮、彝、傣、拉祜、景頗、錫伯、俄羅斯12個民族各有自己的文字。這些文字多數都有較長的歷史。其中蒙古族使用一種豎寫的拼音文字。這種蒙古文通用於蒙古族地區。居住在新疆的蒙古族還使用一種以通用的蒙古文為基礎適合方言特點的拼音文字。雲南傣族在不同地區使用4種傣文,即傣仂文、傣繃文、傣哪文、金平傣文。因為蒙古族使用兩種蒙古文,傣族使用4種傣文,回族和滿族使用漢文,所以上述15個民族共使用17種文字。此外,傈傈族中大部分信仰基督教的民眾,使用一種用大寫拉丁字母及其顛倒形式的字母拼寫傈傈語的文字,還有維西縣的一兩個區使用當地農民創製的傈傈音節文字“竹書”。雲南省東北部一部分信仰基督教的民眾使用一種把表示聲、韻、調的符號拼成方塊的苗文。雲南佤族中信仰基督教的少數民眾使用拉丁字母形成的佤文。壯族、白族和瑤族的民眾中,還有一部分人使用在漢字影響下創製的方塊壯字、方塊白文和方塊瑤字。綜上所述,在中華人民共和國建立前,已使用文字的民族有21個,文字種類有24種。
除以上列舉的文字以外,還有一些在歷史上用過,後來停止使用的文字。這些文字是突厥文、回鶻文、察合台文、于闐文,八思巴字、西夏文、東馬圖畫文字、東巴象形文字、水書、滿文等17種。