本條目介紹的是語言學上的“羅馬化”概念。“羅馬化”在歐洲古代歷史上則用於描述古羅馬文化和語言的傳播。
羅馬化(或稱拉丁化)是語言學的一個術語,指將不是拉丁字母(或稱羅馬字母)形式的拼音文字系統轉換成拉丁文字系統的過程,即將被轉換系統里的非拉丁字元,按照轉寫系統的規則和轉寫表,忠實地將字元(也包括字元的變音符號及單音素雙字元)對號入座地轉寫成轉換系統里的拉丁字元。被轉換系統與轉換系統的字元也可以逆向轉寫。
羅馬化的方案有很多,包括用以表達書面語的音譯和用以表達口語的轉錄。後者可以再被分為兩類:音位轉錄,用以記錄音素或者一段說話里的語義數量。和更嚴格的標音轉錄來記錄說話聲音。而每一個羅馬化方案均有一套獨立的規則,規定了每一個已羅馬化字的發音。
所以羅馬化就是把一個語言音譯或轉錄成羅馬字母的過程。而這個過程較多出現於中文、日語和韓語。同樣,西里爾化(或稱“斯拉夫化”)就是把一個語言音譯或轉錄成西里爾字母的過程。
羅馬化方案
音譯
如果使用羅馬化方案去把原來的字詞去音譯的話,最基本的原則就是把本來語言裡的字母,逐一音譯到目標語言之中。這個方法的特色,就是過程中並不著重在目標語言裡的實際發音。例如,使用日語的訓令式羅馬字的話,就容許讀者可以百分之百地,憑拼音去重組成日語的假名音節。但這個方案需要事前對日語有一定的知識。
轉錄
音位轉錄
但是,大部份的羅馬化方案都以一般讀者為主。就是說讀者事前並不需要對本來語言有認識,反而應該提起讀者對本來語言如何發音的興趣。這樣的羅馬化方案大多根據音位轉錄原則,嘗試把在本來語言裡,每一個音位的發音,儘量準確地轉錄,使到操目標語言的人都能發到貼近的發音。日語裡的平文式羅馬字(或稱黑本式羅馬字)就是一個很好的例子,這個羅馬化方案是為英語使用者而設的。
標音轉錄
標音轉錄方案則更進一步,這個方案嘗試把本來語言裡所有的音位描繪出來。有時可能會犧牲目標語言裡閱讀性的,使用在目標語言裡沒有的字母。國際音標字母就是一個在標音轉錄里最常用的系統。
取捨
對於大部份的語言來說,建立一套可用性的羅馬化方案都會涉及需要在兩個極端里進行取捨。純正的轉錄被普遍認為是不可能的,因為多會發生諸如在本來語言裡的發音和區別,不可能在目標語言裡表現出來。但如果硬要表現出來的話,就會使羅馬化後的字眼變得複雜。
一般來說,除了一部份學者之外,羅馬化方案都傾向以音位轉錄形式出現。舉個例子,日本武術“柔術”這一詞,使用訓令式羅馬字的話,就會變成“zyūzyutu”。這樣一來可以讓本身懂日語的人去重組成假名的“じゅうじゅつ”。但使用平文式羅馬字的話就會變成“jūjutsu”,人們會較易猜到這個詞語本來的日語發音。
不同書寫系統的羅馬化方案
阿拉伯語
阿拉伯字母是用來書寫阿拉伯語、波斯語和烏爾都語。其羅馬化方案如下:
德國摩爾根蘭學會(1936年):被羅馬的國際東方學者會議所使用,是以漢斯-威海辭典(ISBN 0879500034)為基礎所發展的方案。
BS 4280(1968年):由英國標準協會發展的方案。
標準阿拉伯語技術性音譯系統(1970年代):由美國軍隊發展的方案。
聯合國地名專家組(1972年):
DIN-31635(1982年):由德國標準化協會所發展的方案。
ISO 233(1984年):國際標準化組織的音譯方案。
卡拉姆(1985年):一套著重保留字母串法,犧牲了發音的方案。
ISO 233-2(1993年):國際標準化組織的簡化音譯方案。
畢克華爾特音譯方譯(1990年代):由施樂研究中心的添·畢克華爾特先生所發明的系統。這個系統並不需要一些特別的發音區別符號。
美國國會圖書館標準方案(1997年):
希伯來語
同時請參閱希伯來語字母
美國國家標準學會 Z39.25(1975年)
聯合國地名專家組(1977年):
ISO 259(1984年):國際標準化組織的音譯方案。
ISO 259-2(1994年):國際標準化組織的簡化音譯方案。
ISO/DIS 259-3:國際標準化組織的音位轉錄方案
美國國會圖書館標準方案:
婆羅米字母
婆羅米字母用以書寫印度大陸和東南亞地方語言的書寫系統。長久以來,西方都是透過其羅馬化音譯去研究梵文以及其他印度文字。自英國的東方學者威廉.瓊斯爵士之後,不同的印度文字音譯方案亦隨之推出。以下為不同方案的比較:
ISO 15919(2001年):國際標準化組織的音譯方案。這套方案以發音區別符號去標示大量的婆羅米子音及元音。詳情請參閱:Transliteration of Indic scripts: how to use ISO 15919。而天城文獨有的部份在學術標準上也被同化。國際梵文音譯字母及美國國會圖書館的標準
哈佛-京都:使用大楷、小楷及雙字母以避免使用發音區別符號,及限制使用範圍至7位元的美國信息互換標準代碼(ASCII)標準。
印度語言音譯:由Avinash Chopde發明的一套7位元ASCII標準的音譯方案,常見於USENET網絡。
HTML用梵文音譯字母:源自阿根廷,同樣兼容7位元的ASCII標準。
印度文字信息互換代碼方案(1988年)
加爾各答國立圖書館羅馬化方案
漢語
同時請參閱漢語羅馬化
漢語的羅馬化,在某些層面上被證明是一個困難的問題,因為同時涉及政治考慮。另一個困難之處,就是漢語並非表音文字,而是意音文字。所以大部份的羅馬化方案並非直接把漢字轉換,而是建基於類似漢語拼音之上。請參考:
國語/國語
美國國會圖書館標準方案:和威妥瑪拼音類似的方案[15], 但在2000年已經被轉換成漢語拼音。
法國拼法:由法國遠東學校於19世紀發明,主要於法國使用。
拉丁化新文字(1926年):把音調省略,主要於前蘇聯使用。
德國拼法:主要於德國使用。
郵政式拼音(1906年):早期的國際地址標準。
威妥瑪拼音(1912年):音譯方案,常用以第二次世界大戰之前。
耶魯拼法(1942年):由美國所創,用於戰地通訊。
中國大陸
漢語拼音(1958年):在中國大陸,這套方案已經被官方確認為羅馬化漢語的標準方案。多數用於教授母語並非國語的學生,學習國語時使用的學習工具。這套方案亦被國際社會普遍所接受,作為拼寫中文或名字時的標準。漢語拼音價值在於中國地大物博,人口之多,與其他面積和人口相若的國家一樣,出現了多種漢語方言。所以需要有一套統一的書寫系統和語言去進行溝通。
ISO 7098(1991年):國際標準化組織的方案,與漢語拼音非常相似。
台灣
國語羅馬字(1926年):中華民國教育部於1926年正式公布後在於全中國地域使用。1949年後則於台灣地區繼續使用,後來才被注音符號第二式所取代。
注音符號第二式(1986年):主要於台灣地區使用,目前仍普遍用於以兒童為對象的公共場合或機構。
通用拼音(2000年):主要於台灣地區。可參考這裡。
台灣教會POJ 字母套用於國語拼音:可參考
精簡羅馬拼音漢字系統網: 〔http://input.cpatch.org/input/dasn/book/ching_luoo2/ 〕
台灣教育部台羅字母套用於國語拼音:可參考
台灣鄉土母語羅馬拼音網: 〔http://input.cpatch.org/input/dasn/book/ ] 部羅輸入法網:
標準粵語
主條目:粵語羅馬化方案
教院學院拼音方案:香港教育局、考評局承認的方案
廣州話拼音方案(1960年):由廣東省教育部門發展的方案
香港政府粵語拼音:香港政府拼寫人名、地名的方案
香港語言學學會粵語拼音方案(粵拼,1993年):香港語言學學會方案
澳門葡式粵語拼音:澳門政府拼寫人名、地名的方案
Meyer-Wempe
劉錫祥拼音
耶魯粵語拼音(1942年)
黃錫凌羅馬拼音
寬式國際音標
吳語
吳語拉丁式注音法
J. Edkins方案
James Summers方案
拉丁化新文字(江南話)
閩南語
教會羅馬字(白話字)
台灣閩南語羅馬字拼音方案
台灣方言音符號
閩東語/福州話
平話字
日語
羅馬化,在日語裡稱作羅馬字(ローマ字)。
平文式羅馬字(1867年):音位轉錄方案。
日本式羅馬字(1885年):音譯方案,於1989年成為了ISO 3602嚴謹標準。
訓令式羅馬字(1937年):音譯方案,後來成為了ISO 3602標準。
JSL(1987年)
美國國會圖書館標準方案:與平文式羅馬字相似的一套方案。
文字處理器式羅馬字
韓語
馬科恩-賴肖爾轉寫系統式(1937年):直至2002年為止,都是韓國官方的韓語羅馬化方案。現時此系統仍於北韓使用。
羅馬字標記法修正案(2000年):在2005年,韓國政府正式使用這套已於2000年批准的方案。路牌和教科書已經開始逐步跟隨,政府估計此刻修訂需要花費至少20億美元。但人名拼音仍然可以按照個人意願,但政府會強烈建議使用新方案。
耶魯拼法(1942年):這套方案主要套用於學術文學層面。
美國國會圖書館標準方案:與McCune-Reischauer式大致上相同。
ISO/TR 11941(1996年):這套方案其實是由兩個方案所組成,分別為南北韓兩個國家所提出。最初提交上國際標準化組織的方案,是經過雙方努力的成果(方案主要以耶魯方案為基礎)。但在最後階段,雙方出現方歧,導致出現了兩個方案。兩個方案的分別:
泰語
泰語主要於泰國使用,有自己的一套文字去書寫。該套書寫系統可能是由古高棉傳過來,屬於婆羅米文字的一種。請參閱泰語字母。
皇家泰語音譯系統
美國國會圖書館標準方案:
ISO 11940(1998年):國際標準化組織的音譯方案。
西里爾字母
在語言學中,西里爾字母和格拉哥里字母都使用了科學音譯。同樣情況亦套用於古教會斯拉夫語,以及現代的各個斯拉夫語族,因為他們同樣使用這些字母。
白俄羅斯語
白俄羅斯語同時使用了西里爾字母和拉丁字母。但時至今日,縱使仍然有使用拉丁字母(正式名稱為Łacinka或Łacinica)的擁護者,但已經幾乎絕跡。但姑勿論本來的拉丁字母存在與否,白俄羅斯語的名字一般按俄語的習慣被翻譯。
例字 Łacinka字母 羅馬化後
Homiel Homyel'
Mahiloŭ Mahilyow
Viciebsk Vitsebsk
Baranavičy Baranavichy
Žytkavičy Zhytkavichy
白俄羅斯國家羅馬化系統
美國國會圖書館標準方案:
BGN/PCGN
ISO 9:國際標準化組織方案
俄語
現時並沒有一套國際公認把俄語翻譯成羅馬字母的方案—事實上已經有很多套方案存在:有時會稍作調整以迎合某些特定語言(例如德語和法語),而有些則設計為圖書館音譯之用,有些則為翻譯俄羅斯旅客護照之用。有時,有些名字的音譯則是以傳統為主。這樣一來,同一個名字會重複出現很多次。例如,俄國著名作曲家柴可夫斯基可以被譯成以下名字:Tchaykovsky, Tchajkovskij, Tchaikowski, Tschaikowski, Czajkowski, Čajkovskij, Čajkovski, Chajkovskij, Chaykovsky, Chaykovskiy, Chaikovski等等。
BGN/PCGN(1947年):美國地名委員會的方案
GOST 16876-71(1983年):前蘇聯的國家標準委員會,測量及地圖繪製部門的方案。
聯合國標準(1987年):以GOST方案上作基礎,在俄羅斯國內及國外的繪圖產品都開始被大量廣泛使用。
ISO 9(1995年):國際標準化組織的音譯方案。
美國國會圖書館標準方案(1997年)
Volapuk編碼(1990年):這是一個人們為了方便在網路上,使用拉丁字母傳送訊息,而使用的非正統俄語羅馬化方案。(這裡不是指沃拉普克語)
烏克蘭語
烏克蘭的人名多以音位轉錄形式翻譯。烏克蘭國家系統主要於翻譯烏克蘭地名時使用。
美國國會圖書館標準方案:
ISO 9 國際標準化組織的音譯方案。
烏克蘭國家系統:
烏克蘭國家及BGN/PCGN系統,聯合國地名專家組
托馬士.彼得遜先生撰寫的五個系統對比:
希臘語
希臘語包括現時在希臘地區使用的語言,及古代的多音調拼字法。
ISO 843(1997年):國際標準化組織方案
美國國會圖書館標準方案: