語言代碼

語言代碼是英國教育社會學家伯恩斯坦的術語。指在一定的語言集團中,特定的人群在特定的社會環境下使用的特定的言語。分為限定代碼(restricted code)和精製代碼(elaborated code)。他認為前者為社會地位和教育程度較低的階層使用,用詞千篇一律,語言成分較簡單、不完整,表達不合語法、模糊不清,並不考慮確切地表達一個人的個性和情感,也不包含複合的認知學習。後者為社會地位和教育程度較高的階層使用,句子較長,結構複雜,語彙豐富,表達詳細、明確而有邏輯性,還包括學習概念之間較複雜的關係。這種劃分並不意味語言與社會階層之間在任何情況下都存在必然的聯繫。

語言代碼標準

•ISO 639

•ISO 639-1

•ISO 639-2

•ISO 639-3

•SIL代號

•全球資訊網聯盟的IETF語言標籤

ISO 639

ISO 639是國際標準化組織為各語言所訂定的語言代碼。ISO 639的標題是Codes for the representation of names of languages(表示語言名稱的代碼),分為六個部分。

表1
標準副標題副標題漢譯第一版最新版代碼個數
ISO 639-1(舊稱ISO 639)Part 1: Alpha-2 code第一部分:2字母代碼19672002184
ISO 639-2Part 2: Alpha-3 code第二部分:3字母代碼19981998>450
ISO 639-3Part 3: Alpha-3 code for comprehensive coverage of languages第三部分:所有語言的3字母代碼20072007>7700
ISO 639-4Part 4: Implementation guidelines and general principles for language coding第四部分:語言編碼的實施指南和一般原則2010-07-162010-07-16不是列表
ISO 639-5Part 5: Alpha-3 code for language families and groups第五部分:語系和語族的3字母代碼2008-05-152008-05-15114
ISO 639-6Part 6: Alpha-4 representation for comprehensive coverage of language variants第六部分:所有語言變體的4字母代碼2009-11-17廢棄多於21,000

ISO 639-1

ISO 639-1是國際標準化組織ISO 639語言代碼標準的第一部分。它含有 184 個兩字母的編碼,用來標示世界上主要的語言。這些代碼在很多地方都被用作語言的簡寫,例如:

•英語(English)用en表示。

•德語(Deutsch)用de表示(Deutsch是德語的本名)。

•日語(Japanese)用ja表示(儘管日語的拼音是Nihongo)。

•漢語使用zh表示,來自“中文”的漢語拼音:Zhōngwén。

ISO 639-1在 2002年成為正式標準,但在之前的草擬階段已被使用多年。最後加進ISO 639-1的代碼是在2004年10月19日加入的si,代表僧加羅語。由1995年3月起,RFC 1766推薦使用本標準,而接著在2001年1月起的RFC 3066亦推薦使用本標準。

表2.ISO 639-1語言列表
aa阿法爾語fr法語li林堡語se北薩米語
ab阿布哈茲語fy弗里西亞語ln林加拉語sg桑戈語
ae阿維斯陀語ga愛爾蘭語lo寮語sh塞爾維亞-克羅地亞語
af南非語gd蘇格蘭蓋爾語lt立陶宛語si僧加羅語
ak阿坎語gl加利西亞語lu盧巴語sk斯洛伐克語
am阿姆哈拉語gn瓜拉尼語lv拉脫維亞語sl斯洛維尼亞語
an阿拉貢語gu古吉拉特語mg馬達加斯加語sm薩摩亞語
ar阿拉伯語gv曼島語mh馬紹爾語sn紹納語
as阿薩姆語ha豪薩語mi毛利語so索馬里語
av阿瓦爾語he希伯來語mk馬其頓語sq阿爾巴尼亞語
ay艾馬拉語hi印地語ml馬拉亞拉姆語sr塞爾維亞語
az亞塞拜然語ho希里莫圖語mn蒙古語ss斯瓦特語
ba巴什基爾語hr克羅地亞語mo摩爾達維亞語st南索托語
be白俄羅斯語ht海地克里奧爾語mr馬拉提語su巽他語
bg保加利亞語hu匈牙利語ms馬來語sv瑞典語
bh比哈爾語hy亞美尼亞語mt馬爾他語sw斯瓦希里語
bi比斯拉馬語hz赫雷羅語my緬甸語ta泰米爾語
bm班巴拉語ia國際語Ana諾魯語te泰盧固語
bn孟加拉語id印尼語nb書面挪威語tg塔吉克斯坦語
bo藏語ie國際語End北恩德貝勒語th泰語
br布列塔尼語ig伊博語ne尼泊爾語ti提格里尼亞語
bs波士尼亞語ii四川彝語(諾蘇語)ng恩敦加語tk土庫曼語
ca加泰隆語ik依努庇克語nl荷蘭語tl他加祿語
ce車臣語io伊多語nn新挪威語tn塞茨瓦納語
ch查莫羅語is冰島語no挪威語to湯加語
co科西嘉語it義大利語nr南恩德貝勒語tr土耳其語
cr克里語iu因紐特語nv納瓦霍語ts宗加語
cs捷克語ja日語ny尼揚賈語tt塔塔爾語
cu古教會斯拉夫語jv爪哇語oc奧克語tw特威語
cv楚瓦什語ka喬治亞語oj奧吉布瓦語ty塔希提語
cy威爾斯語kg剛果語om奧洛莫語ug維吾爾語
da丹麥語ki基庫尤語or奧利亞語uk烏克蘭語
de德語kj寬亞瑪語os奧塞梯語ur烏爾都語
dv迪維希語kk哈薩克語pa旁遮普語uz烏茲別克語
dz不丹語kl格陵蘭語pi巴利語ve文達語
ee埃維語km高棉語pl波蘭語vi越南語
el現代希臘語kn卡納達語ps普什圖語vo沃拉普克語
en英語ko朝鮮語、韓語pt葡萄牙語wa沃倫語
eo世界語kr卡努里語qu凱楚亞語wo沃洛夫語
es西班牙語ks克什米爾語rm羅曼什語xh科薩語
et愛沙尼亞語ku庫爾德語rn基隆迪語yi依地語
eu巴斯克語kv科米語ro羅馬尼亞語yo約魯巴語
fa波斯語kw康沃爾語ru俄語za壯語
ff富拉語ky吉爾吉斯語rw盧安達語zh中文、漢語
fi芬蘭語la拉丁語sa梵語zu祖魯語
fj斐濟語lb盧森堡語sc薩丁尼亞語
fo法羅語lg盧乾達語sd信德語

ISO 639-2

ISO 639-2:1998 是國際標準化組織ISO 639語言編碼標準的第二部分,為各語言和語系所訂定的 3 字母語言代碼。 ISO639-2 的註冊機構是美國國會圖書館。

有 22 種語言同時在 ISO 639-2 中有兩個 3 字母語言代碼:

•ISO 639-2/B ,書籍目錄使用 (bibliographic use)。

•ISO 639-2/T ,技術專門使用 (terminological use)。

這 22 種語言本身都已有ISO 639-1編碼。

ISO 639-2/B 是原本供書籍使用的代碼,採用英語的語言名稱排列,而並非使用該語言的語言名稱排列。例如德語的 ISO 639-2/B 碼是ger, ISO 639-2/T 碼是deu;中文(漢語)的 ISO639-2/B 碼是chi, ISO639-2/T 碼是zho。除英語圖書館編排外,應使用 ISO639-2/T 碼。

塞爾維亞語曾用 ISO639-2/B 碼scc、克羅地亞語曾用 ISO639-2/B 碼scr,但在2008年6月28日的改動中,已被停止使用,改為統一使用 ISO639-2/T 碼srp和hrv。

ISO 639-3

ISO 639-3是個國際語種代號標準,在2007年2月5日出版。它延伸了ISO 639-2里的 Alpha-3 code(三個字母的代號),目標是涵蓋所有的語言。所以,它是ISO 639-1的超集合。 ISO 639-3 是ISO 639-2個別語言的超集合,但是因為 ISO639-3 沒有 ISO639-2 的語言集合,所以 ISO 639-3 不是整個 ISO 639-2 的超集合。

自2005年7月30日發布的計畫草案,共有 7,602 個語言條目,這些語言的來源有三個:基本資料來自 ISO 639-2 所收錄的個別語言,和取自《民族語》里的現代語言調查資料。

相關詞條

相關搜尋

熱門詞條

聯絡我們