中科永聯高級技術培訓中心(www.itisedu.com)
程式設計語言(Programming Language)是一組用來定義電腦程式的語法規則。它是一種被標準化的交流技巧,用來向計算機發出指令。一種計算機語言讓程式員能夠準確地定義計算機所需要使用的數據,並精確地定義在不同情況下所應當採取的行動。
程式設計語言原本是被設計成專門使用在計算機上的,但它們也可以用來定義算法或者數據結構。正是因為如此,程式設計師才會試圖使程式代碼更容易閱讀。
設計語言往往使程式設計師能夠比使用機器語言更準確地表達他們所想表達的目的。對那些從事計算機科學的人來說,懂得程式設計語言是十分重要的,因為在當今所有的計算都需要程式設計語言才能完成。
在過去的幾十年間,大量的程式設計語言被發明、被取代、被修改或組合在一起。儘管人們多次試圖創造一種通用的程式設計語言,卻沒有一次嘗試是成功的。之所以有那么多種不同的程式語言存在的原因是,編寫程式的初衷其實也各不相同;新手與老手之間技術的差距非常大,而有許多語言並對新手來說太難學;還有,不同程式之間的運行成本(runtime cost)各不相同。
有許多用於特殊用途的語言,只在特殊情況下使用。例如,PHP專門用來顯示網頁;Perl更適合文本處理;C語言被廣泛用於作業系統和編譯器的開發(所謂的系統編程)。
高級程式設計語言(也稱高級語言)的出現使得電腦程式設計語言不再過度地倚賴某種特定的機器或環境。這是因為高級語言在不同的平台上會被編譯成不同的機器語言,而不是直接被機器執行。最早出現的程式語言之一FORTRAN的一個主要目標,就是實現平台獨立。
雖然大多數的語言可以既被編譯(compiled)又被解譯(interpreted),但大多數只在一種情況下能夠良好運行。在一些編程系統中,程式要經過幾個階段的編譯,一般而言,後階段的編譯往往更接近機器語言。這種常用的使用技巧最早在1960年代末用於BCPL,編譯程式先編譯一個叫做“0代碼”的轉換程式(representation),然後再使用虛擬器轉換到可以運行於機器上的真實代碼。這種成功的技巧之後又用於Pascal和P-code,以及Smalltalk和二進制碼,雖然在很多時候,中間過渡的代碼往往是解譯,而不是編譯的。
如果所使用的翻譯的機制是將所要翻譯的程式代碼作為一個整體翻譯,並之後運行內部格式,那么這個翻譯過程就被成為編譯。因此,一個編譯器是一個將人可閱讀的程式文本(叫做原始碼)作為輸入的數據,然後輸出可執行檔案(object code)。所輸出的執行檔可以是機器語言,由計算機的中央處理器直接運行,或者是某種模擬器的二進制代碼。
如果程式代碼是在運行時才即時翻譯,那么這種翻譯機制就被稱作解譯。經解譯的程式運行速度往往比編譯的程式慢,但往往更具靈活性,因為它們能夠與執行環境互相作用。參見解譯語言。
程式設計語言的分類
程式設計語言的基本成分有:①數據成分,用於描述程式所涉及的數據;②運算成分,用以描述程式中所包含的運算;③控制成分,用以描述程式中所包含的控制;④傳輸成分,用以表達程式中數據的傳輸。
程式設計語言按照語言級別可以分為低級語言和高級語言。低級語言有機器語言和彙編語言。低級語言與特定的機器有關、功效高,但使用複雜、繁瑣、費時、易出差錯。機器語言是表示成數碼形式的機器基本指令集,或者是操作碼經過符號化的基本指令集。彙編語言是機器語言中地址部分符號化的結果,或進一步包括宏構造。高級語言的表示方法要比低級語言更接近於待解問題的表示方法,其特點是在一定程度上與具體機器無關,易學、易用、易維護。
程式設計語言按照用戶的要求有過程式語言和非過程式語言之分。過程式語言的主要特徵是,用戶可以指明一列可順序執行的運算,以表示相應的計算過程,如FORTRAN、COBOL、PASCAL等。
按照套用範圍,有通用語言與專用語言之分。如FORTRAN、COLBAL、PASCAL、C等都是通用語言。目標單一的語言稱為專用語言,如APT等。
按照使用方式,有互動式語言和非互動式語言之分。具有反映人機互動作用的語言成分的語言成為互動式語言,如BASIC等。不反映人機互動作用的語言稱為非互動式語言,如FORTRAN、COBOL、ALGOL69、PASCAL、C等都是非互動式語言。
按照成分性質,有順序語言、並發語言和分布語言之分。只含順序成分的語言稱為順序語言,如FORTRAN、C等。含有並發成分的語言稱為並發語言,如PASCAL、Modula和Ada等。
程式設計語言是軟體的重要方面,其發展趨勢是模組化、簡明化、形式化、並行化和可視化。
程式設計語言的特點
每一種程式設計語言可以被看作是一套包含語法、辭彙和含義的正式規範。
這些規範通常包括:
數據和數據結構
指令及流程控制
引用機制和重用
設計哲學
大多數被廣泛使用或經久不衰的語言,擁有負責標準化的組織,經常會晤來創造及發布該語言的正式定義,並討論擴展或貫徹現有的定義。
數據和數據結構
現代計算機內部的數據都只以二元方式儲存,即開-關模式(on-off)。現實世界中代表信息的各種數據,例如名字、銀行賬號、度量以及同樣低端的二元數據,都經由程式設計語言整理,成為高端的概念。
一個程式中專門處理數據的那個系統被稱為程式語言的型態系統(type system);對型態系統的研究和設計被稱為型態理論(type theory)。語言可以被分為靜態型態系統(statically typed systems),例如C++和Java,和動態型態系統(dynamically typed systems),例如Lisp,JavaScript,Tcl和Prolog。前者可被進一步分為包含宣告型態(manifest type)的語言,即每一個變數和函式的型態都清楚地宣告,或type-inferred語言(例如MUMPS,ML)。
大多數語言還能夠在內置的型態基礎上組合出複雜的數據結構型態(使用數組,列表,堆疊,檔案等等)。面向對象語言(Object Oriented Language,又譯作“物件導向語言”)允許程式設計師定義新的數據型態,即“對象”或“物件”(objects),以及運行於該對象的函式(functions)和方法(methods)。
除了何時以及如何確定表達式和型態的聯繫,另外一個重要的問題就是語言到底定義了哪些型態,以及允許哪些型態作為表達式的值。諸如C程式語言之類的低端語言允許程式命名記憶體位置、記憶體區域以及編譯時的常量;ANSI C甚至允許表達式返回結構值(struct values)。功能性的語言一般允許變數直接使用運行時計算出的值,而不是指出該值可能儲存的記憶體地址。
指令及流程控制
一旦數據被確定,機器必須被告知如何對這些數據進行處理。較簡單的指令可以使用關鍵字或定義好的語法結構來完成。不同的語言利用序列系統來取得或組合這些語句。除此之外,一個語言中的其他指令也可以用來控制處理的過程(例如分支、循環等)。
引用機制和重用
引用的中心思想是必須有一種間接設計儲存空間的方法。最常見的方法是通過命名變數。根據不同的語言,進一步的引用可以包括指向其他儲存空間的指針。還有一種類似的方法就是命名一組指令。大多數程式設計語言使用宏調用、過程調用或函式調用。使用這些代替的名字能讓程式更靈活,並更具重用性。
程式設計語言的歷史
二十世紀四十年代當計算機剛剛問世的時候,程式設計師必須手動控制計算機。當時的計算機十分昂貴,唯一想到利用程式設計語言來解決問題的人是德國工程師楚澤(Konrad Zuse)。
幾十年後,計算機的價格大幅度下跌,而電腦程式也越來越複雜。也就是說,開發時間已經遠比運行時間來得寶貴。
於是,新的集成、可視的開發環境越來越流行。它們減少了所付出的時間、金錢(以及腦細胞)。只要輕敲幾個鍵,一整段代碼就可以使用了。這也得益於可以重用的程式代碼庫。
常見的程式設計語言
ActionScript
APL、A+和J
Ada
彙編語言
AWK
Basic、Fortran
VBScript
Brainfuck
C、C++
C#
Clipper
COBOL
dBase
PASCAL、Delphi
Forth
FoxPro
F#
Fava
IDL
Java
JavaScript
J#
LISP
Lua
LOGO
Modula
Perl
PHP
PL/I
Prolog
Python
Ruby
Scheme
Smalltalk
SQL
Tcl/Tk
Visual Basic
Visual FoxPro
XML