PostgreSQL

PostgreSQL

PostgreSQL是以加州大學伯克利分校計算機系開發的 POSTGRES,現在已經更名為PostgreSQL,版本 4.2為基礎的對象關係型資料庫管理系統(ORDBMS)。PostgreSQL支持大部分 SQL標準並且提供了許多其他現代特性:複雜查詢、外鍵、觸發器、視圖、事務完整性、MVCC。同樣,PostgreSQL 可以用許多方法擴展,比如, 通過增加新的數據類型、函式、操作符、聚集函式、索引。免費使用、修改、和分發 PostgreSQL,不管是私用、商用、還是學術研究使用。

基本信息

主要特點

特點與優勢

PostgreSQL 是一個免費的對象-關係資料庫伺服器(資料庫管理系統),它在靈活的 BSD-風格許可證下發行。它提供了相對其他開放原始碼資料庫系統(比如 MySQL 和 Firebird),和專有系統(比如 Oracle、Sybase、IBM 的 DB2 和 Microsoft SQL Server)之外的另一種選擇。

PostgreSQL 不尋常的名字導致一些讀者停下來嘗試拼讀它,特別是那些把SQL拼讀為"sequel"的人。PostgreSQL 開發者把它拼讀為 "post-gress-Q-L"。它也經常被簡略念為 "postgres"。

事實上, PostgreSQL 的特性覆蓋了 SQL-2/SQL-92 和 SQL-3/SQL-99,首先,它包括了可以說是目前世界上最豐富的數據類型的支持,其中有些數據類型可以說連商業資料庫都不具備, 比如 IP 類型和幾何類型等;其次,PostgreSQL 是全功能的自由軟體資料庫,很長時間以來,PostgreSQL 是唯一支持事務、子查詢、多版本並行控制系統(MVCC)、數據完整性檢查等特性的唯一的一種自由軟體的資料庫管理系統。 Inprise 的 InterBase 以及SAP等廠商將其原先專有軟體開放為自由軟體之後才打破了這個唯一。最後,PostgreSQL擁有一支非常活躍的開發隊伍,而且在許多黑客的努力下,PostgreSQL 的質量日益提高。

從技術角度來講,PostgreSQL 採用的是比較經典的C/S(client/server)結構,也就是一個客戶端對應一個伺服器端守護進程的模式,這個守護進程分析客戶端來的查詢請求,生成規劃樹,進行數據檢索並最終把結果格式化輸出後返回給客戶端。為了便於客戶端的程式的編寫,由資料庫伺服器提供了統一的客戶端 C 接口。而不同的客戶端接口都是源自這個 C 接口,比如ODBC,JDBC,Python,Perl,Tcl,C/C++,ESQL等, 同時也要指出的是,PostgreSQL 對接口的支持也是非常豐富的,幾乎支持所有類型的資料庫客戶端接口。這一點也可以說是 PostgreSQL 一大優點。

架構

PostgreSQL強壯的一個原因源於它的架構。和商業資料庫一樣,PostgreSQL可以用於C/S(客戶/伺服器)環境。這對於用戶和開發人員有很多好處。

PostgreSQL安裝核心是資料庫服務端進程。它允許在一個獨立伺服器上。需要訪問存儲在資料庫中的數據的應用程式必須通過資料庫進程。這些客戶端程式無法直接訪問數據,即使它們和服務程式在同一台機器上。

版本歷史

早期版本

被稱為 PostgreSQL (發音為Post-gress-cue-ell)的對象-關係型資料庫管理系統(有一段時間被稱為 Postgres95)是從伯克利寫的 POSTGRES 軟體包發展而來的。經過十幾年的發展, PostgreSQL 是世界上可以獲得的最先進的開放源碼的資料庫系統, 它提供了多版本並發控制,支持幾乎所有 SQL構件(包括子查詢,事務和用戶定 義類型和函式), 並且可以獲得非常廣闊範圍的(開發)語言綁定 (包括 C,C++,Java,perl,tcl,和 python)。

Postgres95

在 1994 年, Andrew Yu 和 Jolly Chen 向 POSTGRES 中增加了 SQL 語言的解釋器。並隨後將 Postgres95 原始碼發布到網際網路上供大家使用, 成為一個開放源碼的,原先伯克利 POSTGRES 代碼的繼承者。

Postgres95 所有原始碼都是完全的 ANSI C , 而且代碼量減少了 25%。並且有許多內部修改以利於提高性能和代碼的維護性。 Postgres95 版本 1.0.x 在進行 Wisconsin Benchmark 測試時大概比 POSTGRES v4.2 快 30-50%。

目前版本

到了 1996 年, "Postgres95"改成新名字 PostgreSQL 用於反映最初的 POSTGRES 和最新的使用 SQL 的版本之間的關係。 同時版本號也 重新從 6.0 開始, 將版本號放回到最初的由 伯克利 POSTGRES 項目開始的順序中。

Postgres95 版本的開發重點放在標明和理解現有的後端代碼的問題上。 PostgreSQL 開發重點轉到了 一些有爭議的特性和功能上面,當然各個方面的工作同時都在進行。

目前,PostgresSQL的穩定版本到了9.6.3,具有非常豐富的特性和商業級資料庫管理系統的質量。

軟體改進

除了修正了一些錯誤,下面的是一些主要改進:

查詢語言

原來的查詢語言 PostQUEL 被 SQL 取代(在 server 端實現)。在 PostgreSQL 之前還不支持子查詢)(但這個功能可以在 Postgres95 裡面由用戶定義的 SQL 函式實現)。重新實現了聚集。同時還增加了對 GROUP BY 查詢子句的支持。 C 程式仍可以調用 libpq接口函式。

新增加了利用 GNU Readline 進行互動 SQL 查詢(psql)。 這個程式很大程度上取代了老的 monitor 程式。

前端庫

增加了新的前端庫, libpgtcl, 用以支持以 Tcl為基礎的客戶端。一個樣本 shell, pgtclsh,提供了新的 Tcl 命令用於 Tcl 程式和 Postgres95 後端之間的互動。

徹底重寫了大對象的接口。 保留了將大對象倒轉(Inversion )作為存儲大對象的唯一機制。 (去掉了倒轉(Inversion )檔案系統。)

去掉了記錄級(instance-level )的規則系統。 但我們仍然可以通過重寫規則使用規則。

特性教程

在發布的源碼中增加了一個簡短的常用 SQL 和 Postgres95 特有的 SQL 特性的教程。

用GNU make (取代了 BSD make)用於製作。 Postgres95 可以使用不加補丁的 GCC (修正了偶數位元組數據( doubles )的對齊問題)。

軟體項目

Michael Stonebraker 領導的 POSTGRES 項目是由防務高級研究項目局(DARPA), 陸軍研究辦公室(ARO),國家科學基金(NSF), 以及 ESL, Inc 共同贊助的。 POSTGRES 的實現始於 1986 年, 該系統最初的概念詳見 POSTGRES的設計。 最早的數據模型定義見 The POSTGRES Data Model。 當時的規則系統設計在 POSTGRES 規則系統的設計 里描述. 存儲管理器的理論基礎和體系結構在 POSTGRES存儲系統的設計 里有詳細描述。

從那以後,POSTGRES 經歷了幾次主要的版本更新。 第一個"演示性"系統在 1987 年便可使用了, 並且在 1988 年的 ACM-SIGMOD 大會上展出。在 1989 年六月發布了版本 1給一些外部的用戶使用。 為了回套用戶對第一個規則系統的批評,作者重新設計了規則系統,並在1990年6月發布了使用新規則系統的版本 2。 版本 3 在1991年出現, 增加了多存儲管理器的支持, 並且改進了查 詢執行器, 重新編寫了規則系統。 從那以後,隨後的版本直到 Postgres95 發布前工作都集中在移植性和可靠性上。

POSTGRES 已經在許多研究或實際的套用中得到了套用。 這些套用包括: 一個財務數據分析系統,一個噴氣引擎性能監控軟體包,一個小行星跟蹤資料庫, 一個醫療信息資料庫和一些地理信息系統。 POSTGRES 還被許多大學用於教學用途。 Illustra Information Technologies Illustra Information Technologies (併入 Informix) 拿到代碼並使之商業化。在 1992 年 POSTGRES 成為 Sequoia 2000 科學計算計畫的首要數據管理器。

到了 1993 年,外部用戶的數量幾乎翻番。隨著用戶的增加。 用於原始碼維護的時間日益增加 占用了太多本應該用於資料庫研究的時間, 為了減少支持的負擔,伯克利的POSTGRES 項目在版本 4.2 時正式終止。

版本發布

2013年10月10日,PostgreSQL 正式發布9.3.1版本。

2012年09月10日,PostgreSQL 宣布 9.2 正式版發布了!該版本主要在性能方面有很大的提升,也包括一些新的 SQL 特性以及複製支持方面,主要內容包括:

允許查詢直接從索引中獲取數據,避免訪問堆數據 ( index-only scans)

允許查詢計畫器為指定參數值生成自定義的計畫,甚至是用了 Prepared Statement

提升計畫器通過內部索引掃描來使用嵌套循環

允許流複製從節點將數據轉到其他從節點 (cascading replication)

允許pg_basebackup對待機的伺服器進行基準備份

增加新工具pg_receivexlog用來收集WAL 檔案的改動

增加SP-GiST(Space-Partitioned GiST) 索引訪問方法

支持range data types

增加JSON數據類型

為視圖增加security_barrier選項

允許 libpq 連線字元串使用URI格式

支技HP-UX

為 libpq 增加single-row processing mode以更好的處理大結果集。

軟體特徵

函式

通過函式,可以在資料庫伺服器端執行指令程式。儘管這樣的指令程式可以使用基本的SQL語句寫成,但是由於其缺乏流程控制等功能,所以在PostgreSQL中引入了使用其它程式語言編寫函式的能力,包括:

•一個內置的名為PL/pgSQL的過程語言,類似於Oracle的PL/SQL;

•包括PL/Perl,plPHP,PL/Python,PL/Ruby,PL/sh,PL/Tcl與PL/Scheme在內的腳本語言;

•編譯語言:C,C++,或Java(通過PL/Java)。

•R統計語言(PL/R)。

以上部分的語言,甚至可以在觸發器內執行。PostgreSQL支持行返回函式:它們的輸出是一系列行類型數據的集合,可以在查詢中當作表來使用。函式也可以被定義成以創建者或者調用者的身份運行。在某些場合,或者其他的資料庫產品中,函式也會被稱為“存儲過程”,但技術上這兩者並未有太大分別。

索引

在PostgreSQL中,用戶可以自定義索引方法,或使用內置的B-tree,哈希表與GiST索引。PostgreSQL的索引功能同時也具有以下功能:

•反向索引檢索:無須額外的索引就能實現類似ORDER BYfieldDESC的操作。

•表達式索引:可以建立基於表達式值而非數值或列的索引。

•部分索引:僅索引表的部分,可以通過在CREATE INDEX語句口添加WHERE從句以創建更小的索引。

•點陣圖索引掃描:從8.1版開始支持此功能。該功能將讀取多個索引,生成表示它們之間符合查詢標準的多元組交集的點陣圖。這樣解決了混合索引的問題。在一個具有20列的表中,理論上能創建20! 個索引,在實際套用中已不現實。使用點陣圖索引掃描後,在每次查詢時,它將能把約束條件中所涉及列各自的索引進行任意的排列組合。

觸發器

觸發器是由SQL語句查詢所觸發的事件。如:一個INSERT語句可能觸發一個檢查數據完整性的觸發器。觸發器通常由INSERT或UPDATE語句觸發。

在PostgreSQL中,可在數據表上設定觸發器,但無法在視圖中設定(對視圖的UPDATE或者INSERT操作可以使用規則(RULE)定義)。多個觸發器可依據字母順序依次執行。此外,除了使用內嵌的PL/PgSQL語言之外,觸發器的函式也可以用PL/Perl,PL/Python等語言編寫。

並發控制

PostgreSQL使用多版本並發控制(MVCC,Multiversion concurrency control)系統進行並發控制,該系統向每個用戶提供了一個資料庫的“快照”,用戶在事務內所作的每個修改,對於其他的用戶都不可見,直到該事務成功提交。這從很大程度上減少了對讀取鎖的依賴,同時保證了資料庫高效地符合ACID原則。

規則

規則(RULE)允許一個查詢能被重寫,通常被用作實現可更新的視圖。

數據類型

PostgreSQL內置豐富的數據類型,包括:

•任意精度的數值

•無限制長度文本

•幾何圖元

•IP位址與IPv6地址

•無類域間路由地址塊,MAC地址

•數組

此外,用戶可以創建自定義數據類型,通常通過PostgreSQL的GiST機制,它們也能被很好得索引,比如PostGIS地理信息系統的數據類型。

定義對象

用戶可以為資料庫內幾乎所有的對象定義新的類型,包括:

•索引

•操作符(可重載現有操作符。)

•聚合函式

•數據域

•數據類型轉換

•會話(編碼轉換)

繼承

數據表的結構及屬性可從一個“父”表中繼承,數據將在兩者間共享。對子表中數據的插入或者刪除也將在父表中體現,同樣,對父表作出的修改,比如添加列等操作也會導致子表產生相應改動。該功能尚未完全實現,實際上,表的約束尚不能繼承。比如,在一張外聯參考了父表id欄位的表中,插入一條具有子表中某條記錄id數據的記錄會導致失敗,因為PostgreSQL在對父表的外鍵約束檢查中不會檢查子表的內容。

擴展

•地理數據對象:PostGISGPL

•全文檢索:通過Tsearch2或OpenFTS, 將在8.3版本中內嵌Tsearch2。GPL

•多種異步主/從複製方案,包括Slony-I(BSD授權),Mammoth Replicator

•XML/XSLT支持contrib軟體包中的XPath擴展GPL

相關詞條

相關搜尋

熱門詞條

聯絡我們