資料庫概述

資料庫概述

資料庫技術是60年代初開始發展起來的一門數據管理自動化的綜合性新技術。資料庫的套用領域相當廣泛,從一般事務處理,到各種專門化數據的存儲與管理,都可以建立不同類型的資料庫。目的:建立資料庫不僅僅是為了保存數據,擴展人的記憶,而主要是為了幫助人們去管理和控制與這些數據相關聯的事物。地理信息系統中的資料庫就是一種專門化的資料庫,由於這類資料庫具有明顯的空間特徵,所以有人把它稱為空間資料庫,空間資料庫的理論與方法是地理信息系統的核心問題。

一、 資料庫的定義

資料庫就是為了一定的目的,在計算機系統中以特定的結構組織、存儲和套用的相關聯的數據集合。
計算機對數據的管理經過了三個階段—最早的程式管理階段,後來的檔案管理階段,現在的資料庫管理階段。其中,資料庫是數據管理的高級階段,它與傳統的數據管理相比有許多明顯的差別,其中主要的有兩點:一是數據獨立於應用程式而集中管理,實現了數據共享,減少了數據冗餘,提高了數據的效益;二是在數據間建立了聯繫,從而使資料庫能反映出現實世界中信息的聯繫。
地理信息系統的資料庫(以下稱為空間資料庫)是某區域內關於一定地理要素特徵的數據集合。空間資料庫與一般資料庫相比,具有以下特點:
(1)數據量特別大,地理系統是一個複雜的綜合體,要用數據來描述各種地理要素,尤其是要素的空間位置,其數據量往往大得驚人。即使是一個很小區域的資料庫也是如此。
(2)不僅有地理要素的屬性數據(與一般資料庫中的數據性質相似),還有大量的空間數據,即描述地理要素空間分布位置的數據,並且這兩種數據之間具有不可分割的聯繫。
(3)數據套用的面相當廣,如地理研究、環境保護、土地利用與規劃、資源開發、生態環境、市政管理、道路建設等等。
上述特點,尤其是第二點,決定了在建立空間資料庫時,一方面應該遵循和套用通用資料庫的原理和方法,另一方面又必須採取一些特殊的技術和方法來解決其它資料庫所沒有的管理空間數據的問題。

二、資料庫的主要特徵

資料庫方法與檔案管理方法相比,具有更強的數據管理能力。資料庫具有以下主要特徵:
1、數據集中控制特徵
在檔案管理方法中,檔案是分散的,每個用戶或每種處理都有各自的檔案,不同的用戶或處理的檔案一般是沒有聯繫的,因而就不能為多用戶共享,也不能按照統一的方法來控制、維護和管理。資料庫很好地克服了這一缺點,資料庫集中控制和管理有關數據,以保證不同用戶和套用可以共享數據。數據集中並不是把若干檔案“拼湊”在一起,而是要把數據“集成”。因此,資料庫的內容和結構必須合理,才能滿足眾多用戶的要求。
2、數據冗餘度小的特徵
冗餘是指數據的重複存儲。在檔案方式中,數據冗餘太。冗餘數據的存在有兩個缺點:一是增加了存儲空間;二是易出現數據不一致。設計資料庫的主要任務之一是識別冗餘數據,並確定是否能夠消除。在目前情況下,即使資料庫方法也不能完全消除冗餘數據。有時,為了提高數據處理效率,也應該有一定程度的數據冗餘。但是,在資料庫中應該嚴格控制數據的冗餘度。在有冗餘的情況下,數據更新、修改時,必須保證資料庫內容的一致性。
3、數據獨立性特徵
數據獨立是資料庫的關鍵性要求。數據獨立是指資料庫中的數據與應用程式相互獨立,即應用程式不因數據性質的改變而改變;數據的性質也不因應用程式的改變而改變。數據獨立分為兩級:物理級和邏輯級。物理獨立是指數據的物理結構變化不影響數據的邏輯結構;邏輯獨立意味著資料庫的邏輯結構的改變不影回響用程式。但是,邏輯結構的改變必然影響到數據的物理結構。目前,數據邏輯獨立還沒有能完全實觀。
4、複雜的數據模型數據模型能夠表示現實世界中各種各樣的數據組織以及數據間的聯繫。複雜的數據模型是實現數據集中控制、減少數據冗餘的前提和保證。採用數據模型是資料庫方法與檔案方式的一個本質差別。
資料庫常用的數據模型有三種:層次模型,網路模型和關係模型。因此,根據使用的模型,可以把資料庫分成:層次型資料庫,網路型資料庫和關係型資料庫。
5、數據保護特徵
數據保護對資料庫來說是至關重要的,一旦資料庫中的數據遭到破壞,就會影響資料庫的功能,甚至使整個資料庫失去作用、數據保護主要包括四個方面的內容:安全性控制、完整性控制、並發控制、故障的發現和恢復。

三、資料庫的系統結構

資料庫是一個複雜的系統。資料庫的基本結構可以分成三個層次:物理級、概念級和用戶級。
1、物理級:資料庫最內的一層。它是物理設備上實際存儲的數據集合(物理資料庫)。它是由物理模式(也稱內部模式)描述的。
2、概念級:資料庫的邏輯表示,包括每個數據的邏輯定義以及數據間的邏輯聯繫。它是由概念模式定義的,這一級也被稱為概念模型。
3、用戶級:用戶所使用的資料庫,是一個或幾個特定用戶所使用的數據集合(外部模型),是概念模型的邏輯子集。它由外部模式定義。

四、數據組織方式

數據是現實世界中信息的裁體,是信息的具體表達形式。為了表達有意義的信息內容,數據必須按照一定的方式進行組織和存儲。資料庫中的數據組織一般可以分為四級:數據項、記錄、檔案和資料庫。
1、數據項:是可以定義數據的最小單位,也叫元素、基本項、欄位等。數據項與現實世界實體的屬性相對應,數據項有一定的取值範圍,稱為域。域以外的任何值對該數據項都是無意義的。如表示月份的數據項的域是1—12,13就是無意義的值。每個數據項都有一個名稱,稱為數據項目。數據項的值可以是數值的、字母的、漢字的等形式。數據項的物理特點在於它具有確定的物理長度,一般用位元組數表示。
幾個數據項可以組合,構成組合數據項。如“日期”可以由日、月、年三個數據項組合而成。組合數據項也有自己的名字,可以作為一個整體看待。
2、記錄:由若干相關聯的數據項組成。記錄是應用程式輸入—輸出的邏輯單位。對大多資料庫系統,記錄是處理和存儲信息的基本單位。記錄是關於一個實體的數據總和,構成該記錄的數據項表示實體的若干屬性。
記錄有“型”和“值”的區別。“型”是同類記錄的框架,它定義記錄,“值”是記錄反映實體的內容。
為了唯一標識每個記錄,就必須有記錄標識符,也叫關鍵字。記錄標識符一般由記錄中的第一個數據項擔任,唯一標識記錄的關鍵字稱主關鍵字,其它標識記錄的關鍵字稱為輔關鍵字。
3、檔案:檔案是一給定類型的(邏輯)記錄的全部具體值的集合。檔案用檔案名稱稱標識。檔案根據記錄的組織方式和存取方法可以分為:順序檔案、索引檔案、直接檔案倒排檔案等等。
4、資料庫:是比檔案更大的數據組織。資料庫是具有特定聯繫的數據的集合,也可以看成是具有特定聯繫的多種類型的記錄的集合。資料庫的內部構造是檔案的集合,這些檔案之間存在某種聯繫,不能孤立存在。

相關詞條

相關搜尋

熱門詞條

聯絡我們