數據模型

數據模型

數據模型(Data Model)是數據特徵的抽象。數據(Data)是描述事物的符號記錄,模型(Model)是現實世界的抽象。數據模型從抽象層次上描述了系統的靜態特徵、動態行為和約束條件,為資料庫系統的信息表示與操作提供了一個抽象的框架。數據模型所描述的內容有三部分:數據結構、數據操作和數據約束。 2011年,中國建立礦產資源潛力評價數據模型系列。

基本信息

組成部分及聯繫

數據模型所描述的內容包括三個部分:數據結構、數據操作、數據約束。

1)數據結構:主要描述數據的類型、內容、性質以及數據間的聯繫等,是目標類型的集合。目標類型是資料庫的組成成分,一般可分為兩類:數據類型、數據類型之間的聯繫。數據類型如DBTG(資料庫任務組)網狀模型中的記錄型、數據項,關係模型中的關係、域等。聯繫部分有DBTG網狀模型中的系型等。數據結構是數據模型的基礎,數據操作和約束都基本建立在數據結構上。不同的數據結構具有不同的操作和約束。

2)數據操作:數據模型中數據操作主要描述在相應的數據結構上的操作類型和操作方式。它是操作算符的集合,包括若干操作和推理規則,用以對目標類型的有效實例所組成的資料庫進行操作。

3)數據約束:數據模型中的數據約束主要描述數據結構內數據間的語法、詞義联系、他們之間的制約和依存關係,以及數據動態變化的規則,以保證數據的正確、有效和相容。它是完整性規則的集合,用以限定符合數據模型的資料庫狀態,以及狀態的變化。約束條件可以按不同的原則劃分為數據值的約束和數據間聯繫的約束;靜態約束和動態約束;實體約束和實體間的參照約束等。

發展

資料庫技術發展至今,主要有三種數據模型:層次數據模型、網狀數據模型、關係數據模型。層次模型發展最早,它以樹結構為基本結構,典型代表是IMS模型。由於多數實際問題中數據間關係不簡單地是樹型結構,層次型數據模型漸被淘汰。網狀數據模型通過網狀結構表示數據間聯繫,開發較早且有一定優點,目前使用仍較多,典型代表是 DBTG模型。關係模型開發較晚,它是通過滿足一定條件的二維表格來表示實體集合以及數據間聯繫的一種模型,具有堅實的數學基礎與理論基礎,使用靈活方便,適應面廣,所以發展十分迅速。目前流行的一些資料庫系統,如ORACLE、SYBASE、INGRESS、INFORMIX以及具有“大眾資料庫”之稱的dBASE Ⅲ等都屬於關係型資料庫。

從60年代後期以來,在各種計算機系統上建立了許多層次模型和網狀模型的資料庫管理系統。這些系統成功地套用於數據處理。但這類系統具有以下缺點。首先是使用了許多與數據操作任務無關的概念,如DBTG系統中的系,用戶必須按照存取路徑存取資料庫中的數據。其次,不支持集合處理,即未提供一次處理多個記錄的功能。第三,沒有充分認識端點用戶直接與資料庫對話的需求,缺乏為適應非預期查詢而增加系統設施的能力。這些缺點降低了程式和數據的獨立性,影回響用程式設計師的工作效率,限制端點用戶對資料庫的使用。

關係模型嚴格符合現代數據模型的定義。數據結構簡單清晰。存取路徑完全向用戶隱蔽,使程式和數據具有高度的獨立性。關係模型的數據語言非過程化程度較高,用戶性能好,具有集合處理能力,並有定義、操縱、控制一體化的優點。關係模型中,結構、操作和完整性規則三部分聯繫緊密。關係資料庫系統為提高程式設計師的生產率,以及端點用戶直接使用資料庫提供了一個現實基礎。

關係模型研究的一個課題,是擴展關係模型和把數據模型形式化。1981年提出可把數據模型看成是抽象的程式設計語言。資料庫是變數,資料庫模式是變數的類型。資料庫狀態是某類變數所取的值。數據定義語言給出說明資料庫變數的語法,數據操縱語言是數據模型中操作類型的具體實現,而資料庫管理系統是某個數據定義語言和數據操縱語言的具體實現。這樣,就可以用程式設計語言的形式概念和方法來研究數據模型。

隨著資料庫學科的發展,數據模型的概念也逐漸深入和完善。早期,一般把數據模型僅理解為數據結構。其後,在一些資料庫系統中,則把數據模型歸結為數據的邏輯結構、物理配置、存取路徑和完整性約束條件等四個方面。現代數據模型的概念,則認為數據結構只是數據模型的組成成分之一。數據的物理配置和存取路徑是關於數據存儲的概念,不屬於數據模型的內容。此外,數據模型不僅應該提供數據表示的手段,還應該提供數據操作的類型和方法,因為資料庫不是靜態的而是動態的。因此,數據模型還包括數據操作部分。

層次類型

數據模型按不同的套用層次分成三種類型:分別是概念數據模型、邏輯數據模型、物理數據模型。

概念模型

概念模型(Conceptual Data Model),是一種面向用戶、面向客觀世界的模型,主要用來描述世界的概念化結構,它是資料庫的設計人員在設計的初始階段,擺脫計算機系統及DBMS的具體技術問題,集中精力分析數據以及數據之間的聯繫等,與具體的數據管理系統(Database Management System,簡稱DBMS)無關。概念數據模型必須換成邏輯數據模型,才能在DBMS中實現。

概念模型用於信息世界的建模,一方面應該具有較強的語義表達能力,能夠方便直接表達套用中的各種語義知識,另一方面它還應該簡單、清晰、易於用戶理解。

在概念數據模型中最常用的是E-R模型、擴充的E-R模型、面向對象模型及謂詞模型。目前較為有名的是E-R模型。

邏輯模型

邏輯模型(Logical Data Model),是一種面向資料庫系統的模型,是具體的DBMS所支持的數據模型,如網狀數據模型(Network Data Model)、層次數據模型(Hierarchical Data Model)等等。此模型既要面向用戶,又要面向系統,主要用於資料庫管理系統(DBMS)的實現。

物理模型

物理模型(Physical Data Model),是一種面向計算機物理表示的模型,描述了數據在儲存介質上的組織結構,它不但與具體的DBMS有關,而且還與作業系統和硬體有關。每一種邏輯數據模型在實現時都有其對應的物理數據模型。DBMS為了保證其獨立性與可移植性,大部分物理數據模型的實現工作由系統自動完成,而設計者只設計索引、聚集等特殊結構。

重要模型

數據發展過程中產生過三種基本的數據模型,它們是層次模型、網狀模型和關係模型。這三種模型是按其數據結構而命名的。前兩種採用格式化的結構。在這類結構中實體用記錄型表示,而記錄型抽象為圖的頂點。記錄型之間的聯繫抽象為頂點間的連線弧。整個數據結構與圖相對應。其中層次模型的基本結構是樹形結構;網狀模型的基本結構是一個不加任何限制條件的無向圖。關係模型為非格式化的結構,用單一的二維表的結構表示實體及實體之間的聯繫。其中套用最廣泛的是關係模型,在邏輯數據類型中最常用的是層次模型、網狀模型、關係模型。

層次模型

它將數據組織成一對多關係的結構,層次結構採用關鍵字來訪問其中每一層次的每一部分。優點是存取方便且速度快;結構清晰,容易理解;數據修改和資料庫擴展容易實現;檢索關鍵屬性十分方便。缺點是結構呆板,缺乏靈活性;同一屬性數據要存儲多次,數據冗餘大(如公共邊);不適合於拓撲空間數據的組織。

網狀模型

它用連線指令或指針來確定數據間的顯式連線關係,是具有多對多類型的數據組織方式。優點是能明確而方便地表示數據間的複雜關係;數據冗餘小。缺點在於網狀結構的複雜,增加了用戶查詢和定位的困難;需要存儲數據間聯繫的指針,使得數據量增大;數據的修改不方便(指針必須修改)。

關係模型

它以記錄組或數據表的形式組織數據,以便於利用各種地理實體與屬性之間的關係進行存儲和變換,不分層也無指針,是建立空間數據和屬性數據之間關係的一種非常有效的數據組織方法。優點在於結構特別靈活,概念單一,滿足所有布爾邏輯運算和數學運算規則形成的查詢要求;能搜尋、組合和比較不同類型的數據;增加和刪除數據非常方便;具有更高的數據獨立性、更好的安全保密性。缺點是資料庫大時,查找滿足特定關係的數據費時;對空間關係無法滿足。

(1)關係的數據結構:關係模型採用二維表來表示。二維表由表框架和表的元組組成。表框架由多個命名的表屬性組成。每個屬性有一個取值範圍稱為值域。二維表中的每一行數據成稱為元組。

(2)關係操縱:關係模型的數據操縱是建立在關係上的數據操縱,一般有數據查詢(基本單位是元組分量)、數據刪除(基本單位是元組)、數據插入(基本單位是元組)和數據修改(基本單位是元組分量)四種操作。

(3)關係中的數據約束:關係模型中提供實體完整性約束、參照完整性約束和用戶完整性約束三種數據約束。

套用示例

2011年,中國建立礦產資源潛力評價數據模型系列。礦產資源潛力評價數據模型涵蓋成礦地質背景、成礦規律、物(重、磁)化遙及自然重砂綜合信息、成礦預測及煤炭、鈾礦、化工礦產潛力評價,以及以上專業的專業術語、專業譜系、代碼體系、特徵分類及屬性描述、圖件分層及定義、編圖表示、空間參數及比例尺、元數據規定以及成果匯總與集成技術要求等。

相關詞條

相關搜尋

熱門詞條

聯絡我們