簡介
在信息化社會,充分有效地管理和利用各類信息資源,資料庫差不多在每個行業都有套用。不同行業存儲在資料庫中數據是不一樣的,有些數據是可以公開的,有些數據則是機密的,因此有些資料庫支持用戶進行查詢操作,有些資料庫則不能。例如,圖書查詢資料庫系統支持用戶查詢操作;而政府資料庫管理系統則不支持用戶進行查詢操作。可查詢資料庫還可以指資料庫中有用戶想查詢的內容,這一般和用戶的需求有關,因此不同用戶所指可查詢資料庫是不同的。
資料庫基本結構
資料庫的基本結構分三個層次,反映了觀察資料庫的三種不同角度。
以內模式為框架所組成的資料庫叫做物理資料庫;以概念模式為框架所組成的數據叫概念資料庫;以外模式為框架所組成的資料庫叫用戶資料庫。
⑴ 物理數據層。
它是資料庫的最內層,是物理存貯設備上實際存儲的數據的集合。這些數據是原始數據,是用戶加工的對象,由內部模式描述的指令操作處理的位串、字元和字組成。
⑵ 概念數據層。
它是資料庫的中間一層,是資料庫的整體邏輯表示。指出了每個數據的邏輯定義及數據間的邏輯聯繫,是存貯記錄的集合。它所涉及的是資料庫所有對象的邏輯關係,而不是它們的物理情況,是資料庫管理員概念下的資料庫。
⑶ 用戶數據層。
它是用戶所看到和使用的資料庫,表示了一個或一些特定用戶使用的數據集合,即邏輯記錄的集合。
資料庫不同層次之間的聯繫是通過映射進行轉換的。
資料庫的優點
與數據檔案管理方式相比較,資料庫管理有許多優越性。這些優越性來自資料庫特有的數據結構和數據存儲方式。歸納起來,資料庫有如下優點。
(1)查詢迅速、準確,且有多種表達與傳輸方式。以一個大型倉庫管理為例:用手工操作,如要查找“某地區生產的商品的名稱、規格、數量”,就可能要先翻閱賬本,弄清分類目錄和分類形式,然後按地區或商品分類、商品名稱找到其他附帶的屬性,再抄寫下來。如果要查找的內容較多,則查找與抄寫既費時又費力。資料庫系統能根據給定的條件自動地按一定途徑以毫秒級速度進行掃描查找,可以在瞬間將符合要求的數據一一用表格或其他方式顯示出來,還可以自動地列印出來或通過網路傳輸到指定地址,而且不會出現錯誤。
(2)數據結構化且統一管理。在資料庫中,數據按邏輯結構組織起來,而按物理結構存放在磁介質中,並且由資料庫管理系統統一管理,既考慮了數據本身的特點,也考慮了數據之間以及檔案之間的聯繫,數據的查詢、檢索和處理很方便。在傳統的檔案系統中,儘管記錄內部存在某種結構,但記錄之間沒有聯繫,數據的查詢、檢索和處理十分煩瑣、困難。實現數據的整體結構化管理,是資料庫的主要特徵之一,也是資料庫系統與檔案系統的本質區別。
(3)數據冗餘度小。在檔案系統中,為了滿足一個應用程式對數據的需要,常常在不同地方重複存放同一個或同一組數據。這樣一來,如果一個多處存放的數據出現錯誤,就必須同時修改幾個地方,否則將造成數據之間的不一致性。在資料庫系統中,數據不僅可以面向某個局部套用而且可以面向整體套用,從而大大減少數據冗餘,節約了存儲空間,有效地避免了數據之間的不一致性 。
(4)具有較高的數據獨立性。數據獨立性是指用戶應用程式與存儲在資料庫中數據的相互獨立性。當人們利用應用程式調用資料庫進行數據處理時,只涉及數據的邏輯結構,而不涉及其存儲方式和物理結構。而當數據的物理存儲方式和結構改變時,資料庫管理系統將自動處理這種改變,而應用程式不必改變。近期甚至發展到資料庫的邏輯結構改變了,用戶程式也可以不變。用戶程式不隨數據邏輯結構改變而改變的特性,可稱為數據的“邏輯獨立性”。數據獨立性(物理的和邏輯的)是資料庫的重要特徵和優點,它有利於在資料庫結構修改時保持應用程式的穩定性,可以大大減少應用程式員的軟體開發工作量。
(5)數據的共享性好。存放於資料庫中的數據的共享性包括系統內部共享性和外部共享性兩種,這是資料庫管理方式區別於手工管理和檔案管理方式的最本質的特徵和優點。
系統內部的共享性是指同一個(組)數據在一次處理中可以多次被調用的性能,而系統外部的共享性是指同一個(組)數據可以同時供多個用戶調用。這兩種共享性的原理是一致的,它使得多種作業、多種語言、多種用戶可以相互覆蓋地使用數據集合。
內部共享性有效地降低了數據的冗餘度,系統很容易進行維護和擴充,而且能夠使應用程式的編寫更加方便。系統外部共享性能夠促進並實現信息社會化服務,可以充分發揮信息的價值。舉一個簡單的事例,在沒有使用資料庫技術時,火車票和飛機票發售的數據很難共享,常常出現有的售票處某線路車票或機票已售完,而另一售票處還有很多同一線路的車票或機票無人購買的情況。為了避免上述現象的出現,火車客運站和航空公司往往採取讓不同售票處出售不同路線車票和機票的做法,結果給乘客帶來許多不便。如今採用資料庫來管理車票和機票發售工作,各個售票處可以互通有無,乘客不但可以在一個城市的任何售票處方便地查詢併購買當地出發的某路線車票和機票,而且隨著網路技術的發展,人們甚至可以在全國任一城市查詢併購買異地出發的任一路線車票和機票。
可查詢資料庫示例
中國生物醫學文獻資料庫(CBMdisc): 該資料庫由中國醫學科學院醫學信息情報所和解放軍醫學圖書館聯合編輯發行,收錄了中國醫學科學院醫學信息研究所編制的 《中文科技資料目錄(醫藥衛 生)》 1980年至今收錄的1500多種中國生物醫學期 刊、彙編、會議論文的全部文獻題錄,總計227餘 萬條。他是國內目前較權威的醫學資料庫,全部題 錄均根據美國國立醫學圖書館的 《醫學主題詞表》 (即MeSH詞表)及中國中醫研究院圖書情報研究所出版的《中醫藥學主題詞表》進行標引,並根據《中 國圖書資料分類法》第三版進行了分類標引,是檢索中國醫學信息的主要信息源之一。
(2)中文生物醫學期刊資料庫(CMCC): 該資料庫是中國人民解放軍醫學圖書館資料庫研究部研製開發的文獻目錄型資料庫。主要面向醫院、醫學院 校、醫學研究所、醫藥工業、醫學信息和醫學出版等單位。該庫收錄了1994年以來國內正式出版發行 的生物醫學期刊和自辦發行的1000餘種生物醫學刊 物中的相關文獻,約100萬篇;涉及基礎醫學、臨 床醫學、預防醫學、藥學、醫學生物學、醫院管理、 醫學情報及部分自然科學等方面的內容; 文獻記錄有題名、全部作者、摘要等11項內容;載體為光碟, 數據半月更新,是中文醫學文獻檢索、查新報獎必備工具之一。
(3)中國醫學學術會議論文資料庫(CMAC): 該資料庫是中國人民解放軍醫學圖書館資料庫研究部研製開發的以醫學學術會議論文為來源文獻的目錄 型資料庫。該庫收集了1994年以來中華醫學會所屬 專業學會、各地區分會以及編輯部等單位組織召開 的全國性醫學學術會議700多種15萬餘篇文獻;文 獻內容有會議名稱、主辦單位、會議日期、論文題 名、全部作者、地址、關鍵字、摘要、參考文獻數及文獻類型等16項內容;載體為光碟,半年更新, 是目前我國中文醫學會議文獻資料庫收藏量較多的 目錄型資料庫。
(4)萬方數據醫藥信息資料庫:該資料庫由北京萬方數據股份有限公司提供。其內容涵蓋了國內外醫藥、生物等學科的資源,面向全國醫院、醫藥院 校、醫藥和保健品生產企業、經銷企業,提供豐富、 準確、及時的生物醫藥信息。期刊全文庫收錄了1998 年至今的中國醫藥科技核心期刊及部分其他期刊。