數字資料庫

數字資料庫常常稱為源資料庫、非文獻目錄資料庫、數據文檔、數據倉庫以及事實倉庫, 以便同傳統的文獻目錄資料庫格區別。一個數字資料庫是一個計算機可讀數據的集合。

介紹

數字資料庫常常稱為源資料庫、非文獻目錄資料庫、數據文檔、數據倉庫以及事實倉庫, 以便同傳統的文獻目錄資料庫格區別。眾所周知, 文獻目錄資料庫通常用於查詢。這些資料庫是針對文獻中的某篇文獻, 或對某人、某機構來進行檢索的。顯然還有一些查閱型資料庫不提供文獻引文檢索。這類資料庫例子之一是科學信息交換資料庫。該資料庫概括了研究項目內容, 提供研究者名字、研究所或發起機構、甚至還有研究經費的數目。查閱型資料庫經常被看作是數字資料庫範疇的一部分。

第二類重要的資料庫——源資料庫或數字資料庫包含各種各樣的信息和學科領域。在商業和經濟中, 這些資料庫可以提供關於某些產品價格趨勢和其它統計數據, 某個國家的工業增長率或消費的數字信息。與數字資料庫相關的科學可能涉及化合物的物理性質和化學性質、結構、光譜和命名法。有些源資料庫兼有事實回答型信息和數字數據。只有極少量的源資料庫包含著全文文獻。最有代表性的便是全文式法律系統。

由於數字資料庫在很多學科中有各種各樣的作用, 所以給它們下一個統一的定義有點麻煩。與文獻記錄中所標明的數字如出版年份相反, 數字數據通常定義為用標準單位表示的觀察量或測量量。在最普通的意義上來說, 一個數字資料庫是一個計算機可讀數據的集合。很多含有這種數據的資料庫系統都具有檢索數字數據並處理這種數據的能力。有些資料庫系統具有對數據的嚴格評價。這是一個非常重要的功能, 應成為更多資料庫系統的一個必不可少的組成部分。

特徵

1、在數字文檔中, 數據的可靠性是極為重要的。而這個標準在文獻目錄查找中卻不那么嚴格。

2、與數字數據檢索相比, 及時性對文獻目錄檢索來說要重要得多。例如, 胰島素的晶體結晶或水的沸點幾年內不可能有很大的變化。測量精度可能有所提高, 而且應在前面提到的誤差估計中表示出來。

3、與文獻目錄檢索相比, 專業知識對數字檢索來說要重要得多, 特別是在需要數據處理和分析的時候。

4、數字檢索和文獻檢索的檢索輸出要求是截然不同的。在文獻目錄檢索時, 特別是在物理與生物化學中, 輸出100~200篇引文是常見的事。而在數字數據檢索中, 如果不是要比較很多類似化合物的數據的話, 人們的目的只是要查找一個數值或一組數據。

舉例

NIH-EPACIS數字資料庫

目前,NIH-EPACIS(化學信息系統) 通過一個描述程式給最大數量的科學提供相關的數字資料庫。其功能很強的SANSS部分子結構和術語查詢系統能處理二維表示的結構記錄, 而不採用文字術語或線性表示的結構記錄儘管後者有它自己的長處。藉助於CIS, 就可能在圖象上用鍵聯結來構成一個化合物, 並要求互動系統檢索化合物的部分的或全部的結構式。為避免術語不一致起見,用其化學文摘的登記號以及標準的術語編制化合物索引。CIS系統允許用名稱、登記號、圖形結構或部分片段、分子式、商用名、以及化合物的其它特性來查找一個化合物。

MEDLINE數字資料庫

MEDLINE是美國國立醫學圖書館(The National Library of Medicine,NLM)開發的當今世界上最具權威性的文摘類醫學文獻資料庫之一。早期的MEDLINE包括了美國《醫學索引》(Index Medicus)、《國際護理索引》(International Nursing Index)和《牙科文獻索引》(Index to Dental Literature)三大檢索工具的內容,後來又有更多的子文檔加入,如AIDS-HIV、Bioethics、Biotechnology等資料庫。MEDLINE收錄了自1966年以來世界上70多個國家約4,000多種生物醫學期刊上發表的論文的題錄或文摘,其中大約有75%的文獻為英文文獻,文獻來源以美國為主。目前MEDLINE的記錄數已經超過了1,000多萬條,覆蓋了基礎醫學、臨床醫學、護理學、牙科學、獸醫學、衛生保健、營養衛生、職業衛生、衛生管理等。資料庫不提供全文,大多數文獻都帶有英文文摘。

相關詞條

熱門詞條

聯絡我們