中國科學院科學資料庫

中國科學院科學資料庫

中國科學院科學資料庫的內容涵蓋了化學、生物、天文、材料、腐蝕、光學機械、自然資源、能源、生態環境、湖泊、濕地、冰川、大氣、古氣候、動物、水生生物、遙感等多種學科,由中國科學院各學科領域幾十個研究所的科研人員參加建設。科學資料庫基於中國科技網對國內外用戶提供服務,在中國科技網上已建立了集中與分布的Web站點19個,數據量約3250億位元組(325GB)。

背景與歷程

中國科學院作為中國自然科學的研究中心,在長期的科學研究實踐中,通過觀測、考察、試驗、計算等多種途徑產生和積累了大量具有重要科學價值和實用意義的科學數據和資料,但由於管理手段落後,無法充分發揮這些寶貴信息資源的作用。60年代發展起來的資料庫技術,為有效管理和開發套用科學數據創造了有利條件。70年代開始各研究所在自己學科領域中試建資料庫,特別是化學領域的專業庫得到迅速發展。專業庫的建立促進了數據科學管理的進程,然而分散的、獨立的庫,限制了數據規範標準的統一和共享的實現。為此,中國科學院1983年提出了“科學資料庫及其信息系統”的建設項目,1986年被國家計委列為國家“七五”和“八五”期間的重點工程項目。同時,中國科學院將其列入“七五”院重大項目和“八五”、 “九五”院基礎研究特別支持項目;“系統網路軟體開發”又作為國家基金委1995年網路套用重大項目予以支持,使系統不斷取得突破性進展。十多年來,隨著計算機技術的進步和用戶需求的不斷變化,系統也不斷改進和完善。科學資料庫的研製和建設過程正是知識積累、加工、利用和傳播的過程,是跟蹤資料庫技術、網路技術發展和套用的過程,是數據資料逐步規範標準和積累的過程,也是廣大系統建設者與用戶不斷溝通,向實用化發展的過程。為此,科學資料庫及其信息系統1997年獲中國科學院科技進步一等獎,1998年獲國家科技進步二等獎。

科學資料庫經過十幾年的建設和發展,到2001年已經成為國內信息量最大,學科專業最廣,服務層次最高,綜合性最強的科學信息服務系統。同時,也成為科研工作的基礎設施之一,並將成為未來科學研究必不可缺少的資源。2001年後,“科學資料庫及其套用系統”作為中國科學院信息化建設的重要基礎設施,已經納入了中國科學院“十五”期間信息化建設的重大項目,給科學資料庫的建設和發展帶來了一個有利的時機,科學資料庫將在“十五”建設期間得到長足的發展,為社會做出更大的貢獻。

內容與特點

數據資源

科學資料庫由中心站點和分布在網上本地和外地的相互獨立的若干個專業庫子站點組成了網上的科技信息服務體系。

多年來,科學資料庫的研製者利用這批寶貴的數據資源進行了大量的專業諮詢服務、專業套用服務和網上綜合科研信息服務,已在國家經濟建設、國防建設、規劃決策、科學研究、科技攻關、學科發展、國際合作等諸多方面得到套用,取得了顯著的社會效益和一定的經濟效益,在國內外產生了一定影響。

服務系統

多年來,科學資料庫採用邏輯上集中、物理上分布的建庫和運行服務體系,形成了一個從基本的資料庫檢索直至專業諮詢、決策服務的完整的科技信息服務系統。

科學資料庫專業資料庫的研製者將多年科研工作積累起來的寶貴的數據資源收集整理,在不同學科的建庫單位建成了專業資料庫。同時,又將他們的專業知識和多年積累的科研工作經驗相結合,開發出基於專業資料庫的數學模型和專家系統,形成了不同專業的專業諮詢系統、科研過程和生產過程模擬系統,乃至於綜合科研信息服務系統等等實用系統,進行深層次的專業諮詢服務和科學資料庫的增值服務,直接服務於專業研究和國家經濟建設。

1996年科學資料庫率先在中國科技網上建立了中心主站點,開始實現了科學資料庫集中與分布相結合,通過網路向國內外用戶提供服務。幾年來,科學資料庫中心站點將集中在中心的資料庫和分布在中國科技網上的19個子站點的專業資料庫進行分散式的連結或導航,實現了科學資料庫整體上網服務,初步建成了科學資料庫網路信息服務系統。

隨著網路的發展,科學資料庫的套用也越來越廣泛,專業資料庫在擴大用戶面上不同程度的做了很多工作,並逐漸得到社會的重視。網上檢索服務隨著上網內容的不斷增加和充實,日益得到用戶的矚目。1998年化學專業資料庫與上海熱線連線,方便了上海用戶的訪問;中國菌種目錄資料庫已經分別在日本農業網和亞太地區高速網上建立了鏡像。

技術開發

“九五”初期,科學資料庫系統率先採用CGI技術實現了科學資料庫上網服務。隨著網路及資料庫技術的發展,近年來,科學資料庫中心對多層客戶機/伺服器技術進行研究,就www與資料庫之間的多種連線技術進行了跟蹤。實現了科學資料庫系統的開發環境和運行環境的分離,用專業的系統同步軟體來保證運行環境與開發環境的一致性、數據更新的及時性和有效性,採取了一系列最新的安全防範措施來提高整個系統的安全性和可靠性。同時,在多台伺服器上安裝了自行開發的統計分析軟體,用於統計整個Web伺服器的被訪問情況。

2000年科學資料庫有關建庫單位合作完成了863信息技術領域的套用項目《高速計算環境下的科學資料庫套用系統》和國家基金委重大套用項目《高速網路環境下的科學資料庫套用系統》,在高速網和曙光2000-Ⅱ超級伺服器上基於科學資料庫建立了生物,地學,天文三個套用實驗系統,開發了科學資料庫套用系統支撐平台。科學資料庫套用支撐平台是一個集中高性能計算環境、高速網路環境和豐富的中間件軟體環境的綜合系統環境。內容是在中國科學院計算機網路信息中心的格線節點上,基於曙光2000-Ⅱ超級計算機和科學資料庫系統,建立一個集超級計算機、科學資料庫和高速網際網路為一體的技術支撐平台,開發基於科學資料庫的不同專業、不同層次的套用系統。

硬體環境

科學資料庫中心的硬體系統環境是建立了以曙光2000-Ⅱ超級伺服器和SGI Challenge L伺服器為主體,以及若干DEC,IBM,SUN,SGI工作站組成的網上開發和服務環境。曙光2000-Ⅱ超級伺服器包含82個節點,峰值計算能力110G Flops。存儲環境有1.5 TB的磁碟陣列。

組織與管理

科學資料庫建設是中國科學院全院範圍內的跨所聯合,力圖在全院範圍內將研究所多年積累起來的科技信息資源組織起來,與計算機、資料庫和網路等先進技術相結合,對社會提供科技資源共享與服務。科學資料庫的組織形式是以綜合型重大工程項目的方式進行的。從十幾年來科學資料庫的建設和發展的實踐經驗來看,這種組織方式是行之有效的。

科學資料庫在組織實施過程中,實現了跨學科的聯合和數據、人才、技術的集中,體現了中國科學院的整體優勢,在建立中國科學院和國家科研工作的基礎體系中起到了龍頭的牽引帶動作用,提升了專業資料庫的技術能力,綜合能力和整體服務能力。

⒈管理模式

多年來,科學資料庫在科學資料庫專家委員會的領導下,由科學資料庫辦公室進行課題管理,各建庫單位負責對本單位的建庫課題進行組織實施。

科學資料庫的組織管理結構採用以下方式:

⑴科學資料庫專家委員會

專家委員會是科學資料庫的學術領導機構,在院的領導下,負責中國科學院科學資料庫有關重大問題的決策和管理。負責制定科學資料庫的發展規劃和實施計畫,確定經費的具體資助範圍和原則,審定資助的項目及經費分配方案,檢查監督項目的執行情況。課題成果的評審、鑑定、驗收,由專家委員會組織進行。

⑵科學資料庫辦公室

科學資料庫辦公室是專家委員會的辦事機構,設在中國科學院計算機網路信息中心。課題的內容、目標和經費經專家委員會審定立項後,由科學資料庫辦公室按照院重大工程項目的管理辦法進行管理。課題契約的檢查驗收,由科學資料庫辦公室組織進行。

組織實施

⑴專家論證

科學資料庫課題的立項,要經過科學資料庫專家委員會的論證和答辯,確保課題實施的可行性。

⑵目標管理

經專家論證立項的課題,由科學資料庫辦公室負責組織簽訂《中國科學院重點項目課題任務書》,確定項目內容和目標,實行目標管理。

⑶過程控制

為了有效地促進科學資料庫建設的發展,實現預定的目標,科學資料庫辦公室按照簽訂的契約指標,嚴格進行建設過程的控制。每年對課題組織年度工作檢查,進行過程控制。一旦發現課題執行過程中的問題,及時提交專家委員會決策解決。

⑷滾動支持

科學資料庫課題的管理,實行滾動支持。鼓勵先進,淘汰落後,以便促進科學資料庫事業的發展。

方向和目標

科學資料庫及其套用系統作為中國科學院信息化建設的重要基礎設施,已經納入了中國科學院“十五”期間信息化建設的重大項目,給科學資料庫的發展帶來了一個有利的時機。

科學資料庫及其套用系統在“十五”期間的總體發展目標是在繼續擴大數據資源的基礎上,促進數據向知識的轉化,完善信息化的科學研究環境,初步建成面向科學研究和社會的科技信息服務體系。

“十五”期間,科學資料庫及其套用系統建設任務包括數據資源建設、標準規範建設和系統平台建設三個方面。

⑴數據資源建設

科學資料庫數據資源建設是繼續加強科學數據資源的採集和積累,擴大現有專業資料庫範圍,注重數據的完備性,系統性,內容和形式的多樣性,在全院範圍內逐步建立學科門類完整的專業資料庫群體,為建設信息化的科學研究環境提供數據資源保障,為知識創新服務。主要任務是在全院範圍內初步建成包括化學、天文學、材料科學、能源科學、海洋科學、生物學、地球科學、信息科學等學科門類基本完整的科學資料庫群體,使科學資料庫系統的建庫單位的數量接近40個,學科門類逐步趨於完整;專業子庫數量達到300個,專業庫種類包括數值庫、事實庫和多媒體庫;科學資料庫總數據量達到10TB。同時,建成1-2個數字標本館套用實驗系統。

⑵標準規範建設

科學資料庫標準規範建設是將科學資料庫系統作為一個相對獨立和完整的系統,研究、制定該系統相應的標準與規範,形成其特有的標準規範體系,用以規範化科學資料庫數據資源的建設、數據共享與服務,保證數據資源的質量,提高科學資料庫的管理和服務水平,為科學資料庫的持續發展奠定良好的基礎,為科學資料庫實現從數據向信息和知識的轉化服務,為科學資料庫開發先進套用系統服務。在“十五”期間的標準規範體系建設包括數據標準體系、科學資料庫元數據標準體系、科學資料庫管理規範體系三大部分。主要任務是提交一套科學資料庫標準規範。內容包括科學資料庫元數據標準框架,科學資料庫元數據標準集,科學資料庫數據質量評估標準,科學資料庫數據共享政策與規範等。

⑶系統平台建設

科學資料庫系統平台建設是運用IT技術的新進展,對大規模、分散式、異構的科學資料庫中的數據資源進行整合,實現全方位、深層次的資源共享,並在高性能環境的支持下開發基於科學資料庫的先進套用系統,使科學資料庫的發展能夠滿足未來科學研究的需要,使科學資料庫能夠成為未來信息化科研環境的核心組成部分之一。主要任務就是建設面向科學資料庫未來五年發展需要的軟硬體支撐環境;在數據整合與規範化的基礎上,實現對數據資源的統一訪問與充分共享;為科學資料庫科技信息服務體系的建設和先進套用系統的開發提供有力的支持。同時,建立科學數據中心和專業領域數據分中心。通過建立數據中心提供科學資料庫集存儲、超級計算機、高速網路等軟硬體一體化的信息共享平台,並對科學資料庫建庫單位提供技術支持和培訓;通過建立專業領域數據分中心,規劃、設計和集成專業領域資料庫資源,逐步實現系統化和完備化,組織學科領域標準規範的制訂和實施,進行學科領域數據分中心的系統平台建設,開展專業領域的套用,提供專業領域綜合科技信息共享與服務。系統平台建設還要開發有典型意義的科學資料庫先進套用系統。這些套用系統應能充分利用和發揮科學資料庫數據資源的綜合優勢,成為未來科學研究工作中的重要工具或環境。

相關詞條

相關搜尋

熱門詞條

聯絡我們