基本概況
地震科學數據 資料庫建庫指南Guidelines
for the establishment of
earthquake-related databases
(試用稿)
(本稿完成日期:2006年2月20日)
中國地震局 發布
前 言
本標準是《地震科學數據》系列標準的第三項,該系列標準的結構為:——地震科學數據 元數據編寫指南;
——地震科學數據 數據模式編寫指南;
——地震科學數據 資料庫建庫指南;
——地震科學數據 數據元目錄;
本標準由中國地震局地震科學數據共享工程標準組提出並歸口。
本標準起草單位:中國地震台網中心、中國地震局地球物理研究所。
本標準主要起草人:代光輝、顧左文、趙仲和、馮義鈞、周克昌、黃志斌、吳敏、楊輝、趙宇彤、紀壽文、田豐。
目 次
引 言.....................................41範圍......................................5
2規範性引用檔案............................5
3術語和定義................................5
4共享地震資料庫體系結構.....................6
5共享地震資料庫建庫原則.....................7
6共享地震資料庫管理系統配置.................7
7共享地震資料庫表結構設計...................8
8共享地震資料庫數據入庫軟體開發.............8
9共享地震資料庫質量保證.....................8
10共享地震資料庫安全保障....................9
11共享地震資料庫元數據編寫..................9
12共享地震資料庫數據模式編寫................9
13共享地震資料庫建庫文檔編寫................9
引 言
關於建立資料庫的一般性要求和方法已在相關規程、規範和IT技術資料中有充分的論述,本標準不涉及建立資料庫的一般性問題,只是根據科學數據共享工程的要求和地震數據的特點,對建立地震科學數據共享資料庫所涉及的全局性問題做統一的規定,或提出基本要求和原則。隨著工程的實施,本標準的內容會進行修改和擴充,有些內容可以進一步細化,形成相應的技術標準和規範。
1 範圍
本標準規定了在地震科學數據匯交到地震科學數據共享中心和分中心(或區域節點)後,為了高效、高質量地進行地震科學數據的管理和共享服務,在建立地震科學數據共享資料庫時應遵循的基本原則和要求。內容包括共享地震資料庫體系結構、共享地震資料庫建庫原則、共享地震資料庫管理系統配置、共享地震資料庫表結構設計、共享地震資料庫數據入庫軟體開發、共享地震資料庫質量保證、共享地震資料庫安全保障、共享地震資料庫元數據編寫、共享地震資料庫數據模式編寫和共享地震資料庫建庫文檔編寫等。本標準適用於地震科學數據共享工程建設中各級、各類共享地震資料庫的建設。
2 規範性引用檔案
下列檔案中的條款通過本標準的引用而成為本標準的條款。凡是註明日期的引用檔案,其隨後所有的修改單(不包括勘誤的內容)或修訂版均不適用於本標準。然而,鼓勵根據本標準達成協定的各方研究是否可使用這些檔案的最新版本。凡是不註明日期的引用檔案,其最新版本均適用於本標準。GB/T 13725-2001 建立術語資料庫的一般原則與方法
GB/T 17532-1998 術語工作 計算機套用 辭彙
GB 17859-1999 計算機信息系統安全保護等級劃分準則
GB/T 18207.1-2000防震減災術語 第1部分:基本術語
DB/T 11.1-2000 地震數據分類與代碼 第1部分:基本類別
GA/T 389-2002 計算機信息系統安全等級保護資料庫管理系統技術要求
EDS/T1-2005 地震科學數據 元數據編寫指南
EDS/T2-2005 地震科學數據 數據模式編寫指南
EDS/T4-2005 地震科學數據 數據元目錄
3 術語和定義
下列術語和定義適用於本標準。3.1 資料庫 database
長期存儲在計算機中,有組織、可共享的數據集合。[GB/T 17532-1998, 7.5]
3.2 地震數據 earthquake-related data
與地震的孕育、發生、地震動傳播及地震所造成的後果以及減輕地震災害相關聯的數據。[DB/T 11.1-2000]
3.3 地震資料庫 earthquake database
以地震數據為主要內容的資料庫。根據地震數據的分類,有針對不同類型地震數據的地震資料庫 (關於地震數據的分類,參見DB/T 11.1-2000)。
3.4 共享地震資料庫 shared earthquake database
按照地震科學數據共享工程的要求建立的地震資料庫。
3.5 地震資料庫系統 earthquake database system
由地震資料庫、資料庫管理系統、計算機軟硬體平台組成的數據匯集、存儲、管理與服務系統。
4 共享地震資料庫體系結構
4.1 共享地震資料庫的分級共享地震資料庫由國家級共享地震資料庫和區域級共享地震資料庫構成。國家級共享地震資料庫匯集、存儲和管理全國範圍的某種類別的共享地震數據,也包括有關的國際地震數據。區域級共享地震資料庫匯集、存儲和管理一個區域(一個或幾個省(自治區、直轄市))範圍的某種類別的共享地震數據。
4.2 共享地震資料庫的分類
共享地震資料庫應按《地震數據分類與代碼》中規定的數據大類、中類和小類的劃分方法進行分類和命名。
如果一個資料庫中存儲兩種以上(含兩種)的中類地震數據,則為綜合共享地震資料庫。
4.3 共享地震資料庫的體系結構
共享地震資料庫是層次型分散式的體系結構。
共享地震資料庫按照資料庫的級別分為兩個層次,即國家層次的共享地震資料庫和區域層次的共享地震資料庫。
國家層次的資料庫按照不同的類別分布在數據共享中心和各個分中心,區域層次的資料庫按照不同的地域分布在各個區域節點。各個站點資料庫局部自治,但國家層次的資料庫要與同種數據類型的區域層次資料庫間通過複製相互交換數據。
5 共享地震資料庫建庫原則
5.1 統一規劃,分級實施共享地震資料庫建設要在科技部和中國地震局科學數據共享工程領導小組的統一規劃和指導下進行。地震科學數據共享中心、分中心和區域節點應按照各自的管理許可權負責本級資料庫的建設工作,並對所建資料庫的內容和質量負責。
5.2 擇優選取數據源
不同來源匯交的同類地震數據,特別是經過加工處理的數據,會因處理方法、處理人員的不同而有所差別,地震科學數據共享中心、分中心和區域節點在建立資料庫之前要進行仔細甄別,選擇權威的、能長期供給的數據建立資料庫。
5.3 統一資料庫結構
為了方便數據交換和套用開發,國家級與區域級共享地震資料庫中同類數據的資料庫表結構應統一。
5.4 保證數據質量
地震科學數據共享中心、分中心和區域節點要採取必要的技術和管理措施保證入庫數據的準確性和完備性。
5.5 保障資料庫安全
地震科學數據共享中心、分中心和區域節點要採取必要的技術和管理措施保障資料庫不被破壞和非法訪問。
5.6 遵循標準規範
地震科學數據共享中心、分中心和區域節點在建立共享地震資料庫時要統一遵循科學數據共享工程制定的各項標準和規範。
6 共享地震資料庫管理系統配置
6.1 地震科學數據共享中心、分中心和區域節點應配置專門的資料庫管理系統存儲和管理共享地震資料庫,條件允許還可配置資料庫集群以均衡負載。6.2 共享地震資料庫管理系統宜選用流行的、有較高性能的、支持安全性的關係型或對象關係型資料庫管理系統,如Oracle、SQL Server、DB2、Sybase或Mysql等。
6.3 地震數據不斷累積、較少修改的特點,和大量用戶查詢下載地震數據的共享要求,決定共享地震資料庫管理系統的參數設定和支撐硬體平台的配置應向有利於高效查詢的方向調優(類似於OLAP)。
7共享地震資料庫表結構設計
7.1 共享地震資料庫的資料庫名、表名和欄位名應採用英文字母、數字和下劃線進行命名,而且第一個字元必須是字母。資料庫採用“‘對應數據的分類代碼’+‘_’+‘實體英文全稱或縮寫’”形式命名;表採用“‘T_’+‘實體英文名全稱或縮寫’”形式命名;欄位採用“‘F_’+‘實體的屬性英文名全稱或縮寫”形式命名。名稱由多個單詞構成時,每個單詞首字母大寫,單詞間不分隔。7.2 共享地震資料庫的表結構宜按第三範式的要求進行規範化處理,以減少數據的冗餘。
7.3 在設計共享地震資料庫表結構時要充分考慮數據間的關聯性,既要考慮在同一大類的不同類型數據的表間建立關聯,還要考慮在不同大類的數據表間建立關聯,以利於數據的綜合查詢。
7.4 對於查詢中需要作為查詢條件的欄位,宜考慮建立索引。
7.5 已有國家或行業資料庫規範的地震數據,其表結構按相應的規範要求設計。
7.6 包含多種數據類型的專項數據的資料庫表結構應參照各單項數據的資料庫表結構進行設計。
8 共享地震資料庫數據入庫軟體開發
8.1 在建立共享地震資料庫時,應開發相應的數據入庫軟體。8.2 數據入庫軟體應具備數據項類型檢查、數據項取值範圍檢查、數據記錄完整性檢查和重複記錄檢查等數據有效性檢驗功能及入庫日誌記錄功能。
8.3 數據入庫軟體應保證數據在轉換、合併和匯總時的精確性和完備性。
9 共享地震資料庫質量保證
9.1 在數據入庫前要確認數據來源的權威性。9.2 數據批量自動入庫後應及時查看數據入庫日誌,確認數據入庫的正確性和完整性。
9.3 手工錄入的數據應逐條進行審核,確保入庫數據與原始數據的一致性。