中國空間科學數據中心簡介
定位與使命
空間科學數據中心是面向科研教育、社會發展和國家安全等提供空間科學數據資源服務和信息技術服務的科研部門,是國際科學理事會(ICSU)所屬的世界數據系統(WDS)組織的正式成員之一。其使命是整合、最佳化空間科學數據資源,重點實現空間科學數據管理的完整性、系統性和規範化,確保空間科學數據的永久安全和長期可用,提升數據套用的水平與效益。同時開展國際空間科學數據的交換共享,努力成為我國空間科學領域重要的科研基礎設施 。
學科方向
空間科學數據中心面向空間科學領域,開展科學數據的標準規範、管理建模和共享套用的理論與方法研究,研發日地空間數據的處理、標校、質量控制、融合與產品加工,日地空間信息的表示、組織、管理與互操作,日地空間信息的呈現、挖掘與可視分析,日地空間信息/模式系統集成及面向領域套用的雲計算等學科信息化技術,促進e-Science技術在空間科學領域的套用,推動空間科學信息學的發展 。
任務情況
空間科學數據中心先後承擔了中國科學院空間科學戰略性先導科技專項、載人航天、子午工程等空間科學領域的重大科研任務,國家“863”計畫、國家“973”計畫,中科院知識創新項目,中科院信息化項目,科技部科研基礎設施共享平台等多項科研課題。共發表論文三十餘篇,合著專著一部。相關科研成果曾獲科技進步獎及多項軟體著作權 。
數據資源
空間科學數據中心的數據資源涉及日地空間物理和行星科學等學科領域,目前共建有13個專業資料庫,66個典型數據集,300餘種數據產品,數據總量近100TB。
日地空間物理的數據資源涉及太陽觀測,行星際輻射環境,磁層觀測,地球衛星軌道空間環境,電離層觀測,中高層大氣觀測,地磁地電,地面宇宙線強度,空間環境效應、指數和空間天氣災害事件編目的地基觀測數據和天基觀測數據。總計11個大類別,66個典型數據集(合)。
作為空間科學先導專項永久的數據中心,隨著暗物質粒子探測衛星和實踐十號返回式科學實驗衛星的成功發射,以及即將發射的量子科學實驗衛星、硬X射線調製望遠鏡衛星、中法合作的太空望遠鏡項目SVOM衛星、中歐合作的太陽風—磁層相互作用全景成像衛星計畫等,還將極大的豐富我們的空間物理、空間天文和空間實驗數據資源 。
服務
空間科學數據中心(www.cssdc.ac.cn)可為用戶提供數據的線上共享、數據產品加工製作、數據分析工具、模式計算、可視化繪製等專業化服務。日地空間系統研究網路、空間科學虛擬觀測台和空間科學任務運行官網是空間科學數據中心的主要產品。
1、日地空間系統研究網路(http://starnet.cssdc.ac.cn/)
日地空間系統研究網路提供任務論證分析工具、衛星運行支持工具、空間物理模式、數據分析與通用工具包等學科知識資源和雲存儲、雲計算、科研協同環境等信息化基礎設施資源,在科學大數據時代背景下改變傳統科研模式,支撐以空間科學先導專項為代表的科學衛星全生命周期各階段任務,促進科研創新活動成果產出。
2、空間科學虛擬觀測台(http://vsso.cssdc.ac.cn/)
空間科學虛擬觀測台主要向用戶提供從大氣熱層空間到太陽光球表面的日地空間範圍、太陽系空間和宇宙空間發生的基本物理過程等進行觀測的各類數據,平台不僅提供常規的數據檢索與下載服務,還提供數據格式轉換、坐標系轉換以及事件關聯數據分析等基本的分析工具服務。
此外,作為科技部、財政部認定的國家科技基礎條件平台之一的地球系統科學數據共享平台空間科學數據中心,以地球系統科學研究和社會經濟可持續發展需求為背景,整合了空間科學與人地關係研究所需的數據資源,開展了空間天氣與人類活動相關的專題數據的集成和加工工作,用戶可以線上的獲取各類數據產品 。
分散式空間數據中心繫統介紹
空間衛星數據的共享與分析對於開展空間科學研究是至關重要的。 當前世界各國很多空間科學研究機構都擁有海量的空間衛星數據,但是彼此之間的數據共享卻並不通暢,往往都是採取相互複製副本的方式進行共享。 這種方法既低效,又浪費大量的存儲空間。 而且不同的衛星數據還存在數據格式的問題,由於不同的數據分析軟體對數據格式有不同的要求,因此數據格式的轉換也帶來了很大的麻煩。 此外,衛星數據的繪圖分析需要很高的編程知識,這對研究人員是一個很高的要求,非常不利於他們集中精力開展空間科學物理過程的研究。 數據管理系統與數據分析軟體不能很好地集成,導致數據管理與分析的脫節。為此,開發一個集成了高效的數據管理以及數據分析功能的系統顯得尤為重要。本文結合世界空間科學研究領域中數據管理、 數據分析的需要與資料庫、Web Service 等多種計算機技術,提出了分散式空間數據中心繫統,實現了空間數據的分散式存儲與聯合檢索。 系統還提供了基於Web Service 方式的衛星數據格式轉換功能, 並藉助於 MatlabWeb Server 以及 IDL on Net 提供了集成化的線上繪圖分析功能,有效地解決了空間衛星數據存儲、共享、數據格式轉換以及數據分析的問題。 研究人員不用編寫數據分析程式即可在集成化的界面中進行數據搜尋、下載、格式轉換,以及對搜尋到的數據方便地開展線上繪圖分析工作。
系統主要包括五個部分:衛星數據元資料庫、繪圖引擎、真實數據、Web Service 提供者以及將這四個部分聯繫起來的 Web 伺服器 。
衛星數據元資料庫
衛星數據元資料庫是構建分散式空間數據中心的關鍵。 傳統的數據中心都是將真實的數據存儲在資料庫中的,並從此資料庫中直接進行數據搜尋與下載。 而元資料庫存儲的只是衛星數據的描述信息,包括其衛星名稱、採集儀器名稱、數據提供者、精度、所含內容、時間段、下載方式以及數據的 URL 等。 真實的數據並不存儲在此資料庫中,而是存儲在元數據信息中 URL 所指向的位置。 通過對外部開放元資料庫,不同的研究機構可以將要共享的數據的元信息添加到元資料庫里,並自己維護好可提供下載功能的真實數據伺服器,這樣就實現了數據的分散式存儲,提供了進行多機構數據聯合查詢的基礎,消除了由於拷貝副本而帶來的時間以及存儲空間的巨大浪費和不便,解決了海量數據存儲的問題 。
繪圖引擎
系統藉助於 Matlab Web Server 以及 IDL on Net 設定了繪圖引擎,從而提供了衛星數據線上繪圖分析功能。
Matlab 是 MathWorks 公司推出的一套高性能的數值計算和可視化數學軟體,具有很強的圖形功能,可以方便地實現數據的可視化,是涉及數據分析的學科研究中不可不用的工具。利用Matlab 可以較為方便地進行衛星數據繪圖。 Matlab Web Server使得Matlab可以支持 Web 套用,隨時隨地通過Internet將數據傳送給 Matlab Web Server,藉助 Matlab 強大的計算與繪圖功能,獲得計算的結果或相應的圖形。IDL( Interactive Data Language) 是美國 RSI 公司推出的專為可視化大型而複雜的數據集而設計的語言。 從簡單的 2D 繪圖和圖像顯示到利用 OpenGL 硬體加速功能進行互動式的 3D 圖形設計,IDL 均可勝任。 IDL on Net( ION) 是 IDL 的一個模組,它將 IDL 這一功能強大的語言和其特定標識邏輯地嵌入到網頁中,使得可以在網頁中直接顯示 IDL 的繪圖結果。
繪圖引擎上配置了 Matlab Web Server 以及 ION,使得系統可以提供 Web 形式的數據繪圖分析功能,並可針對不同的衛星數據選用不同的繪圖工具,以簡化系統實現。 最重要的是,針對已經添加到系統的衛星數據,在繪圖引擎中部署了相應的 Matlab 或者 IDL 繪圖程式,包括繪製磁場、電場、頻譜分析等的程式。
用戶需要繪圖時,根據傳進來的參數,通過 Matlab WebServer 或者 ION 調用相應的繪圖程式進行繪圖,並以頁面的形式向用戶返回繪圖結果 。
Web Service 提供者
Web Service 是構建新一代網際網路分散式系統的基本部件。通過對外發布 API及其接口描述信息, 用戶就可以通過 Internet調用其提供的服務。 開發人員只需了解其接口信息,而不必關心其具體實現以及平台特性。 當前,Web Services 正成為套用集成的有效平台。
為了方便開展衛星數據格式轉換工作,CDF 辦公室發布了一組具有數據格式轉換功能的 Web Service:Data Translation Web Service (DTWS), 可以對遠程的衛星數據進行格式轉換。 本系統集成了 DTWS,從而提供了強大的數據格式轉換功能 。
Web 伺服器
Web 伺服器是系統各部分相互聯繫的紐帶,它除了提供基本的 Web 服務功能外,還提供了數據提取服務。 由於一個衛星數據中往往包含了很多分量,例如磁場、電場、組份等,而研究人員可能只想下載其中的某些分量。 系統通過在 Web 伺服器上部署數據提取程式滿足了這種需求。 這些程式都是以 CGI 的方式部署在 Web 伺服器上的,根據不同的命令參數,會調用相應數據提取程式 。
系統的工作流程
首先,各個參與合作的科研機構將自己要共享的數據的元信息添加到衛星數據元資料庫。 研究人員通過在瀏覽器里輸入檢索參數進行數據檢索,檢索參數將會被提交到元資料庫進行查詢,並向用戶返回符合條件的數據的描述信息以及數據的URL。 用戶要下載數據時,只需點擊該數據,用戶的瀏覽器就會根據該數據的 URL 與真實數據所在的伺服器直接建立連結並下載數據。 這樣就實現了在統一的界面中檢索與下載分布在不同的科研機構的數據。 此過程將數據的檢索與下載分離開了:在元資料庫檢索,而從真實數據所在的伺服器進行下載,這樣既解決了數據存儲與共享的問題,又有效地解決了數據下載的網路流量瓶頸問題。
要對搜尋到的數據進行數據格式轉換時,用戶只需點擊相應的連線,Web 伺服器將提取相應數據的元信息,包括其 URL,並以這些信息作為參數調用 Web Service 提供者提供的數據格式轉換服務。 URL 所指向的數據將會被上傳到 Web Service 所在的伺服器進行格式轉換,轉換完成後會向用戶返回一個結果檔案下載列表,用戶就可以進行結果檔案的下載了。也以設定為將轉換結果檔案自動傳送到用戶的電子信箱,這樣用戶就不用等待轉換過程的完成。
當用戶要對檢索到的衛星數據進行繪圖分析時,繪圖命令以及相關參數會經由 Web 伺服器被傳送到繪圖引擎,繪圖引擎根據接收到的元數據信息,先從真實數據所在伺服器處下載數據,然後根據繪圖參數調用相應的繪圖程式進行繪圖。如果數據格式不符合程式要求,繪圖引擎會自動調用 Web Service 提供者提供的格式轉換服務進行數據格式轉換,然後下載轉換得到的結果檔案進行繪圖。 繪圖結果將以 HTML頁面的形式返回給用戶。在此過程中,繪圖所要用到的衛星數據並沒有下載到研究人員的計算機里 。
原型系統
基於以上的研究,以 Linux、Apache、MySQL資料庫、Java 以及PHP為軟體平台,開發了一個原型系統,實現了數據添加、搜尋、下載、數據格式轉換以及繪圖功能。 在進行數據檢索的界面,既可以通過設定時間段,也可以通過選擇檔案所包含的內容,例如磁場、電場等進行檢索。
對檢索到的數據,可以選擇要繪圖的分量,然後點擊繪圖按鈕直接進行繪圖,也可以在一個界面中同時對多個數據進行繪圖,繪圖結果還可以在 GSM、GSE 以及SM 坐標系間進行轉換,以便進行對比研究。此外,系統是高度可擴展的,要添加新的繪圖功能,只需在繪圖引擎中加入相應的程式即可實現 。