格線是什麼?
格線計算機是集成分散式系統部件(例如:計算機系統、存儲器等等)的硬體和軟體系統,使用戶把它們看成是單個大型“虛擬化”計算系統。“單個系統”的基本概念會套用於建設集中化“集群”計算機(由配置好的計算機和存儲器組成的多處理器系統),和地理位置分散的計算機、儀器和其他資源組成的聯網格線。
通過格線計算,計算機系統和其他資源不一定被限制於專用與個人用戶或套用,而能用於動態冷卻或共享,以滿足公司不斷變化的需求。使用網際網路、基於格線的資源共享和協作問題解決能延伸至多機構的“虛擬單位”。
選擇“格線計算”的名稱是因為它的概念與電力格線相似,後者滿足客戶對於電力的套用,這是通過在由所有用戶共享的電力生成資源的分散式格線上的明顯的製圖。
格線的優勢
因為格線計算作為非常靈活、也許甚至是全能、分散式系統技術發展起來的技術,它提供許多用法和優勢,能大致劃分為以下幾種:
高性能計算(HPC):對於能用於並行計算的套用來說,在由眾多小型或專業系統組成的聯網計算機系列上,格線提供執行計算密集套用的可能。與傳統的超級計算機相比,計算格線能提供性價比和最大性能的可觀的優勢。於是,格線使HPC可接入更多企業、促進計算密集型計算結果可用性,它是產品研究和部署所需的,使科學家能解決對於傳統超級計算機來說是難以完成的“巨大挑戰”的問題。
在目前的發展環境中,大多數格線套用都屬於HPC類型。這是由於格線計算源於對更經濟的HPC解決方案的需求這一事實,該解決方案解決了科學和工程的關鍵問題。由於投資高回報,以及解決了以前在合理時間或成本下無法解決的計算密集型問題,格線最初被商業企業採用一直集中於HPC。HPC格線成功地解決了以下領域的廣泛的計算問題:
氣候/天氣/海洋建模與模擬 計算化學和材料科學 環境質量建模與模擬 軍事建模與模擬 網際網路搜尋引擎 藥物研究 電子與機械設計模擬與證實 地震處理與解釋 信號/圖像處理 財務投資與市場建模 數據聯盟與協作;格線還能聯合到數據綜合,不同來源的數據(相關資料庫、檔案、或套用數據),能統一到單一數據服務,該服務隱藏了數據地址、本地所有者、和消耗源設施的複雜性。憑藉數據聯盟,數據停留在原位置,不影響本地用戶、應用程式和數據管理政策。多來源、多地點的數據的綜合有利於更廣反的集合套用,包括公司業績記錄表、市場分析工具、客戶服務套用、和數據挖掘套用。因為數據資源在網路上被訪問,因此要求現有數據公布或消耗數據的套用最小的更改。
資源分配與最佳化:大多數桌面系統和伺服器閒置時間超過80%,因為計算機傳統上被嚴格專用於某組用戶和套用。格線計算提供虛擬結構,它能實現靈活的計算和存儲共享,以提高資源利用率。舉個最簡單的例子,批量任務能透明地分配給資源庫中的閒置伺服器。另一種可能,應用程式和工作都能被傳輸到一個閒置伺服器。另外,如果安裝虛擬機器軟體,單個物理伺服器甚至能配置到運行不同作業系統和應用程式。同理,閒置的配置在網路上的存儲器,或SAN的存儲容量,能被利用於數據存儲器。通過虛擬化行程實現的資源最佳化帶來的主要優勢是,它收回計算設施的大量碎片空間,因此降低了支持特定IT功能水平所需的資本投資水平。資源最佳化的另一個方面在於,它通常不需要現有應用程式的更改。由於所有3類格線都依賴於好的用於互連分散式系統部件的網路性能,HPC到目前為止對網路提出了最高的要求。因為HPC套用的格線形式這一事實可能涉及到密集的進程內通訊,該通訊對網路頻寬和時延特性高度敏感。為此,此文以下部分將集中於HPC計算格線特性。
格線剖析
簡化的基本格線結構如圖1所示,格線中間設備提供地址透明,使應用程式能運行在虛擬聯網資源層上。中間設備的主要特點是,它使格線看起來是一個計算機系統,在組成格線的所有計算資源中提供協調。這些功能通常包括處理資源發現和監控的工具、資源分配與管理、安全、性能監控和計費。
商業格線中間設備可從許多系統廠商和獨立軟體廠商(ISV)獲得。大多數這種軟體具有所有權,然而也可得到廣泛的開放源中間設備。一個開放源格線中間設備值得注意的案例是,源於研究團體對成功HPC格線的發展形成的Globus工具包。現在(GGF)正在使用Globus,將它作為開發行業標準的基礎,促進格線間的互用性。大多數系統廠商和ISV支持GGF試圖最終提供負荷行業標準的所有者中間設備的努力。
GGF已經開發了開放格線服務結構(OGSA),從基於標準的服務導向結構(SOA)的角度看,它本質上徹底改變了格線,在SOA中,格線服務僅僅是種特殊的網路服務類型。和其他網路服務一樣,能使用一種網路服務定義語言術語(WSDL)定義OGSA格線服務。將格線轉變為網路服務模式的優勢在於,它使用現有標準,如SOAP、XML和WS-Security,為接入網格資源提供可擴展結構。OGSA開放源執行Globus工具包3.0,延伸了Globus工具包2.0的主要觀點,繼續支持現有Globus API和WSDL接口。
TCP/IP和其他IETF標準使網際網路和企業網的不同類型的系統之間互用通信。同理,GGF的OGSA有意制定標準,這些標準將能在分布於網際網路的不同類型系統之間互用格線計算。開放格線服務設施(OGSI)定義這種機制為,在基於不同中間設備執行的格線服務間創建、管理和交換信息。
除了GGF,(EGA)是新的廠商和最終用戶聯盟,致力於開發企業格線解決方案。EGA章程是集中於格線的商業套用,甚於技術或科研超級計算套用。EGA對位於企業數據中心的戰略格線特別感興趣,想要儘可能多地建設套用、伺服器、SAN和網路的現有基礎設施。EGA特别致力於數據中心,而非網際網路擴展格線或者擴展虛擬機構等更廣泛的問題。EGA通過儘可能地採納現有標準、促進在明後兩年內出現的開放、互操作的解決方案,希望採取實際的措施。
相比之下,所有者格線軟體主要關注於個人企業的需要,在這樣的企業中,多廠商產品互操作性、系統異類、和網際網路可擴展性在當前格線發展階段還算不上問題。因此,有理由期待在以後幾年中,格線中間設備將在三條路線上平行重疊發展:
符合標準的開放源 非標準開放源 所有權,包括廠商支持的開放源或符合OGSI的工具 不論動機與目標如何不同,所有類型的格線中間設備都需要解決支持格線範例的一套基本功能。
發現與監控:格線上的系統必須能發現何種資源或服務可用,並能監控其狀態。一旦識別資源,為了定義工作的格線拓撲,必須能訪問系統配置和狀態信息。格線發現和監控服務常常基於現有工具,如LDAP、DNS、網路管理協定、和檢索服務。