格線計算
概述
一個集成的計算與資源環境稱為格線。 基於格線的問題求解叫格線計算 。格線計算是伴隨著網際網路而迅速發展起來的,專門針對複雜科學計算的新型計算模式。這種計算模式是利用網際網路把分散在不同地理位置的電腦組織成一個“虛擬的超級計算機”,其中每一台參與計算的計算機就是一個“節點”,而整個計算是由成千上萬個“節點”組成的“一張格線”,所以這種計算方式叫格線計算。這樣組織起來的“虛擬的超級計算機”有兩個優勢,一個是數據處理能力超強;另一個是能充分利用網上的閒置處理能力。實際上,格線計算是分散式計算(Distributed Computing)的一種,如果我們說某項工作是分散式的,那么,參與這項工作的一定不只是一台計算機,而是一個計算機網路,顯然這種“螞蟻搬山”的方式將具有很強的數據處理能力。充分利用網上的閒置處理能力則是格線計算的有一個優勢,格線計算模式首先把要計算的數據分割成若干“小片”,而計算這些“小片”的軟體通常是一個預先編制好的螢幕保護程式,然後不同節點的計算機可以根據自己的處理能力下載一個或多個數據片斷和這個螢幕保護程式。於是“演出開始了”,只要,節點的計算機的用戶不使用計算機時,屏保程式就會工作,這樣這台計算機的閒置計算能力就被充分地調動起來了。
格線計算功能
第一,格線的網際網路比Internet具有更大的頻寬。歐美的格線計畫都會使用更高速度的主幹網;
第二,格線上將有更多高性能計算機作為節點,因此格線的計算速度、數據處理速度可以大幅度提高。
第三,格線的體系結構將比Internet更能有效地利用這些資源。
第四,格線將促進更多、更大的網路區域的出現。這些相互聯結的區域最終成為一個龐大的格線區域,把我們地球上所有計算機聯為一體。
格線計算的套用
(1) 格線計算在科研領域的套用
在科學研究領域,格線技術可以輔助科學家完成重大領域的科學研究。格線計算技術除具備超級計算能力以外,還將不同地域的資源整合在一起,使科學工作者能夠緊密合作,充分利用共享的資源(如大型的昂貴的儀器設備等)。格線計算技術在美國,首先是在生命科學領域,正在成為現實。在物理學研究方面,德國Max Planck引力物理研究所與德國和美國多個機構合作,利用格線的超級計算能力,共同完成了模擬黑洞的項目。
(2) 格線計算在企業及居民日常生活中的套用
格線計算的商業套用前景廣闊.格線計算環境能夠提高或拓展企業內所有計算資源的效率和利用率,通過對這些資源進行共享、有效最佳化和整體管理,使各企業解決以前難以處理的問題,最有效地使用他們的系統,滿足客戶要求並降低他們計算機資源的擁有和管理總成本.格線計算支持所有行業的電子商務套用。例如,飛機和汽車等複雜產品的生產要求對產品設計、產品組裝和產品生命周期管理進行計算密集型模擬.中國國家計算格線簡稱織女星格線(VegaGrid),該項目前取得的一些研究成果已經開始套用到如稅務這樣的重要行業。
集群計算
集群計算指的是計算機集群將一組鬆散集成的計算機軟體或硬體連線起來高度緊密地協作完成計算工作。在某種意義上,他們可以被看作是一台計算機。集群系統中的單個計算機通常稱為節點,通常通過區域網路連線,但也有其它的可能連線方式。集群計算機通常用來改進單個計算機的計算速度和/或可靠性。一般情況下集群計算機比單個計算機,比如工作站或超級計算機性價比要高得多。
根據組成集群系統的計算機之間體系結構是否相同,集群可分為同構與異構兩種。集群計算機按功能和結構可以分為,高可用性集群(High-availability (HA) clusters)、負載均衡集群(Loadbalancing clusters)、高性能計算集群(High-performance (HPC)clusters)、格線計算(Grid computing)。
高可用性集群,一般是指當集群中有某個節點失效的情況下,其上的任務會自動轉移到其他正常的節點上。還指可以將集群中的某節點進行離線維護再上線,該過程並不影響整個集群的運行。
負載均衡集群,負載均衡集群運行時,一般通過一個或者多個前端負載均衡器,將工作負載分發到後端的一組伺服器上,從而達到整個系統的高性能和高可用性。這樣的計算機集群有時也被稱為伺服器群(Server Farm)。一般高可用性集群和負載均衡集群會使用類似的技術,或同時具有高可用性與負載均衡的特點。Linux虛擬伺服器(LVS)項目在Linux作業系統上提供了最常用的負載均衡軟體。
高性能計算集群,高性能計算集群採用將計算任務分配到集群的不同計算節點兒提高計算能力,因而主要套用在科學計算領域。比較流行的HPC採用Linux作業系統和其它一些免費軟體來完成並行運算。這一集群配置通常被稱為Beowulf集群。這類集群通常運行特定的程式以發揮HPC cluster的並行能力。這類程式一般套用特定的運行庫, 比如專為科學計算設計的MPI庫。HPC集群特別適合於在計算中各計算節點之間發生大量數據通訊的計算作業,比如一個節點的中間結果或影響到其它節點計算結果的情況。
集群計算與格線計算的區別
(1)格線與傳統集群的主要差別是格線是連線一組相關並不信任的計算機,它的運作更像一個計算公共設施而不是一個獨立的計算機。格線通常比集群支持更多不同類型的計算機集合。
(2)格線本質上就是動態的,集群包含的處理器和資源的數量通常都是靜態的。在格線上,資源則可以動態出現,資源可以根據需要添加到格線中或從格線中刪除。
(3)格線天生就是在本地網、城域網或廣域網上進行分布的。格線可以分布在任何地方。而集群物理上都包含在一個位置的相同地方,通常只是區域網路互連。集群互連技 術可以產生非常低的網路延時,如果集群距離很遠,這可能會導致產生很多問題。物理臨近和網路延時限制了集群地域分布的能力,而格線由於動態特性,可以提供 很好的高可擴展性。
(4)集群僅僅通過增加伺服器滿足增長的需求。然而,集群的伺服器數量、以及由此導致的集群性能是有限的:互連網路容量。也就是說如果一味地想通過擴大規模來提高集群計算機的性能,它的性價比會相應下降,這意味著我們不可能無限制地擴大集群的規模。 而格線虛擬出空前的超級計算機,不受規模的限制,成為下一代Internet的發展方向。
(5)集群和格線計算是相互補充的。很多格線都在自己管理的資源中採用了集群。實際上,格線用戶可能並不清楚他的工作負載是在一個遠程的集群上執行的。儘管格線與集群之間存在很多區別,但是這些區別使它們構成了一個非常重要的關係,因為集群在格線中總有一席之地—— 特定的問題通常都需要一些緊耦合的處理器來解決。然而,隨著網路功能和頻寬的發展,以前採用集群計算很難解決的問題現在可以使用格線計算技術解決了。理解格線固有的可擴展性和集群提供的緊耦合互連機制所帶來的性能優勢之間的平衡是非常重要的。