計算機群
綜述
高性能計算(High Performance Computing)機群,簡稱HPC機群。構建高性能計算系統的主要目的就是提高運算速度,要達到每秒萬億次級的計算速度,對系統的處理器、記憶體頻寬、運算方式、系統I/O、存儲等方面的要求都十分高,這其中的每一個環節都將直接影響到系統的運算速度。這類機群主要解決大規模科學問題的計算和海量數據的處理,如科學研究、氣象預報、計算模擬、軍事研究、CFD/CAE、生物製藥、基因測序、圖像處理等等。
信息服務機群的套用範圍很廣,包括如數據中心、電子政務、電子圖書館、大中型網站、網路遊戲、金融電信服務、城域網/校園網、大型郵件系統、VOD、管理信息系統等等。就其實現方式上分,還可以分為負載均衡機群、高可用機群等。
簡單的說,高性能計算(High Performance Computing)是計算機科學的一個分支,研究並行算法和開發相關軟體,致力於開發高性能計算機(High Performance Computer)。
隨著信息化社會的飛速發展,人類對信息處理能力的要求越來越高,不僅石油勘探、氣象預報、航天國防、科學研究等需求高性能計算機,而金融、政府信息化、教育、企業、網路遊戲等更廣泛的領域對高性能計算的需求迅猛增長。
集群分為下面幾種
主/主 (Active/active)
這是最常用的集群模型,它提供了高可用性,並且在只有一個節點線上時提供可以接受的性能,該模型允許最大程度的利用硬體資源。每個節點都通過網路對客戶機提供資源,每個節點的容量被定義好,使得性能達到最優,並且每個節點都可以在故障轉移時臨時接管另一個節點的工作。所有的服務在故障轉移後仍保持可用,但是性能通常都會下降。
主/從(Active/passive)
為了提供最大的可用性,以及對性能最小的影響,Active/passive模型需要一個在正常工作時處於備用狀態,主節點處理客戶機的請求,而備用節點處於空閒狀態,當主節點出現故障時,備用節點會接管主節點的工作,繼續為客戶機提供服務,並且不會有任何性能上影響。
混合型(Hybrid)
混合是上面兩種模型的結合,只針對關鍵套用進行故障轉移,這樣可以對這些套用實現可用性的同時讓非關鍵的套用在正常運作時也可以在伺服器上運行。當出現故障時,出現故障的伺服器上的不太關鍵的套用就不可用了,但是那些關鍵套用會轉移到另一個可用的節點上,從而達到性能和容錯兩方面的平衡。
性能最佳化
高性能計算集群選擇適合的記憶體
高性能計算集群依賴於並行處理系統,所以高性能計算集群信息需要快速的傳入與傳出記憶體。高性能計算集群系統往往是I/O密集型的,因此高性能計算集群選擇正確的記憶體配置,可以顯著提升高性能計算集群應用程式性能。
高性能計算集群系統依賴於DIMM模組,因為高性能計算集群是針對並行系統設計的。
高性能計算集群有三種DIMM記憶體可用:UDIMM記憶體、RDIMM記憶體和LRDIMM記憶體。高性能計算集群在處理較大型工作負載時,無緩衝DIMM速度快、廉價但不穩定。暫存器式DIMM記憶體穩定、擴展性好、昂貴,高性能計算集群對記憶體控制器的電氣壓力小。高性能計算集群同樣在許多傳統伺服器上使用。降載DIMM記憶體是暫存器式記憶體的替代品,高性能計算集群能提供高記憶體速度,降低伺服器記憶體匯流排的負載,而且功耗更低。
高性能計算集群升級設施
高性能計算集群應用程式正在迅速增長,所以高性能計算集群體系未來的擴展能力需要重視。
高性能計算集群系統設計與傳統數據中心基礎設施設計的一大區別就是選擇現成工具或定製系統。現成的高性能計算集群只能在很小的範圍內進行擴展,高性能計算集群限制了未來增長。HPC定製可以保持一個開放式的設計,讓企業在將來獲得更好的擴展功能。然而,高性能計算集群額外的功能對於定製系統來說是一筆不小的代價,比購買現成高性能計算集群系統要高得多。
高性能計算集群系統一致
高性能計算集群系統初次上線時,高性能計算集群所有的配置都很完美,但隨著時間流逝,高性能計算集群配置會變得不一致。
高性能計算集群中出現不一致,高性能計算集群管理員可能會看到一些零星的異常貨變化,高性能計算集群影回響用程式性能。考慮到潛在的性能,IT部門需要實施策略來確認高性能計算集群系統中都運行著什麼應用程式, 並想辦法讓高性能計算集群配置同步。這些高性能計算集群檢查每季度應該進行,或者每年不少於兩次。
高性能計算集群能耗
高性能計算集群在過去15年中,高性能計算集群能源成本隨著高性能計算密度增加而急劇上升。現在高性能計算集群普通的伺服器開銷為每機櫃30kw,高性能計算集群這個數字還在不斷上升。由於高性能計算集群高密度,高性能計算集群高效率數據中架構基礎設施與高性能計算集群冷卻系統變得至關重要。
在高性能計算集群數據中心,高性能計算集群高電壓電直接供給到機架,而不是採用傳統的208伏降壓,這樣可以節約電子電力設備因電力轉換的損耗。高性能計算集群利用節能型泵取代了嘈雜、低效率的風扇。