概述
曙光5000A高性能計算機是國家863計畫高性能計算機及其核心軟體重大專項支持的研究項目,是面向格線的高性能計算機,同時也是面向信息服務的超級伺服器,適用於各種大規模科學工程計算、商務計算等領域。曙光5000A採用格線技術,體系結構以構件性(Component)、標準性(Standard)、協作性(Coordinate)為基準,採用服務化(Service)、安全化(Security)、專業化(Specialization)、智慧型化(Intellengce)的3SI技術路線。該系統在大規模機群計算和格線使能技術方面有所突破,形成了鮮明的技術特色,將我國通用高性能計算機系統的研製水平提升到一個新高度。
性能
曙光5000A的第一套超大型系統即將落戶“上海超級計算中心”,被命名為“魔方”。該系統採用國際高性能計算機主流的機群結構,共有1650個刀片伺服器節點,每個節點為4CPU的4核SMP系統,採用AMDBarcelona處理器,每個節點128GB記憶體,整個系統共有6600顆CPU、100T海量記憶體和700TB存儲,採用了WindowsHPCServer2008+SuSeLinux雙作業系統,其理論浮點峰值為每秒230萬億次,占地面積大約75平方米,總造價約2億元。曙光5000A採用基於DDR的Infiniband高速網路實現計算網路和存儲網路合一,實現了20GB的節點間傳輸速度,實現業界最快的小於1.3us延時。
在2008年11月1日公布的中國高性能計算機TOP100排行榜中,曙光5000A以每秒174.9萬億次的Linpack測試性能位居第一位;在11月17日公布的全球高性能計算機TOP500排行榜中,曙光5000A以每秒180.6萬億次的Linpack值位居第十位,成為目前中國運算速度最快的商用超級計算機,是目前世界上最快的基於WindowsHPCServer2008作業系統的超級計算機,也是世界TOP10中唯一一台安裝在美國之外的超級計算機。
節能
對於如此大規模高性能計算機系統而言,如何提高系統密度並降低功耗是研製人員面臨的關鍵問題之一。為提高曙光5000A的系統密度, 在節能方面,曙光5000A採用了多項措施,使曙光5000A在滿負載運行時不帶水冷系統功耗僅700千瓦,帶水冷系統的功耗僅為1000千瓦,具體包括:採用了低功耗的CPU,每年節電55萬度;採用了低功耗的記憶體,每年節電5萬度;採用了刀片結構,電源效率最佳化,每年節電100萬度;採用了水冷散熱體系,每年節電200萬度;採用了曙光自主研發的自適應功耗管理軟體,每年節電200萬度。這此措施一方面提高了機群系統的可擴展性,另一方面降低了整個系統地運行成本。
系統管理
曙光5000A採用了自主開發的GridView集群管理管理系統,提供統一的集中式監控平台,具備可擴展性、集成性、可靠性和易用性,提供對各種商用、自己研發的管理工具的集成接口,包括直接以Portal的方式集成和抽取各已有管理工具的監控數據以便上層平台能夠分析利用,從而滿足同時對分散式廣域\區域網路高效能百萬億次可擴展計算機的環境、硬體、軟體等各方面進行監控的需求。
技術創新
中科院計算所聯合曙光公司自主設計了包括主機板、體系結構、刀片伺服器、刀片機箱系統、網路交換系統、水冷散熱系統在內的全部系統。
在自主創新的研製過程中,曙光在業界實現多個第一:首次實現了4路16和的高密度刀片系統;首次實現了單刀片機箱40顆CPU的高密度機箱設計;首次實現了基於DDR的Infiniband的交換結構,實現了20Gb高速互聯和小於1.3us的低延遲;首次採用了水冷散熱系統,降低了高性能計算機對機房系統的要求,降低了系統功耗。
意義
曙光5000A”作為曙光公司的掌上明珠,承載著中國高性能計算機界太多的期望。曙光在5000A上自主創新的HPP體系架構,“四高兩低”的技術特色,以及曙光刀片伺服器的性能突破,“曙光5000A”是中國高性能計算機技術性能的代表,再次證明了中國的原創能力。也必將為我國“千萬億次”高性能計算機的研發奠定基礎。
作為代表中國目前最高技術水準的商用化高性能計算,曙光5000A不僅僅在性能速度上創造了“中國第一”和“世界第十”,更是在提高能耗比、密度、I/O性能、節能效率、管理性等方面做出了積極探索,在體系結構、刀片伺服器系統、主機板、網路交換系統、水冷散熱系統、大規模集群系統管理軟體等方面取得了多項自主突破。這些不僅為我國研製下一代千萬億次超大規模計算機做好了技術儲備,而且也為發展民族伺服器產業奠定了堅實的基礎。