簡介
2003年,藍色基因的原型機經過三年研發問世,當年11月登上超級計算機“TOP500”第73名。日本NEC公司的“地球模擬機” (Earth Simulator)在三年前曾是世界最快超級計算機,其計算能力達35.867萬億次浮點運算速度,2004年11月被70萬億次浮點運算速度的藍色基因超過。
IBM藍色基因超級計算系統是全球速度最快的超級計算機,代表系統是藍色基因/L(Blue Gene/L)。在全球最著名的超級計算權威機構TOP500榜單上,他的峰值運算速度達到360 Teraflops(Linpark基準運算)。IBM的藍色基因/L憑藉空前的可持續計算性能,以每秒鐘280.6萬億次浮點運算速度奪得冠軍位置 。
架構設計
藍色基因系統是由大量運算節點組成,每個節點的時鐘頻率相對來說都不很快,以節省電力和降低成本。藍色基因採用IBM PowerPC嵌入式處理器、嵌入式DRAM和系統晶片技術,並整合所有系統功能,其中包括計算處理器、通訊處理器、三層高速快取,在單一ASIC上有著複雜路徑的多重高速網際網路。因為處理器時鐘周期相比之下速度較為緩慢,因此就時鐘周期而言,記憶體近似於處理器。這對減少耗電量來說是一項優點,還能將1024個計算節點(內含2顆PowerPC嵌入式處理器)放在單一機架內進行密集封裝。藍色基因可以擴充到65536個計算節點(總計131072顆處理器),其峰值速度可達到367萬億次浮點運算速度,除了成本效益,還有低耗電、冷卻效果好及節省占地面積等特色。
藍色基因是由下列組件構成:每計算節點2個處理器,每計算卡上有2個計算節點、每節點板上有16張計算卡、每機架有32個節點板、機架由上下兩部分組成,中間有2箇中間平面。
每個處理器在每個周期中可以執行4次浮點運算。依照在藍色基因上所執行應用程式性質的不同,程式設計人員可以選擇在單一運算節點上同時採用兩個處理器進行運算,或是以一個處理器專門處理通信。除了這些運算節點外,藍色基因系統還提供了可彈性決定使用數量的雙處理器I/O(輸入/輸出)節點,這些節點可以處理運算節點和其它系統間的通訊。
藍色基因的計算節點是通過5種網路來互相連線,這5種網路分別是:1個3D圓環面網路,用在計算節點間以點對點的方式傳輸信息;1個總體集合網路,用於整個套用中的總體運行;1個總體障礙和中斷網路;1個千兆乙太網,用來控制機器;還有另1個千兆乙太網,用來連線到其它系統。3D 圓環面網路讓每個節點都能和最近的6個相鄰節點以低延遲時間、高頻寬互連,3D圓環面網路還支持一般的點對點通訊。圓環面網路在使用區域通訊的應用程式上特別有效。總體集合網路對提高平常使用的MPI總體通訊架構的速度相當有用。而總體障礙網路能夠迅速地同步化系統內所有處理器的狀態。
藍色基因還需要一個服務節點,在這個節點上系統管理員可以管理儲存資料用的檔案伺服器。藍色基因還能管理複雜的前端節點,在這些前端節點上終端用戶可以編譯資料並發出工作指令。藍色基因包含了多種設計創新,可以擴展到之前無法到達的性能水平,而且還能將客戶系統的耗電量、散熱量和可用的占用空間限制在合理範圍內。
軟體環境
在軟體環境方面,藍色基因也有特別設計,強調遵守下列三項基本原則:簡單化、高效和廣泛性。在軟體設計時以簡單化的原則進行開發,且能夠利用硬體功能的優勢,既保證高效又兼顧穩定和安全性。而依據熟悉且被廣泛使用的程式語言、資料庫、工作管理工具和並行檔案系統所建立的編程和管理環境,客戶將能夠從藍色基因的創新設計要素中獲益,而不用面對陡峭的學習曲線。
藍色基因的前端節點是程式設計人員存取系統運算核心的入口。前端節點執行標準的SUSE SLES9版本Linux,能提供使用者熟悉的操作平台,讓使用者可以在該操作平台上編輯程式、進行程式糾錯等。支持藍色基因系統的語言為用在Power PC上標準的IBM XL Fortran、C和C++編輯器,這些還增加了一個能利用雙浮點運算單元優勢的末端,而這個雙浮點運算單元是藍色基因所獨有的。
程式設計人員可以運用廣受歡迎的IBM工程及科學子程式資料庫(Engineering and Scientific Subroutine Library,ESSL),這是一套最先進的資料庫,收集了超過400個數學子程式,能給Fortran、C或C++等語言所寫成的浮點工程和科學應用程式提供最佳性能。這些程式中有許多都已經調整成適用於藍色基因架構。
為了支持並行編寫程式,藍色基因還一併提供了一套MPI解決方案,這套解決方案可以利用美國Argonne國家實驗室的MPICH2資料庫,可生成一個利用運算節點通訊技術的執行方案。
在工作任務及平衡工作量方面,IBM LoadLeveler對藍色基因也提供支持。LoadLeveler已經過許多大規模集群客戶的考驗,能提供建立、提出和處理工作的設備,其設計是以可用資源來搭配應用程式處理過程中的需求。
藍色基因中還包括了IBM General Parallel File System (一般並行檔案系統,GPFS),可以進一步強化藍色基因的軟體環境。GPFS是一個高性能的磁碟已分享檔案系統,它能從藍色基因的所有節點中提供快速數據存取功能。應用程式可以立即存取使用標準檔案系統界面的已分享檔案,使用者將因此能從數個節點中存取同樣的檔案。
藍色基因系統還包括一個讓系統管理員可以管理該系統的服務節點。管理員可使用的重要功能有系統設定、初始化、監督功能和運行。這些功能都已經整合到IBM Cluster Systems Management產品中,以提供額外的管理功能和在單一控制點上,在CSM支持的運行平台間進行管理。能在服務節點上執行的還有一個和DB2相關的資料庫,這個資料庫是靜態和動態狀態的信息儲存點。
總之,藍色基因系統軟體集合了諸多為用戶考慮的因素,這些因素都為了達到高性能和高可靠性而加以調整,並符合許多現有集群客戶所熟悉的特性。在這種情況下,客戶將能夠快速讓藍色基因發揮強大計算能力,還能從藍色基因的結構功能中獲益。
性能
2005年11月,IBM正式向業界宣布,安裝在美國勞倫斯·利弗摩爾國家實驗室的藍色基因/L超級計算機創造了每秒鐘280.6萬億次運算的性能紀錄,峰值速度甚至達到367萬億次。在同月發布的世界超級計算機500強排行榜(TOP500)上,這台機器名列第一名,速度約是第二名的另一台藍色基因的三倍。所以被稱為上世界最快的計算機,IBM藍色基因當之無愧。2005年12月1日,IBM藍色基因的樣機來到中國。
業務
藍色基因計畫在2000年第一次獲得授權時,其目標就是發展能套用於生物分子現象(例如蛋白質摺疊)研究的大型並行計算機。這些努力的成果將能通過大量的模擬,對蛋白質摺疊的機制有更進一步的了解,此外還能探索在大型並行計算機架構和軟體方面的創新想法。藍色基因所能提供的性能等級能夠大幅度提高模擬的規模,並遠遠超越其它超級計算機。在此規模上,成功的蛋白質摺疊模擬研究可望在生物分子仿真的技術、模型和算法上能有更進一步的發展。
諸多不同套用層面的實踐經驗顯示,藍色基因架構適用於各學科間相互關聯的作業。IBM與許多機構正共同努力,擴展藍色基因架構上高性能計算套用的名單,這些套用包括了生命科學、金融模型、流體力學、量子化學、分子動力學、天文學和宇宙研究、材料科學和氣候模型。
套用實踐
1.藍色基因能幫助美國國家大氣研究中心的研究人員建立大氣模型,並且能確保該中心在業內處於領先地位。使用藍色基因系統等超級計算機,美國國家大氣研究中心將能更快地建立模型和分析資料,還能估算引起大氣變化的天然因素和人類活動正如何影響氣候。
2.荷蘭ASTRON是領先的天文學組織。這個組織使用藍色基因作為新型射電望遠鏡的中央處理引擎。這款新型的射電望遠鏡叫做LOFAR,它能夠研究宇宙形成後,最早期的恆星和銀河在萌芽階段的狀況。
3.波士頓大學打算利用藍色基因來設立處理艱深科學問題的主機,這些科學問題包括核物理學、基因學、細胞生物學到宇宙氣候和海洋系統的模型建立。例如,波士頓大學的研究人員打算利用藍色基因來預測太陽表面上的活動(例如太陽耀斑)是如何影響地球的輻射帶、地球的上層大氣層和電離層。當許多科學家和研究人員將大規模集群運算套用到不同的問題組,並在類似計畫發展中建立共同的專業知識時,藍色基因的相關性就變得更加清楚。
模擬貓腦
據PhysOrg網站報導,IBM的研究人員通過一個稱為“藍色項目”的新計算程式繪製了人類大腦內部大腦皮層和皮層下組織節點的系統連線圖。然後這個研究團隊建立了貓的大腦皮層模擬機構,其中包括10億腦細胞和10兆認知神經元突觸,信息的傳遞和連線就在這些神經元中間進行。貓腦數字模型的運行速度相當於真貓大腦實際運行速度的1/100。
2007年06月,根據科技新聞社區Slashdot援引IBM工程師Eric Van Hensbergen的訊息,Plan 9作業系統成功運行於IBM的藍色基因(Blue Gene)超級計算機。
據TED(網易公開課)報導,藍色基因也在模擬人腦。
套用範圍
IBM將這一系統稱為eServerBlueGene,該系統的計算速度達到了每秒5.7萬億次,它的占地面積不到1平方米。該系統的售價為150萬美元。用戶也可以從IBM在美國或者歐洲的深度按需計算中心租用該計算系統。
IBM旗下eServer部門的副總裁ColinParris表示,該系統的推出使得IBM商用計算機系統的性能跨上了一個台階。在過去幾年,IBM一直和其合作夥伴致力於BlueGene計算系統適合處理不同的科研計算任務,涉及的領域包括生命科學、金融建模、流體力學、量子化學、天文學、氣象建模以及分子動力學。
此外,IBM還致力於將Blue Gene計算系統套用於更廣泛的商業套用包括格線計算、商業智慧型、製造流程等等。
IBM耗費了5年的時間以及1億美元的成本才開發出了Blue Gene超級計算機系統。