面向格線的“曙光4000”高性能計算機的項目思路包括:數據密集技術(Data-intensive)、支持格線(Grid-enabling)、多目標系統(Multiple-system)、套用專用技術(Application-specific)四個方面。
(1)面向數據密集型國家戰略套用目標
我們將曙光4000的科研目標定為體現國家戰略目標的“數據密集型”套用,如Internet內容處理為代表的信息安全,數據密集以Internet數據獲取與分析為特點;雷達圖像處理為代表的國防安全,數據密集以I/O吞吐量密集、數據計算密集為特點;生物信息處理、石油物探為代表的資源安全,數據密集以TB量級大規模數據存儲、處理、傳輸為特點;我們集中研究它們的共性“數據密集”技術,有存儲數據密集,I/O吞吐量密集,Internet數據接入密集,系統間數據互傳密集,數據處理密集等等。我們力求在機群系統通用體系結構下,增加解決“數據密集”的技術,使整個系統能有效地解決套用問題。為國家安全目標和重大科研目標,提供高性能計算平台。
(2)強調格線技術和產業共性技術
研究支持格線(Grid-enabling)的技術,使高性能計算機能有效地支持套用格線。在高性能計算機的面向格線上,我們將科研內容定為五個方面:基於服務(Service-based)的機群作業系統,格線通信協定,格線檔案系統,用於格線套用資源路由的智慧型網卡,支持格線的高性能計算機體系結構。分別體現格線在管理、廣域通信、廣域檔案、資源發現、體系結構上的要求。
我們的研究集中在十個產業共性技術上,他們是Grid-enabling技術,高性能通信,高性能I/O和存儲,可擴展自治管理和可信性評價技術,機群專用處理技術,交換機和特色網卡,數字視頻服務技術,機群商業計算中間件,面向客戶的性能測試技術,高性能計算套用和算法。其中,我們大大加強了前沿探索性研究的比例。
(3)面向套用目標的多個系統
曙光4000系統將規劃成三種,分別是“曙光4000L”、“曙光4000A”,“曙光4000H”。曙光4000L代表IA架構,Liunx,曙光4000A代表64位和高性能(Advanced),曙光4000H代表密集型刀片式機群和專用套用(High-density),它們的體系結構,許多關鍵技術,機群作業系統等都是相同的,但它們在廉價、高性能、高密集度等方面各具特色,滿足多套用目標下的複雜需求。
其中,曙光在2003年初完成了曙光4000L(落戶中石油、信息產業部、河南電子政務等地,獲中國十大科技進展),在2004年6月完成曙光4000A,預計在2005年初將完成曙光4000H。
(4)面向行業套用,研究套用專用技術
曙光的科研戰術是滿足多套用目標,強調套用專用技術,採用“通用系統+專用套用”的思想。我們研製的系統要能與國際品牌殊死競爭,打破市場平衡,進入以科研、石油、製造、軍隊、企業MIS為代表的行業,為大企業服務。
曙光、國家智慧型計算機研究開發中心正在和繼續與套用單位合作,研究套用專用技術,包括與華大基因在生物信息處理方面的合作,在人類基因組、水稻基因組測序上得到很好的套用效果,我們將繼續在大規模生物信息專用處理技術上進行合作;我們與中科院地質與地球物理所在大慶油田大慶勘探研究院“油儲”重大項目,在中海油的勘探研究院的“渤海油田”重大項目上進行合作,將在套用軟體開發、算法設計、並行程式設計、系統相關的最佳化和特定庫、系統定製方面合作研究;我們與信息產業部、哈工大在Internet內容處理方面合作研究,在系統硬體設計、TCP/IP處理軟體、套用軟體的一體化最佳化方面開展研究;我們將與總參二部技術局在星載SAR的衛星圖像處理,與中科院大氣所在減災防災、環境監測套用等方面展開合作研究。
2008年8月26日,由中國科學院計算技術研究所、曙光信息產業有限公司自主研發製造的百萬億次超級計算機“曙光5000”近日研製成功。這標誌著中國成為繼美國之後第二個能製造和套用超百萬億次商用高性能計算機的國家,也表明我國生產、套用、維護高性能計算機的能力達到世界先進水平。據曙光公司介紹,“曙光5000”高性能計算機是國家863計畫高性能計算機及其核心軟體重大專項支持的研究項目,是面向網路的高性能計算機,同時也是面向信息服務的超級伺服器,可以提供多目標的系統服務。“曙光5000”系統峰值運算速度達到每秒230萬億次浮點運算,LINPACK運算速度超過每秒160萬億次浮點運算,是目前國內速度最快的商用高性能計算機系統。除了超強計算能力,它還擁有全自主、超高密度、超高性價比、超低功耗以及超廣泛套用等特點。