深騰7000

深騰7000

深騰7000百萬億次高用於數據備份及數據的長期保存,提高盤陣空間使用效率* 使用2套ADIC i2000智慧型帶庫,總不壓縮容量1PB* 使用LTO4磁帶。

騰超級計算機是聯想集團自主研發的百萬億次機採用混合結構的高性能計算集群架構,由採用Intel Xeon 處理器的集群部分與採用 Intel Itanium2 處理器的胖節點部分組成,適於不同的套用計算。深騰超級計算機及系列產品可用於科學計算、商用計算、石油勘探開發、氣象預報、核能與水電開發利用、各類太空飛行器及飛機汽車艦船設計模擬、生物信息處理、新藥設計開發篩選等領域。

2008年12月4日聯想集團對外宣布,聯想已經成功研製出每秒實際性能超過百萬億次的高性能計算機“深騰7000”,“深騰7000”也由此成為入選該排行榜的第五台聯想“深騰”系列高端超級計算機,它將落戶中國科學院用於搭建格線計算平台。深騰7000全球排名第19位,低於曙光公司的“魔方”(曙光5000A)的第十位。 據介紹,聯想“深騰7000”是世界上規模最大的一個結點無盤啟動的機群系統,成功實現了基於1428個無盤結點的機群系統。同時,它也是世界上第一個實現了對所有硬體部件統一管理和監控功能的機群系統,實現了對機群系統內數千個計算、互連、存儲等硬體部件的統一管理和監控。 “深騰7000”是國內第一個實際性能突破每秒百萬億次的異構機群系統,成功實現了1240個2路薄結點和140個4路厚結點的協同計算,實際Linpack性能突破每秒106.5萬億次,並在國內第一個實現了PB級別的三級結構海量存儲系統的機群系統,成功實現了三級結構海量存儲系統,線上、近線、離線存儲容量超過PB級。4日中午,聯想集團與中科院網路信息中心簽署了戰略合作協定。聯想深騰7000將落戶中科院,成為國家格線主結點的關鍵設備。聯想與中科院網路信息中心將共同投資,搭建異構體系的公共商用計算平台,為科研、企業用戶提供公共商用計算平台。

聯想集團高級副總裁,大中華和俄羅斯區總裁陳紹鵬表示,聯想與中科院網路中心的戰略合作,將使全國數百個科研院所和機構可以用最低的成本共享高性能計算、服務和存儲資源,這種高端計算模式的突破,將進一步提高我國商用計算的能力,在更高層面滿足商用客戶的“CEMS”需求。 “CEMS理念”是聯想首次推出面向商用技術發展的理念,即在公總計算、企業計算和個人計算三大領域,不斷提供品質卓越的產品和服務,滿足用戶對成本、效率、管理和安全的需求。據陳紹鵬介紹,在當前的全球經濟形式下,聯想力圖讓IT效能最大化,讓客戶的每一分投入都有產出。聯想提出了商用技術的核心理念——CEMS,即Cost成本、Efficiency效率、Management管理、Security安全,它不僅代表了客戶對商用技術的根本需求,也是聯想商用技術持續發展的源動力。隨著商用計算的不斷發展,以“CEMS理念”為核心的商用技術將以更最佳化的運營、更卓越的產品為客戶創造更大的價值。

聯想集團副總裁魏江雷表示,“深騰7000”的研製成功是搭建聯想新一代公共商用計算平台的重要一步。據其介紹,公共商用計算平台採用了創新的高性能異構體系架構,通過負載均衡、集成管理、自動部署等自主研發的核心技術,突破了傳統高性能計算平台的套用限制,通過包含多種不同架構伺服器節點,從而滿足用戶多樣化的套用需求,既能支持大規模科學計算,也能支持大規模商業運算,“深騰7000”的研製成功即是搭建該平台的重要一步。 魏江雷同時表示,聯想將通過與政府及中科院網路中心等大型科研機構的戰略合作,引入專業運維服務團隊,共同投資,搭建異構體系的公共商用計算平台,為科研、企業用戶提供低成本,高效能、易管理、高安全的公共商用計算平台。

中科院網路中心主任黃向陽則表示,與聯想集團的戰略合作,是網路中心在信息化大潮中加速發展的一次重要契機,網路中心將通過科研信息化支撐平台的建設和發展,承載服務科研信息化和管理信息化的重任,為國家科技創新能力的提升和社會經濟的創新發展做出積極的探索和有益的貢獻。 此次聯想集團與中科院網路中心的“強強聯合”,是雙方繼百萬億次高效能計算機項目之後,在高性能計算領域合作的進一步深化和延展。業界人士認為,聯想與中科院網路中心的“聯姻”,是我國信息化基礎設施服務領域優勢資源整合、資源利用效率提高的充分體現,是高端計算模式的突破和創新。

系統配置簡介
深騰 7000 百萬億次機採用混合結構的高性能計算集群架構,由採用 Intel Xeon 處理器的集群部分與採用 Intel Itanium2 處理器的胖節點部分組成,適於不同的套用計算。但要注意的是,這兩部分節點的程式二進制代碼不兼容。集群部分包括認證 伺服器、前端機 、管理節點、登 陸節點、啟動節 點、I/O 節點、備份節點和計算節點。其中,計算節點包括刀片和厚節點,配置如下:
 1140 個普通(刀片)節點,每個刀片配置兩顆四核 Xeon 處理器 E5450,
主頻 3.00GHz,32GB 記憶體;
 38 個厚節點,IBM X3950M2 伺服器,每個厚節點配置 16 顆四核 Xeon 處
理器 X7350,主頻 2.93GHz,512GB 記憶體;
 12 個可視化節點(採用機架式伺服器),2 顆 Intel Xeon E5450,32GB
記憶體,Nvidia 9800GTS 顯示卡;
 其它節點配置與計算刀片相同,包括 2 個認 證伺服器、2 個前端機、2
個管理節點、8 個登錄節點、12 個啟動節點、120 個 IO 節點、2 個備份
節點;
 作業系統:Red Hat Enterprise Linux Server release 5.1,Linux kernel
2.6.18-53.el5。
胖節點採用 2 套 SGI Altix4700,使用 Intel Itanium2 處理器,可向下兼
容深騰 6800 目標代碼(可直接運行深騰 6800 環境中的部分應用程式,MPI 程式),
其配置如下:
 系統組成
 包括 2 個計算節點、1 個頭節點、2 個檔案服務節點
◆ 胖節點(計算節點),節點採用 NUMA 結構,配置 94 個雙路刀片
模組,共 188 顆處理器,376 個 CPU 核心,共享記憶體約 2.5TB,
主要用於批處理作業計算;
◆ 頭節點,由 1 台胖節點通過邏輯分區實現,用於用戶登錄、編譯
與調試程式、提交作業。頭節點配置 4 個雙路刀片,共 16 個 CPU
核心,64GB 記憶體。
◆ 檔案服務節點,由 1 台 SGI Altix450 通過邏輯分區功能成為 2
台 CXFS 檔案系統器使用,用戶不可直接訪問。
 共 384 顆 Intel Itanium2 雙核處理器
◆ 型號 9140M, 1.66GHz 主頻,666MHz 匯流排,
L1 Cache: 16KB(Data)+16KB(指令),L2 Cache: 256KB(Data)
+1MB(指令),L3 Cache: 18MB
◆ TDP 104W
 系統浮點峰值 5Tflops
 記憶體總量 5TB
 互連網路
 節點內採用 NUMALink 互連(雙向頻寬 6.4GB/s,延遲 1us);

節點間採用千兆乙太網互連,用於管理、NFS 檔案系統;
計算節點間採用 2 條 20Gbps 的 Infiniband 互連。

作業系統
 採用 SUSE Linux 10SP2,核心版本為 2.6.16.60-0.21.default;
其它:
 系統網路:節點間採用千兆乙太網與 20Gbps 的 Infiniband 實現互連;
 作業管理系統,LSF HPC 7.0。
 全局已分享檔案系統
 用戶$HOME 目錄:/home_soft/home 採用 snfs 檔案系統;
 軟體安裝目錄:/home_soft/soft 採用 SNFS 檔案系統;
 /work:採用 SNFS 檔案系統,是/datastore 目錄的連結;
 /luster:用戶工作空間,使用 Lustre 檔案系統;
 /datastore/userdata 目錄:用戶重要數據存放空間,採用 SNFS 文
件系統,數據定期向磁帶庫遷移。
 /datastore/workspace 目錄:用戶臨時工作目錄,採用 SNFS 檔案
系統。
 胖節點專用工作空間(僅胖節點可見):/workspace 採用 SGI CXFS 共享
檔案系統。
 厚節點專用工作空間(僅厚節點可見):/GPFS1、/gpfs2,採用 IBM GPFS
檔案系統。

用戶登錄、數據存儲、傳輸與工作空間

胖節點與其它節點內部互通,可通過 ssh 命令在登錄節點與胖節點
接入節點(head)間轉變工作環境。
支持協定:僅支持 SSH 方式登錄,不支持 telnet、FTP 這些非加密方式;
可使用支持 SSH 協定的工具登錄(Linux 下直接用 ssh,Windows 環境中
可採用 putty 等)。

在深 騰
7000
上, 預裝 了
Intel
公 司的
C/C++/Fortran
編 譯器 、GNU

C/C++/Fortran 編譯器和 PGI 編譯器,建議用戶使用 Intel 編譯器進行編譯。
深騰 7000 上安裝的 MPI 版本有 IntelMPI 3.2、mvapich2-1.2pl、openmpI
1.3.2,用戶可在用戶主目錄下編寫.mpi_type 檔案,指定想要使用的 MPI 版本
(如:intelmpi、mvapich、OpenMPI ),登入時,系統會自動為用戶設定相應 MPI
環境變數,若不指定,預設使用 IntelMPI。

使用 bsub 腳本多次提交具有相同參數的 作業

bsub 命令可以使用輸入腳本多次提交具有相同參數的作業,其格式為:

#BSUB -W [hour:]minute
#BSUB -a MPITYPE
#BSUB -n Z
#BSUB -R "span[ptile=Y]"
#BSUB -q QUEUENAME
#BSUB -o OUTPUTFILE
#BSUB -e ERRFILE
mpirun.lsf PROGRAM

該腳本中的參數與命令行下:

bsub -W [hour:]minute -a MPITYPE -n Z -R "span[ptile=Y]" -q QUEUENAME
-o OUTPUTFILE -e ERRFILE mpirun.lsf PROGRAM
命令的參數含義相同。
提交作業時,仍使用 bsub 命令,格式為:
[user@LB270209 ~]$ bsub < bsub 腳本名
推薦用戶使用腳本模式提交作業。使用腳本模式提交時,在輸 出檔案中包含
提交作業的 腳本信息 ,便於用 戶分析作業 的運行情 況並避免 多次命令行 輸入的
誤操作。
例如:
上述在厚節點上提交 MPI+OpenMP 作業,換成腳本提交模式如下:
 編寫提交腳本 bsubmpiopenmp 如下:
#BSUB -W 15
#BSUB -a intelmpi
#BSUB -q x64_3950dbg
#BSUB -n 24
#BSUB -R "span[ptile=12]"
#BSUB -o out
#BSUB -e err
mpirun.lsf ./mpi_openmp_hello.impi
 用 bsub 提交作業:
[user@LB270209 ~]$ export OMP_NUM_THREADS=12
[user@LB270209 ~]$ bsub < bsubmpiopenmp

bsub 命令執行結果
當您執行 bsub 命令成功提交一個作業之後,系統會返回一條類似於
“Job <11108> is submitted to queue .”
的信息,這條信息顯示了您所提交作業的作業號(第一個尖括弧裡面的內容)
以及您的作業提交到的佇列(第二個尖括弧中的內容)。建議您每次 提交作業後
將對應的作業名及作業號記錄下來,因為您在提交作業之後對您的作業進行操作
或是在作業退出之後查看作業歷史和作業輸出信息時,都必須用到這個作業號。

看作業運行情況
bjobs 的功能是查看系統中作業的情況。
直接執行“bjobs”命 令會得到當前用 戶正在排隊和正在 運行的作業列表 。

bjobs 命令的執行結果很直觀地依次列出了作業的作業號、用戶名、作業狀態、
作業所在佇列、提交作業的結點、作業運行所占用的結點、作業名以及作業提交
的時間。bjobs 命令的常用參數如下:
 -a 在不加任何參數的情況下,看到的只是自己提交的並且尚未結束的作
業。如果您使用了“-a”參數,除了未完成的作業之外 ,還能看到一些
剛結束不久的作業的信息。
 -u 如果需要查看系統中別的用戶的作業情況的話,您只需加上“-u”參
數,比如想查看用戶“user1”的作業情況,那么執行“bjobs -u user1”
即可。如果執行了“bjobs -u all”的話,您將會看到 所有用戶的作業
信息。
 -l 加上-l 參數可以查看查看某個作業的詳細信息,具體格式是“bjobs
-l JOBID”。

bqueues 命令
bqueues 命令用於查看佇列信息,默認情況下,bqueues 命令列出 LSF 系統
中定義的全部佇列信息,包括佇列名、優先權、狀態信息、最大可用資源數、排
隊作業數、運行作業數等信息。
brequeue 命令
brequeue 命令用於作業重新排隊,用戶可以使用命令 brequeue JOBID 終止
指定的、隸屬於自己的、並正在運行的作業,該作業將以原有的作業號重新進行
排隊,重新獲得調度、運行。

btop/bbot 命令
btop/bbot 命令用於改變處於“PEND”狀態的作業獲得調度的次序,用戶只
能改變自己處於同一佇列內的作業的相對次序, btop 使指定作業在同一佇列內
的,所有同優先權的作業中最先獲得調度。bbot 則相反。
bhosts 命令
bhosts 命令用於查看結點狀態,處於“ok”狀態的結點表示該節點可以接收
用戶作業。結點上已經有作業運行或者負載過高都會導致“closed”狀態。

相關搜尋

熱門詞條

聯絡我們