系統概述
聯想深騰7000G高性能伺服器是基於GPU加速的高性能計算平台。深騰7000G採用Cluster架構、GPU加速伺服器節點、Intel處理器、Linux作業系統、Ethernet以及Infiniband互連等。
Graphic Processing Unit (GPU)是用於個人計算機、工作站和遊戲機的專用圖像顯示設備。GPU相比CPU,更專注於計算密集型、高度並行的計算。隨著技術的發展,GPU 已經發展為一個非常靈活而強大的處理器,可以使用高級語言編程,支持32位浮點IEEE-754精度,提供了非常高的GFLOPS。因此,GPU也越來越多的運用到並行計算中。
本系統單精度計算能力為200萬億次,雙精度計算能力為15.4萬億次。
在2012年7月系統升級之後,雙精度計算能力提高
到為20.2萬億次。其中升級的12塊GPU卡的雙精度計算能力有原來的78 GFlops提高到515GFlops,
提高到原來的6.6倍。
主要套用
深騰7000G已經成功運行大量套用,包括石化反應模擬、冶金過程模擬、地震數據反演、液態化反應器模擬、氣固系統直接模擬、太陽能電池板吸收效率模擬、粘稠液體攪拌槽內流動模擬、晶體矽多體作用材料模擬、從埃到納米多相納微流模擬、二次採油動態模擬、蛋白質摺疊高分子模擬、攪拌釜模擬、真實岩芯樣本模擬、聚乙烯團聚模擬、虛擬過程、碳酸鹽岩油藏驅油過程、CT圖像實時重構、矩陣運算等,涉及了流體力學、生物信息、石油天然氣、氣象、地理信息系統、數學庫、圖像庫、分子動力學、電路自動設計、醫療成像、金融計算等多個計算領域。
技術規格
硬體系統 | 特性 |
基礎架構 | 19”標準42U機櫃系統、布線系統、散熱系統、電源系統 |
機群結點 | R525 G2/ R710 54IB伺服器 |
系統互連 | Infiniband高速網路、千兆乙太網 |
存儲系統 | 聯想SAS212G2 |
軟體系統: 特性 | |
機群操作管理系統 | 機群管理、作業調度和系統監控 Torque/Maui Ganglia |
結點作業系統 | RHEL ES release 5.3 Linux version 2.6.18-128.el5 |
編譯環境 | Intel® C++、Intel® Fortran編譯器、GNU編譯器、MPI環境 NVIDIA CUDA Toolkit , NVIDIA CUDA SDK |
數學庫 | Intel® MKL、Intel® IPP mkl, fftw、 atlas、gotoblas |
並行調試工具 | Intel® Vtune、Intel® Trace Analyzer & Collector、Intel® Thread Checker |
系統升級及性能比較
Tesla C2075/C1060主要特性比較:
C2075 | C1060 | |
尺寸規格 | 9.75英寸PCIe x16規格 | 9.75英寸PCIe x16規格 |
Tesla GPU的數量 | 1 | 1 |
CUDA核心數量 | 448 | 240 |
CUDA核心頻率 | 1.15 GHz | 1.296 Ghz |
雙精度浮點性能(峰值) | 515 Gflops | 78 GFlops |
單精度浮點性能(峰值) | 1.03 Tflops | 933 GFlops |
專用存儲器總容量* | 6GB GDDR5 | 4 GB |
存儲器頻率 | 1.5 GHz | 800 MHz |
晶片 | Tesla T20A GPU | Tesla T10 GPU |
存儲器頻寬 | 144 GB/秒 | 102 GB/秒 |
功耗 | 215W熱設計功耗 | 187.8w |
系統接口 | PCIe x16 Gen2 | PCI Express x16 (二代) |
散熱解決方案 | 主動式風扇散熱器 | 主動風扇散熱器 |
顯示器支持 Dual-Link DVI-I 顯示器最大解析度@ 60Hz | 1 2560x1600 | --- |
軟體開發工具 | CUDA 4.0及以上 | 支持到cuda3.0及以下 |