CUDA架構

CUDA架構

NVIDIA CUDA™是一款革命性的並行計算架構。作為一項同時支持硬體和軟體的技術,CUDA 可利用圖形處理器中的多顆計算核心進行通用計算處理工作,計算性能可獲得顯著提升。它包含了CUDA指令集架構(ISA)以及GPU內部的並行計算引擎。 開發人員現在可以使用C語言來為CUDA™架構編寫程式,C語言是套用最廣泛的一種高級程式語言。所編寫出的程式於是就可以在支持CUDA™的處理器上以超高性能運行。 將來還會支持其它語言,包括FORTRAN以及C++。

簡介

NVIDIA CUDA™是一款革命性的並行計算架構。作為一項同時支持硬體和軟體的技術,CUDA 可利用圖形處理器中的多顆計算核心進行通用計算處理工作,計算性能可獲得顯著提升。它包含了CUDA指令集架構(ISA)以及GPU內部的並行計算引擎。

開發人員現在可以使用C語言來為CUDA™架構編寫程式,C語言是套用最廣泛的一種高級程式語言。所編寫出的程式於是就可以在支持CUDA™的處理器上以超高性能運行。 將來還會支持其它語言,包括FORTRAN以及C++。計算行業正在從只使用CPU的“中央處理”向CPU與GPU並用的“協同處理”發展。為打造這一全新的計算典範,NVIDIA;(英偉達™)發明了CUDA並行計算架構,該架構現已套用於GeForce®(精視™)、ION™(翼揚™)、Quadro以及Tesla GPU(圖形處理器)上,對應用程式開發人員來說,這是一個巨大的市場。

在消費級市場上,幾乎每一款重要的消費級視頻應用程式都已經使用CUDA加速或很快將會利用CUDA來加速,其中不乏Elemental Technologies公司、MotionDSP公司以及LoiLo公司的產品。

在科研界,CUDA一直受到熱捧。例如,CUDA現已能夠對AMBER進行加速。AMBER是一款分子動力學模擬程式,全世界在學術界與製藥企業中有超過60,000名研究人員使用該程式來加速新藥的探索工作。

在金融市場,Numerix以及CompatibL針對一款全新的對手風險應用程式發布了CUDA支持並取得了18倍速度提升。Numerix為近400家金融機構所廣泛使用。

CUDA的廣泛套用造就了GPU計算專用Tesla GPU的崛起。全球財富五百強企業現在已經安裝了700多個GPU集群,這些企業涉及各個領域,例如能源領域的斯倫貝謝與雪佛龍以及銀行業的法國巴黎銀行。

隨著微軟Windows 7與蘋果Snow Leopard作業系統即將問世,GPU計算必將成為主流。在這些全新的作業系統中,GPU將不僅僅是圖形處理器,它還將成為所有應用程式均可使用的通用並行處理器。

發展歷程

隨著顯示卡的發展,GPU越來越強大,而且GPU為顯示圖像做了最佳化。在計算上已經超越了通用的CPU。如此強大的晶片如果只是作為顯示卡就太浪費了,因此NVidia推出CUDA,讓顯示卡可以用於圖像計算以外的目的。

目前只有G80、G92、G94、G96、GT200、GF100平台(即Geforce 8~Gecorce GTX480)的NVidia顯示卡才能使用CUDA,工具集的核心是一個C語言編譯器。G80中擁有128個單獨的ALU,因此非常適合併行計算,而且數值計算的速度遠遠優於CPU。

CUDA的SDK中的編譯器和開發平台支持Windows、Linux系統,可以與Visual Studio2005集成在一起。

Geforce8CUDA(Compute Unified Device Architecture)是一個新的基礎架構,這個架構可以使用GPU來解決商業、工業以及科學方面的複雜計算問題。它是一個完整的GPGPU解決方案,提供了硬體的直接訪問接口,而不必像傳統方式一樣必須依賴圖形API接口來實現GPU的訪問。在架構上採用了一種全新的計算體系結構來使用GPU提供的硬體資源,從而給大規模的數據計算套用提供了一種比CPU更加強大的計算能力。CUDA採用C語言作為程式語言提供大量的高性能計算指令開發能力,使開發者能夠在GPU的強大計算能力的基礎上建立起一種效率更高的密集數據計算解決方案。

從CUDA體系結構的組成來說,包含了三個部分:開發庫、運行期環境和驅動(表2)。

開發庫是基於CUDA技術所提供的套用開發庫。目前CUDA的1.1版提供了兩個標準的數學運算庫——CUFFT(離散快速傅立葉變換)和CUBLAS(離散基本線性計算)的實現。這兩個數學運算庫所解決的是典型的大規模的並行計算問題,也是在密集數據計算中非常常見的計算類型。開發人員在開發庫的基礎上可以快速、方便的建立起自己的計算套用。此外,開發人員也可以在CUDA的技術基礎上實現出更多的開發庫。

運行期環境提供了套用開發接口和運行期組件,包括基本數據類型的定義和各類計算、類型轉換、記憶體管理、設備訪問和執行調度等函式。基於CUDA開發的程式代碼在實際執行中分為兩種,一種是運行在CPU上的宿主代碼(Host Code),一種是運行在GPU上的設備代碼(Device Code)。不同類型的代碼由於其運行的物理位置不同,能夠訪問到的資源不同,因此對應的運行期組件也分為公共組件、宿主組件和設備組件三個部分,基本上囊括了所有在GPGPU開發中所需要的功能和能夠使用到的資源接口,開發人員可以通過運行期環境的編程接口實現各種類型的計算。

由於目前存在著多種GPU版本的NVidia顯示卡,不同版本的GPU之間都有不同的差異,因此驅動部分基本上可以理解為是CUDA-enable的GPU的設備抽象層,提供硬體設備的抽象訪問接口。CUDA提供運行期環境也是通過這一層來實現各種功能的。目前基於CUDA開發的套用必須有NVIDIA CUDA-enable的硬體支持,NVidia公司GPU運算事業部總經理Andy Keane在一次活動中表示:一個充滿生命力的技術平台應該是開放的,CUDA未來也會向這個方向發展。由於CUDA的體系結構中有硬體抽象層的存在,因此今後也有可能發展成為一個通用的GPGPU標準接口,兼容不同廠商的GPU產品。

其他信息

NVIDIA進軍高性能計算領域,推出了Tesla&CUDA高性能計算系列解決方案,CUDA技術,一種基於NVIDIA圖形處理器(GPU)上全新的並行計算體系架構,讓科學家、工程師和其他專業技術人員能夠解決以前無法解決的問題,作為一個專用高性能GPU計算解決方案,NVIDIA把超級計算能夠帶給任何工作站或伺服器,以及標準、基於CPU的伺服器集群

CUDA是用於GPU計算的開發環境,它是一個全新的軟硬體架構,可以將GPU視為一個並行數據計算的設備,對所進行的計算進行分配和管理。在CUDA的架構中,這些計算不再像過去所謂的GPGPU架構那樣必須將計算映射到圖形API(OpenGL和Direct 3D)中,因此對於開發者來說,CUDA的開發門檻大大降低了。CUDA的GPU程式語言基於標準的C語言,因此任何有C語言基礎的用戶都很容易地開發CUDA的應用程式。

由於GPU的特點是處理密集型數據和並行數據計算,因此CUDA非常適合需要大規模並行計算的領域。目前CUDA除了可以用C語言開發,也已經提供FORTRAN的套用接口,未來可以預計CUDA會支持C++、Java、Python等各類語言。可廣泛的套用在圖形動畫、科學計算、地質、生物、物理模擬等領域。

2008年NVIDIA推出CUDA SDK2.0版本,大幅提升了CUDA的使用範圍。使得CUDA技術愈發成熟。

現狀分析

支持CUDA的GPU銷量已逾1億,數以千計的軟體開發人員正在使用免費的CUDA軟體開發工具來解決各種專業以及家用應用程式中的問題。這些應用程式從視頻與音頻處理和物理效果模擬到石油天然氣勘探、產品設計、醫學成像以及科學研究,涵蓋了各個領域。 目前市面上已經部署了超過一億顆支持CUDA的GPU,數以千計的軟體開發人員正在使用免費的CUDA軟體工具來為各種應用程式加速。

CUDA 的核心有三個重要抽象概念: 執行緒組層次結構、共享存儲器、禁止同步( barrier

synchronization),可輕鬆將其作為C 語言的最小擴展級公開給程式設計師。

CUDA 軟體堆疊由幾層組成,一個硬體驅動程式,一個應用程式編程接口(API)

和它的Runtime, 還有二個高級的通用數學庫,CUFFT 和CUBLAS。硬體被設計成支持輕

量級的驅動和Runtime 層面,因而提高性能。

相關詞條

相關搜尋

熱門詞條

聯絡我們