規格參數
2014年由全球知名顯示卡製造商NVIDIA(英偉達)將發布全新一代雙芯顯示卡,代號為GTX790。附註:以下規格為該GPU納入nVIDIA參考繪圖卡設計中的規格。繪圖卡規格可能會因為附加卡製造商而有所不同。請參考附加顯示卡製造商的網站,以取得實際出貨規格資訊。核心代號:GK110
製造工藝:28nm
RAMDAC頻率:不明
DirectX版本:11.2
顯存頻寬:不明
ROP單元數量:48x2個
顯存類型:GDDR5
核心數量:2880*2unfind
架構
2013年的顯示卡旗艦GeForceGTX780Ti與GTXTitan所用的GK110晶片應配有2880個CUDA顯示卡,但GTXTitan實際啟用的僅2688個,GTX780Ti則擁有完整的GK110(2880個)。作為GTXTitan與GTX780Ti的繼任者,GTX790應當會將CUDA核心的動力全開,而且也不會僅有一個GK110核心。但是從2014年初GTX680售價2400元,而690售價仍高達7000以上,GTX790絕對不會低於兩個780Ti的價錢的。而且GK110的功耗和發熱也是很可觀的,將兩個核心顯示卡放在同一張PCB上,不僅要保證性能,還要保證功耗和發熱,是非常困難的一件事情,而比較好的解決方法是水冷。這方面NVIDIA與AMD的思路和目的是相同的,但最終體現在架構上還是有所區別。NVIDIA的架構被稱為SIMT(SingleInstructionMultipleThreads,單指令多執行緒),NVIDIA並不像AMD那樣把多少個運算單元捆綁為一組,而是以執行緒為單位自由分配,控制邏輯單元會根據執行緒的任務量和SM內部CUDA運算單元的負載來決定調動多少個CUDA核心進行計算,這一過程完全是動態的。
但不可忽視的是,軟體預解碼雖然大大節約了GPU的電晶體開銷,讓流處理器數量和運算能力大增,但對驅動和遊戲最佳化提出了更高的要求,這種情況伴隨著AMD度過了好多年,希望他能做得更好一些。
核心
1.NVIDIA目前把流處理器稱為CUDA核心;2.SFU(SpecialFunctionUnits,特殊功能單元)是比CUDA核心更強的額外運算單元,可用於執行抽象的指令,例如正弦、餘弦、倒數和平方根,圖形插值指令也在SFU上執行;
3.Warp是並行執行緒調度器,每一個Warp都可以調度SM內部的所有CUDA核心或者SFU;
4.DispatchUnit是指令分派單元,分則將Warp執行緒中的指令按照順序和相關性分配給不同的CUDA核心或SFU處理;
5.LD/ST就是載入/存儲單元,可以為每個執行緒存儲運算源地址與路徑,方便隨時隨地的從快取或顯存中存取數據;
6.TMU是紋理單元,用來處理紋理和陰影貼圖、螢幕空間環境光遮蔽等圖形後期處理;
通過以上數據對比不難看出,GK104暴力增加CUDA核心數量的同時,SFU和TMU這兩個與圖形或計算息息相關處理單元也同比增加,但是指令分配單元和執行緒調度器還有載入/存儲單元的占比都減半了。這也就是前文中提到過的削減邏輯控制單元的策略,此時如何保證把指令和執行緒填滿一個CUDA核心,將是一個難題。
創新技術
1.外部框架由鋁製成,採用三價鉻電鍍處理,強度極高、堅固耐用2.風扇外殼由鎂合金以觸變成型工藝製成,不但散熱效果絕佳而且還能抑制振動l十相重載型電源採用十層兩盎司銅質印刷電路板,不但供電效率高,而且具有電阻小、功耗低和發熱量低的特點
3.散熱方案採用雙均熱板、鍍鎳散熱片與中置的軸流式風扇,葉片間距和進氣角度均進行了最佳化,可有效散熱
4.低矮型部件設計以及運用管道的底板通道可令氣流通暢無阻,最大限度消除了湍流現象。