綜述
製造工藝 | 55 nm |
核心頻率 | 633 MHz |
流處理器頻率 | 1404 MHz |
顯存頻率 | 1134 MHz / 2268 MHz |
顯存容量 | 896 MB |
顯存接口 | 448-bit |
顯存頻寬 | 127 GB/s |
流處理器數目 | 240 |
光柵單元 | 28 |
紋理單元 | 80 |
紋理渲染頻寬 | 50.6 GigaTexels/sec |
接口 | 2 x Dual-Link DVI-I |
插槽 | Dual Slot |
電源接口 | 2 x 6-pin |
TDP功耗 | 219 watts |
GPU溫度極限 | 105° C |
參數解說
關於GTX275的具體規格,從架構來看,GTX260擁有216個流處理器,即9組TPC(Texture Processing Cluster),而GTX275則擁有與GTX285一樣同為240個SP,顯然為了保證GTX275在性能上的較大優勢。當然,除了保證原有240流處理器數來提升性能外,提高顯示卡運行頻率也是行之有效的方法。我們可看做GTX275是GTX260的高頻版本,GTX275的核心頻率達到633MHz,顯存頻率1134MHz(即2268MHz),總體性能上會比GTX260有大幅度升幅。但值得一提的是,NVIDIA將不會推出公版的GTX275顯示卡,而是會把設計的許可權交給各AIC廠商,屆時各廠商將會自行設計合適的方案來打造這款GTX275。並且,公版的GeForce GTX275將繼續延用GTX260的P897 PCB設計方案,製作成本比較低,有利於市場競爭。因此GTX275繼續採用了這一設計方案,畢竟在顯存位寬上與GTX260一樣,基本上不需要改動什麼就可以直接使用原來的PCB了。
市售高端產品規格對比及發現
GTX 275 | GTX 285 | GTX 260+ | HD 4890 | |
電晶體數量 | 14億 | 14億 | 14億 | 9.56億 |
核心代號 | G200 | G200-350 | G200-103 | RV790 |
核心工藝 | 55nm | 55nm | 55nm | 55nm |
圖形核心架構 | ||||
連線界面 | PCI-E 2.0 | PCI-E 2.0 | PCI-E 2.0 | PCI-E 2.0 |
DirectX 版本 | DirectX 10 | DirectX 10 | DirectX 10 | DirectX 10.1 |
核心頻率 | 633MHz | 648MHz | 575MHz | 850MHz |
Shader單元數量 | 240個 | 240個 | 216個 | 800個 |
Shader頻率 | 1404MHz | 1476MHz | 1242MHz | 850MHz |
紋理單元 | 80個 | 80個 | 72個 | 40個 |
顯存類型 | GDDR3 | GDDR3 | GDDR3 | GDDR5 |
顯存頻率 | 2268MHz | 2484MHz | 2000MHz | 3900MHz |
顯存容量 | 896MB | 1024MB | 896MB | 1024MB |
顯存位寬 | 448bit | 512bit | 448bit | 256bit |
顯存頻寬 | 127GB/s | 158.9GB/s | 112GB/s | 124.8GB/s |
高清視頻加速 | ||||
技術名稱 | Purevideo HD | Purevideo HD | Purevideo HD | AVIVO HD |
H.264解碼支持 | 是 | 是 | 是 | 是 |
VC-1解碼支持 | 部分 | 部分 | 部分 | 是 |
集成數字音效卡 | 否 | 否 | 否 | 7.1聲道 |
在GTX275顯示卡上下毗鄰的兩款產品上,GTX275似乎更像是將兩者結合起來的產物,它擁有GTX285的240個流處理器數量,同時也擁有了GTX260+的448bit顯存位寬,這樣做即區分開了三者之間的性能差距,保證不會出現超頻後達到某款產品的性能,同時也更加合理的控制了顯示卡的整體成本。當然,NVIDIA自然也為GTX275顯示卡使用了55nm工藝,這一點與GTX285、GTX260+相同。
完整240個流處理器 核心架構回顧
因為NVIDIA目前的產品線橫跨兩代架構,所以我們有必要回顧一下GTX200系列產品的核心架構,也就是G200圖形核心的架構。從DirectX10發布統一架構以來,NVIDIA一共推出過三代產品。最早的當屬G80,也就是第一代統一架構核心,隨後的G92主要是工藝上的改變,在架構上基本延續了G80的設計。而G200圖形核心才是DirectX10後NVIDIA推出的第二代統一架構的新核心。
讀者可能都有印象,在DX10發布時提出了一個全新概念,將Pixel Shader與Vertex Shader單元統一起來不再做區分,也就是說一個Shader單元既能夠處理Pixel運算也能夠處理Vertex運算,此外,在統一架構當中還加入了Geometry Shader單元這個概念,同樣規Shader統一分配。在G200的第二代統一架構當中依然遵循著這樣的原則,只是NVIDIA再次強化了這個架構。
GTX275保留了GTX285上擁有的240個流處理器和40個紋理單元,這240個流處理器以及40個紋理單元被平均得分為了10個陣列,每個陣列當中包含24個流處理器(被劃分為3組)以及8個紋理單元,共享L1快取。NVIDIA在大幅度增強浮點運算能力的同時,也不忘繼續對紋理填充率的增加,相比較GTX285和GTX280,因為前者頻率更高,所以紋理填充率的數字也更高,達到了518億次/秒,而GTX280的數字為482億次/秒。
GTX275的設計模式可以進行整數運算以及浮點運算,存儲操作,和邏輯算符,每一個流處理器都是一個多執行緒硬體處理器,這樣的處理器將內建級流水線,每一條執行緒可以執行一條指令。GTX275的渲染流程包括頂點shaders、像素shaders、幾何shaders以及compute shaders,對於顯示卡的流處理器,為了獲得更多的效能,執行緒在執行一個shader程式時,其他很多相應的執行緒經常也會同時執行相同的shader程式。
此外NVIDIA的統一架構可以採用兩種不同的處理模式。對於TPC的執行,架構是MIMD(多重指令,多重數據)模式;而對於SM執行,架構就成了SIMT(單一指令,多重執行緒)模式。SIMT對SIMD(單一指令,多重數據)從性能和每一條可程式序兩方面加以改進。作為標量,SIMT並沒有設定矢量寬度,所以可以全速執行運算,而不用估計矢量大小。正好相反,如果輸入數據小於MIMD或者SIMD 的寬度的話,SIMD會以低速運算。SIMT可以確保處理器核心一直處於完全被利用狀態。
從編程人員的角度看,SIMT模式允許每一條執行緒占據各自的路徑。由於分支過程由硬體操控,所以沒有必要在矢量寬度中管理分支。兩種模式分別對應兩種運算類型,TPC模式更適合3D渲染,也就是3D遊戲需求;而SM模式則是大規模並行計算適合的模式,也就是基於CUDA技術的各種GPU加速運算,比如視頻編碼、比如圖形處理、比如科學計算等等。