產品簡介
本文所涉及到的規格與數據,均採用nVIDIA公版顯示卡。第一代
DX7.0OpenGLPCI/AGP4X(DDR版本只有AGP接口)
GeForce256是第一款256bit顯示核心的可程式GPU,支持T&L立方環境映射、Dot3凹凸映射和HDTV動態補償和硬體alpha混合。在顯示接口方面,GeForce256率先開始支持AGP4×快寫模式。
第二代
DX7.0OpenGLAGP4X
GeFoece2有明顯高低端之分,MX系列為低端,其餘系列為中高端。
加入數字振動控制(DVC),TwinView(雙頭顯示)功能。在當時,FSAA技術已經開始興起,FSAA可以大量的改善畫質,去除難看的鋸齒,甚至是舊遊戲也可以讓它變得更光滑好看,此前只有3dfx的雙VSA-100晶片Voodoo5支持。GeForce2GTS也可以用硬體FSAA,它的方式是用SuperSampling,但是SuperSamplingFSAA只能使用在低解析度,很顯然的,nVIDIA的SuperSampling方式比3dfx的MultiSampling的效率還要差,另外nVIDIA驅動程式沒有DirectX的FSAA功能,這使得擁有FSAA技術的GeForce2GTS並沒有得到很好的改善畫質的效果。
支持S3TC、FSAA、PixelsShaders和硬體動態MPEG-2動態補償功能。
第三代
DX8.0OpenGLAGP4X
光速存儲結構(LightspeedMemoryArchitecture),在高解析度下,即使當時最快的DRAM模組也無法滿足新一代的圖形晶片這個事實已經不再是什麼秘密。就因為這個原因ATI開發了HyperZ技術,它可以解決許多在存取數據和消除Z緩衝中浪費掉的頻寬。它屬於一種無損的壓縮算法(即減小了數據量,但不降低畫面精度)。nVIDIA的LMA結構的出發點和ATI十分類似,他們希望通過最佳化顯存頻寬的方法來達到最大限度利用板載230MHzDDR顯存的目的。其中首要的創新是多路交叉顯存控制器(CrossbarMemoryController)。我們知道128位的DDR顯存在一個時鐘周期內可以同時傳遞2次數據,換句話來講就是一次可以傳遞256位的數據包。但問題就出在這裡:如果一個數據包的容量只有64位,也會占用一個數據傳送周期,也就是在硬體端傳送數據時仍然被當做256位來看待的,所以這裡頻寬的利用率實際上就只有25%非常低下。GeForce3改變了這個情況。它提供了並行工作的4個顯存控制器,這些裝置能夠在與GPU通訊的同時互相聯繫,具體一點就是4個控制器分別掌管64位數據頻寬,在遇到大數據包時(>64位)可以整合在一起工作,遇到小的數據包時各自為戰。這樣的處理方式極大地提高了顯存頻寬的利用率。
在LMA架構中的第二項技術是無損的Z軸數據壓縮算法,這個改進思想來源於ATIRADEON。由於晶片處理每個像素的時候要考慮到它們在三維場景中的深度坐標,所以Z緩衝是顯存和晶片之間數據傳遞的關鍵部分,頻寬占用的分量最重。nVIDIA已經開發了一個可以將Z軸數據壓縮四倍的算法,在不會帶來任何精度喪失的同時,也節省了許多不必要的頻寬浪費。nVIDIA稱之為光速顯存架構亦可以稱為VS(VisibilitySubsystem,可見子系統)。它和隱藏表面去除(HiddenSurfaceRemoval)有著密切的關係,這是一種在PowerVR和Mosaic晶片設計中得到大量論述的關鍵技術。如果沒有這種技術,一塊圖形晶片必須處理CPU傳送來的每個3D對象,甚至那些在最終圖像中被臨時遮蔽的對象。採用了繪製隱藏對象或表面的過程稱之為超量繪製(OverDraw),它意味著圖形晶片在一個典型3D遊戲中要渲染2到4倍於所需的像素。這次nVIDIA已經加入了一個被稱之為Z軸吸收選擇(Z-OcclusionCulling)的技術來達到和隱藏面去除技術類似的效果。GeForce3通過在繪製一個幀的早期檢查深度值來取消隱藏的像素,也就是在套用轉換和光源效果之後。nVIDIA聲稱它預防超量繪製的方法在實際處理過程中可以獲得50%-100%的性能提升。
其次是nVIDIA的nfiniteFX引擎,nVIDIA在標準的T&L引擎旁邊增加了一個高度可程式的動畫和效果引擎,這就是“nfiniteFX”引擎。它是GeForce3中最精密、複雜的新單元,與純粹的T&L引擎相比它的套用更為廣泛。雖然可程式性聽起來更像是針對開發商而言,玩家或許不會對此關注,不過可以肯定一點的是沒有人喜歡一再看到同樣的3D特效!根據這樣設計,遊戲設計師們可以創造出獨特和充滿變化的效果。
nfiniteFX引擎分為2個部分:一個專用於處理像素的,另一個則專門用來處理頂點或幾何效果。我們記得在GeForce2GTS發布的時候,它的像素著色器(PixelShaders)的技術已經非常眩目。這次NVIDIA決定讓它增值,新的技術叫做頂點著色器(VertexShaders)。新的頂點流水線可以優先傳送實時可見的視覺效果。GeForce3中的可程式VertexShaders技術允許開發者有更多的選擇。過去一個頂點數據包含了位置坐標(X,Y,Z)、顏色、光影和紋理結構數據,現又多了一個VertexShaders數據。它可以在不需要CPU經常傳送指令的前提下改變3D對象。頂點Shader效果尤其生動,因為它們可以控制一個物體的形狀、動畫或光線。很方便地操控一個頂點數據浮現在別的表面,表現不同的透明度以及不同的色彩等。當然了並不是每個頂點都需要進入到VertexShaders中進行處理,只有當有特殊要求的時候,這才是必要的。
就像你從附圖中看到的那樣,頂點投影和硬體T&L加速單元並行執行。如果頂點陰影器正在運行則T&L單元就空閒下來。這並不是一個問題,因為其實陰影器本身也包含有硬體加速頂點轉換的功能,可以說VertexShader是性能更強大,功能更多的硬加速轉換和光影引擎。之所以讓兩者同時存在則是為了兼容的原因。VertexShader是可程式的,這裡有大量的效果可以產生,唯一的限制是開發人員的編程技能。NVIDIA已經提供了一個手冊介紹了整個效果庫,其中包括了近百種效果。下面我們簡單地來看看VertexShader包含的效果。
還有就是頂點效果,角色動畫最早被使用在VertexShaders中。如果你記得,ATI已經在Radeon引入了一些硬體編碼的特點,例如遊戲角色的關節皮膚或關鍵幀插補技術。GeForce3可以進行更加精密的皮膚處理,它允許利用內部骨架建造角色,而美工(或者遊戲的物理引擎)來實現骨架的運動,同時仍然以真實方式保持關節附近的紋理。
第四代
MX:DX7.0OpenGL1.3AGP4X/8X/AGP橋接PCI-E(PCX4300)
TI:DX8.0OpenGLAGP4X/8X
GeFoece4有明顯高低端之分,MX系列為低端,TI系列為中高端。
GeForce4MX(研發代號為NV17)。GeForce4MX並不是源自GeForce4Ti的核心,而是源自於GeForce2MX所採用的NV11圖形核心。與GeForce2MX相比,GeForce4MX最主要的改良是擁有較高的頻率與兩段交錯式記憶體控制器的LMAⅡ(GeForce3與GeForce4Ti有四段),可以增加可利用的記憶體頻寬。
GeForce4Ti仍採用4條渲染流水線,每條流水線包含2個TMU(材質貼圖單元),但GeForce4Ti是依靠其他方面的改進和增強來實現提高性能的目的。在T&L單元方面擁有nfiniteFXⅡ引擎,它是從GeForce3時代開創的nFiniteFX引擎改進而來的。在GeForce3中只有一個頂點著色引擎,而GeForce4Ti配備了兩個。兩個平行的頂點著色引擎是可以在同一時間處理更多的頂點。兩個單位都是多執行緒與多執行緒處理,並在晶片上執行的,因此可以通過應用程式或API來獲得性能上的好處。指令的分配是由NV25所處理的,但是那必須去確認每個頂點著色引擎處理的是不同的頂點,這樣才會使平行處理變得較實用。頂點著色引擎是從GeForce3內的原始版本所最佳化而來的,因此降低了指令的延遲。
此外,GeForce4Ti也同時引入了LightSpeedMemoryArchitectureⅡ(LMAⅡ)光速顯存構架Ⅱ技術,通過最佳化渲染過程及數據壓縮等技術,大大節省了顯存頻寬,提升了顯示卡的性能表現。在全螢幕反鋸齒方面,GeForce4Ti採用了新的AccuviewAA技術。
nVIDIA使用「新的取樣位置」來改善AA的品質,因為可以減少錯誤堆積,特別是使用QuincunxAA的情況下。新的過濾技術會在每次(多重)取樣時被一起執行來產生反鋸齒的幀,並且省下了完整的幀寫入,這樣可以大幅改善AA的性能。基本上,Accuview應該可使AA看起來更好看,並且跑的更順。
GeForce4可以把nVIDIA特有的「Quincunx」-AA執行像一般2x-AA一樣快。除此之外,nVIDIA增加了額外的模式,叫做「4xS」。這個模式應該看起來會比4xAA模式好很多,因為增加了50%的子像素覆蓋範圍(不過這個模式只支持Direct3D遊戲,不支持OpenGL)。通過採用新的取樣方式並最佳化執行過程,GeForce4Ti在這方面的速度是GeForce3的2倍,它保證了高解析度下的運行速度,取得了性能和畫面品質之間的平衡。
第五代
GeForce5(官方統稱為GeForceFX系列)是由nVIDIA研發設計的第五代GeForce顯示核心產品,分為GeForceFX和GeForcePCX兩大系列。
GeForceFX發布於2002年11月18日。(核心代號NV3X)採用新一代的DX9.0技術,可提供比7.0和8.0更逼真的遊戲特效。GeForce5200作為NVIDIA第一款支持DX9.0的廉價顯示卡,表現的效果並不理想,但憑藉著DX9.0的名氣,市場購買量非常大,但性能卻還不如GeForce4Ti系列,系列的中端產品GeForceFX5600/5700,也並不成功。就算是GeForceFX5600U在DX9.0方面,也不盡人意。其高端的GeForce5800,5900,5950,其溫度高,功耗大,溫度和功耗並對不起它本身的性能。與對手ATI的Radeon9600,9700,9800的性能相差甚遠,NVIDIA在GeForce5系列徹底輸給對手ATI。
DX9.0+OpenGLAGP8X橋接PCI-E(PCX系列支持HCT、CineFX1.0、CineFX2.0、UltraShadow等技術。)
GeForcePCX(核心代號NV3xPCX)在2004年2月17日的IDF2004上正式發布。是業界第一套全系列支持PCI-E接口的GPU。但GeForcePCX只是GeForceFX系列顯示卡配合HSI橋接晶片而支持PCI-E,瓶頸依然存在,所以GeForcePCX只是理論上支持PCI-E,完全不能發揮PCI-E應有效果。GeForcePCX名副其實是過渡產品。
第六代
DX9.0COpenGL1.5AGP8X/PCI-E。
首款支持DX9C與SM3.0的產品。
NV40將NVIDIA特有的CineFX技術提升到了3.0版本,支持PixelShader3.0VertexShader3.0、實時位移映射和Tone映射,最多支持16紋理/通道,支持16bit和32bitFP格式、sRGB紋理,支持DirectX和S3TC壓縮、支持32bpp、64bpp和128bpp渲染以及更多的新視覺效果。
GeForce6加入了HDR?High-PrecisionDynamic-Range,高精確度動態範圍OpenEXR技術、支持FP濾波、紋理、混合。改進的Intellisample3.0,支持16×AA,改善了壓縮性能;支持HCT高解析度壓縮,它是一種全新的色彩、紋理和Zbuffer在所有模式中的無損壓縮算法,並具有高解析度高頻率和快速Zbuffer清除功能。採用了UltraShadowⅡ技術,在大量陰影化套用遊戲如DoomⅢ中,與上一代GPU相比可提高4倍性能。
另外geometryinstancing也是很實用的功能之一,它可以讓開發者批量處理大量瑣碎的運算和小模件,把他們組成一個大的模組並有效的由匯流排傳輸到圖像裡面――這個功能對於即時戰略遊戲特別有用。通過geometryinstancing的功能,程式只需要傳送較少的繪圖指令就可以批量處理所有的數據,從而大幅度減輕處理器的負擔。
GeForce6還增強了溫度監控和管理功能,增強了顯示和視頻輸出功能,如NVIDIADigitalVibranceControlDVC3.0和NVIDIA數字振動控制3.0。在API方面,NV40支持最新的DirectX9.0C和OpenGL1.5。
另外,GeForce6還增加了渲染管線和CineFX3.0技術。渲染管線作為引擎最重要的功能之一,當3D模型製作完畢之後,美工會按照不同的面把材質貼圖賦予模型,這相當於為骨骼蒙上皮膚,最後再通過渲染引擎把模型、動畫、光影、特效等所有效果實時計算出來並展示在螢幕上。渲染管線就相當於處理這一系列工作的工作者。渲染管線的快慢直接影響圖形最終生成的快慢,雖然GPU可以在一秒鐘內處理相當多的三角形,但需要依賴渲染管線來進行貼圖等即時處理。所以它的強大與否直接決定著最終的輸出質量。
GeForce6採用了一個完全不同於GeForceFX的著色器,尤其是對ShaderModel3.0(著色器模型3.0)的支持是其獨有的功能。ShaderModel3帶來了三方面的改進:大大豐富了的編程模型,這樣你可以編寫更長的程式,可以進行更佳的程式流控制。因此從開發者的角度來看,他們在ShaderModel3上可以做更多他們感興趣的事情,可以做過去在ShaderModel2上不能實現的功能,或者在ShaderModel3上更有效的去實現某些功能。例如複雜的人物卡通片製作,在ShaderModel3的程式中當你需要略過某個角色或場景時,你可以分支或跳過一些暫時無用的代碼,這樣可以達到更快及更佳的效果,而在ShaderModel2你就必須去執行這些代碼。由此來分析,ShaderModel頂點紋理取碼(vertextexturefetch)是相當值得關注的一項技術。頂點紋理取碼允許應用程式直接從顯存中提取紋理信息來作頂點處理,這種技術可以用在包括實時位移貼圖(displacementmapping)等方面使用,通過這個功能你可以在頂點著色器3.0中實現各頂點的位移工作。
從象素的角度來說,GeForce6提供了一個更豐富的編程環境,你可以編寫非常非常長的程式,它可以提供比ShaderModel 2更多的指令數。你將得到一個真實的程式流控制模型,它可以提供循環及分支選項,就等同一個真實的編程環境。ShaderModel3擁有FP32(32位浮點)的精確度,你不可能得到任何因不夠精度計算下產生的對象,現所有低於FP32的運算都只能定為不夠精確。隨著程式的複雜化,FP24在精度方面的不足會越來越明顯。PixelShader3.0的指令槽數目是512,通過循環和分支選項,最多可以執行65000條指令。
在處理方面,GeForce6採用了頂點處理器,和R420不同在NV40的頂點處理器中是一個32位的浮點向量ALU、32位的浮點標量ALU,以及一個頂點材質陰影單元(這個材質單元還有一個專用的cache),相比較X800的128位的向量處理器似乎少了一點,但是在GeForce6的頂點處理器中最至關重要的就是他的頂點材質處理器,這是ATi所沒有的,這個處理單元是GeForce6所使用的Vertexshader3.0技術所必需的,這項技術已經給大家展示出了它的魅力。
和R420不同,NV40的16條像素管線仍然並行分布,而不是上面我們看到R420那樣將16條管線分成了4組,並規定了各自的功能。這樣的優點是可以非常的靈活組合,NV40支持8x2以及16x1以及32x0三種管線模式,即一個GPU周期同時處理兩塊像素,每塊材質可以有8條管線;或者同時只處理一塊材質但是其中使用了全部16條管線;當處理Z軸數據時它不需要分兩次獨立處理,也就成為事實上的32管線。NV40的像素處理器的另一個特點就是使用了超標量技術,我們知道這項技術最好的套用典範便是Intel的CPU。這項技術使得NV40在處理像素時每個GPU周期可以處理最多達到8個像素點,效率比不使用這項技術時理論上最多可提高50%的性能。
第七代
DX9.0COpenGL2.0,DX9.0COpenGL1.5(7100GS)AGP8X/PCI-E
支持CineFX4.0Engine高精度渲染引擎、IntlliSample智慧型反鋸齒系統、PixelShader渲染指令集,完美支持MicrosoftDirectX9.0ShaderModel3.0和OpenGL2.0optimizations引擎等技術特性,同時執行效率較GeForce6系列有大幅提升。
G70核心提升至IntelliSample4.0版本,除了提升至16X各項異性過濾達128Taps採樣外,更加有了兩種全新的反鋸齒模式,TSAA(透明動態超級採樣)及TMAA(透明動態多採樣),舊有的反鋸齒技術無法對幼長的物件如柵欄、樹葉、植物等物品於Direct3D下產生作用,但新的TSAA及TMAA模式則能解決以上問題,這也是上代GeForce6所不能比擬。
Geforce7950GTAGP顯示卡通過橋接技術成為AGP最後絕唱。
第八代
DX10.0OpenGL2.0PCI-E/PCI-E2.0
NVIDIAGeForce8代產品發布前本來是有AGP8X版本的Geforce8400以及8600產品,由於AGP8X位寬等問題從八代產品起徹底拋棄AGP老平台。
2006年11月8日(台北時間9日),nVIDIA公布了新的顯示卡型號--Geforce8系列,揭開了DirectX10的大幕,GeForce8800GTX與GTS天價問世,其後續推出的旗艦級顯示卡GeForce8800Ultra成為了史上最強悍的顯示卡。
GeForce8採用前所未有的設計,統一Shader架構(UnifiedShader)帶來強勁的性能。G80完全硬體支持DirectX10的各項先進特性,例如GeometryShaders、streamout、Improvedinstancing和ShaderModle4.0,支持這些特性使得Geforce8800GPU擁有極高性能。所有的DirectX9、OpenGL和先前的DirectX程式和遊戲在GeForce8GPU的UnifiedShader設計上都有高性能的演出。
第九代
DX10.0OpenGL2.0PCI-E2.0
GeForce8大部分產品的工藝與頻率改進版
第十代
GeForceGT200系列
DX10.0OpenGL2.1PCI-E2.0
第二代NVIDIA統一Shader架構。
支持128位浮點高動態範圍(HDR)照明。
NVIDIA第一次放出雙芯顯示卡GeForceGTX295,並且憑藉著雙芯顯示卡實現4-waySLI技術。兼容Windowsvista系統(GTX285亦有Mac版)。
第十一代
GeForceGT400系列
DX11.0OpenGL3.2PCI-E2.0x16
採用NVIDIAFermi(費米)架構,支持並行Tessellation(曲面細分)引擎,NVIDIA3DVisionSurroundReady等新技術。兼容Windows7及DirectX11.0。對OpenGL3.2提供最佳化在GTX400系列中開始普遍使用第五代顯存技術(GDDR5)
第十二代
GeForceGT500系列
DX11.0OpenGL4.2PCI-E2.0x16
採用第三代Fermi架構,每一個Fermi的SMS均包含32個CUDA處理器,與上一代SM設計相比,數量增加了四倍。首款可充分存取高速快取的GPU架構。高速快取長期以來一直為CPU所用,其目的是提升存儲器存取性能。同GTX400系列,兼容Windows7及DirectX11.0。但對OpenGL4.2提供最佳化雙芯卡GTX590
第十三代
GeForceGT600系列
DX11.0OpenGL4.2PCI-E3.0
採用NVIDIAKepler(克卜勒)架構,全新的SMX流式多處理器在效率方面可達上一代架構的兩倍,全新幾何圖形引擎繪製三角形的速度也實現了翻倍。支持GPU動態提速技術(GPUBoost),自適應垂直同步,兩種全新的抗鋸齒模式:FXAA與TXAA雙芯卡GTX690
第十四代
GeForceGT700系列
DX11.2(理論支持win10的DX12)OpenGL4.2PCI-E3.0本代,NVIDIA推出自家單芯旗艦級顯示卡TITAN(泰坦)系列。以及首次推出次旗艦級甜品級顯示卡GTX780Ti(此前Ti級別顯示卡一直處於中高端定位)
(註:GT800M系列並沒有桌面級GPU,因此並不是一個完整的系列,而且大多數GT800M系列顯示卡都只是GT700M系列高頻馬甲,因此被歸類與第十四代GeForce系列)
雙芯卡GTXTITANZ
第十五代
GeForceGT900系列
採用新一代NVIDIAMaxwell(麥克斯韋)架構,提供了如高級採樣、SuperResolution(DSR)、立體像素全局光照(VXGI)等尖端技術以及全新的抗鋸齒技術多幀採樣抗鋸齒(MFAA)
NVIDIA本次成功將桌面次旗艦級顯示卡GTX980完整的移入移動平台
標識含義
Ultra:Nvidia的旗艦級產品,為本系列中的最強者。
GTX:其性能介於GTS和Ultra之間。一般為NVIDIA首發的高端產品。
GTS:始終為Nvidia第三強的產品(GeForce 2 GTS與GeForce 8800GTS均可展示出來),性能處於GTX之下,與GT相比有些模糊。
GT:頻率提升版本"GeForce Technology"的縮寫,頻率和管線都較LE GS SE XT有較大的提升。
GS:相比GT,渲染管線或者顯存位寬的縮減,頻率一般在GT之下,並且由於規格限制,性能在GT之下。
LE:"Limit Edition"的縮寫,表示限制版本,代表某一產系列中的入門級產品,主要是頻率和顯存位寬均與標準版本相比有一定的下降,如geforce 7300LE。
SE:在Nvidia卡中不常出現,與LE相似。
XT:"Cost Down"表示降頻率版本,將標準版的頻率降低,部分產品削減了管線。
早期命名:
MX:GeForce2/4系列,低端產品
TI:GeForce2/3/4系列,中高端產品
NV曾經還有Model 64(TNT2 Model 64) PRO(GF2) ZT(FX5900) GSO(9600)
自GeForce GT GTS GTX 200開始, nViDIA開始使用"G、GT、GTS、GTX"的命名方法:
GTX: GeForce200/400系列 高端產品
GTS: GeForce200/400系列 主流級別產品
GT: GeForce200/300/400系列 低端系列產品
G: GeForce200/300/400系列 最低端系列產品
沒有: GeForce200/300/400系列 第二低端系列產品
自GeForce GT GTX 500開始, nViDIA開始使用"G、GT、GTX"的命名方法
GTX: 低端偏高產品(550TI,650,650TI), 中端產品 , 中高端產品 , 高端產品
GT: 低端產品
G: 系列最低端產品
沒有: 系列次低端產品
自GeForce GT GTX 600開始, nVidia開始使用"GeForce GT GTX"的命名方法
GTX: 遊戲用戶產品
GT: 普通用戶產品
GeForce: 入門級別產品
電影術語
《電競之王》
Geforce是電影《電競之王》里“顧曉飛”的英文名
《豚鼠特工隊》
相信喜歡迪士尼的朋友們都不會感到陌生,因為豚鼠們的代號,也叫做G-Force,可以理解為新生力量,也可以理解為豚鼠團隊,在四隻看起來很普通的老鼠的努力下,使得拯救世界。
顯示卡基本概念
顯示卡作為電腦最重要的配件之一,每個想要買電腦的人都需要了解它的基本知識,以便能挑到最適合自己的顯示卡。這個任務會簡要介紹顯示卡的一些重要的名詞概念。 |