整體結構
G70在原有6800的基礎上作了多方面的改進,下面帶大家逐一了解。
G70有著8個vertex shader單元,比6800多出2個——按比例算就是增加了33%。
Vertex Shader處理單元架構
vertex shader與pixel shader的關係是:以三角形為例,渲染的時候,vertex shader只需要處理三個頂點的數據,而pixel shader卻需要處理三角形中所有像素的數據。因此vertex shader往往比pixel shader少很多。
GeForce 7800 GTX擁有8個像素單元,更加降低了vertex shader的成為系統瓶頸的可能性。改進vertex shader,讓影子更加逼真
所以在大多數遊戲當中,成為顯示卡性能瓶頸的都是pixel shader的處理速度。
速度流程
在增加數量的同時,GeForce 7800 GTX加快了“Triangle Setup”的速度,它的作用是:根據三角形的三個頂點,來確定三角形的光柵區域。簡單來說就是確定在三角形內部pixel shader要計算的像素。
GeForce 7800 GTX對vertex shader還有另一個改進——提高了vertex shader單元對紋理的讀取速度。vertex shader的紋理讀取(texture fetch),是SM3.0中一個重要的規範。其中一個使用的例子就是Displacement Mapping:用一個紋理(例如圖片,也可以是pixel shader剛剛渲染出來的圖像)記錄頂點的高度、向量等信息,然後通過vertex shader讀取這些信息,改變每個頂點的高度等性質,以實現真實的效果,從下圖可以看出Displacement Mapping的一個優點:
BUMP MAPPING並沒有改變地面的高度等屬性,所以影子效果十分不真實。GeForce 7800 GTX加快了紋理讀取的速度,自然也就提高了這類特效的處理速度,影子效果更加真實。
GeForce 7800 GTX架構為現在最熱門的特效——HDR(High Dynamic Range,高動態範圍渲染,SM 2.0中就支持的特效,能夠使各種光的效果更加真實)作了最佳化:它重新設計了紋理處理引擎,使得不同數據寬度紋理的存取速度大大提高,無論是HDR渲染還是各向異性過濾,速度都會有一定程度的提高。
新增模式
用最快的速度讓邊緣更平滑
NVIDIA的工程師創造新增了兩個抗鋸齒模式——透明度自適應超級取樣和透明度自適應多重取樣,藉以提高抗鋸齒的性能和質量。
通過額外的像素取樣和抗鋸齒傳遞,透明度自適應取樣增加了諸如鏈狀的柵欄、樹木和草類植物之類的細線行物體的畫面質量。通常那些樹枝和花草都是由一些簡單的三角形貼上含透明度的紋理形成的,現有的抗鋸齒方法對三角形內部的像素不起作用,而透明度自適應取樣使用了ALPHA通道標記技術——所有被標記了的區域可以接受取樣,就算他們不位於三角形的邊緣。從下面可以看到,取樣的結果令這些邊緣顯得很平滑。
不需要使用ALPHA通道的紋理,留意綠色區域的邊緣。
需要使用ALPHA通道的紋理,傳統的抗鋸齒方法,不會在三角形內部取樣
透明度自適應取樣模式的區別:透明度自適應超級取樣是對每個像素進行取樣,而透明度自適應多重取樣則是用一個像素的取樣值代表其周邊像素的取樣值,所以這兩個模式前者注重畫質,後者注重性能。
其他能力
大大加強的硬體視頻處理能力等
GeForce 7800 GTX終於真正實現了計畫中的Pure Video。這個GPU內建的視頻編碼解碼加速技術,本應在GeForce 6800上就被實現。然而NVIDIA的第一次嘗試似乎沒有成功,很多GeForce 6800系列的用戶就抱怨顯示卡的視頻加速並沒有提供NVIDIA所宣稱的功能。
此外,GeForce 7800 GTX在一些小的方面做了改進:如提高顯存控制器的壓縮算法效率、提高視錐剔除的效率等等。
唯一沒有改變可以算是那16個光柵化單元了(ROP,raster operators)——數目與NV40相同。ROP的作用是對pixel shader生成的fragments(還未被加工的像素),進行多重取樣(如果需要的話)或者顏色和Z軸壓縮(在同一個時鐘周期內顏色和Z軸壓縮可以同時做),最後轉換成可以在顯示器上輸出的畫面(當然也可以作為紋理被shader讀取)。
整體策略
以速度為目標的的整體策略
總結起來,GeForce 7800 GTX與Geforce 6800 Ultra的主要區別如下:
GeForce 7800 GTX Geforce 6800 Ultra
研發代號 G70 NV40
製造工藝 0.11微米 0.13微米
核心頻率 430MHz 400MHz
顯存頻率 1.2GHz 1.05GHz
vertex shader 8個 6個
pixel shader 24個 16個
是否支持自適應超級取樣 是 否
MAD指令執行時間 1時鐘周期 2時鐘周期
從各項規格介紹看,GeForce 7800 GTX主要的好處是全面提升速度。由於除了速度的提升之外,缺乏能帶來畫質革新的特殊效果,有人詬病G70革新味道不夠,更象是6800的改進版,而不足為真正意義上的新一代顯示卡,就如當年GeForce 3與GeForce 4的關係一樣。
G70是數控加工中精車循環