基本介紹
AMD-ATI於2008年6月下旬發布的RV770晶片組顯示卡Radeon HD 4850,採用了經過最佳化,渲染效率更為高的統一超標量著色架構(Unified Superscalar Shader Architecture),內置的流處理器單元(stream processing units)高達800個,是RV670的2.5倍,全面支持Microsoft DirectX 10.1和Shader Model 4.1,能同時兼容DirectX 10.1、DirectX 10、DirectX 9以及OpenGL等引擎開發的3D遊戲。而且Radeon HD 4850的浮點運算能力已經達到接近1T Flops的水平。
規格參數
顯示卡型號 | Radeon HD 4850 |
核心代號 | RV770Pro |
工藝製程 | 55nm |
核心電晶體數量 | 9.56億 |
核心封裝面積 | 260mm2 |
核心時鐘頻率 | 625MHz |
核心Shader頻率 | 625MHz |
顯存時鐘頻率 | 1986MHz |
顯存類型 | GDDR3 |
顯存頻寬 | 256bit |
顯存容量 | 512MB |
Stream Processor | 160*5 |
紋理單元 | 40 |
ROPs | 16 |
接口匯流排 | PCIE 2.0 |
Shader Model標準 | 4.1 |
Direct X標準 | 10.1 |
互聯技術 | CrossfireX |
視頻回放技術 | UVD2 |
詳細介紹
核心構架分析
如果說DirectX 9.0C是像素渲染的時代,那么到了DirectX 10時代,渲染單元無疑成為了最影響顯示卡性能的架構單位之一。在末DX9時代,ATi意識到像素渲染的重要性,從R520(X1800XT)到R580(X1950XT)就通過1:3的黃金架構,暴力的提高了像素單元的數量,而得到的效果是立竿見影的。
ATi對這種“人口戰術”似乎非常偏愛,一直到了DX10時代,還是通過這種多比例的方式來提高重要的渲染單元,現在在ATi的架構中,流處理器和流處理單元的比例就是1:5。
RV770的整體核心規格是在RV670的基礎上進行了相關的擴充以及最佳化,它的具體改進有以下幾點:
1、更多的流處理單元:RV770在流處理器組群上由原來RV670的4組擴充至10組,因此流處理器也有了2.5倍的增長,達到160個(160x5=800個流處理單元)。
2、最佳化過的紋理處理單元:和流處理器組一樣,RV770的紋理單元也由RV670的4組擴充至10組,因此紋理填充單元也由當初的16個增加至40個,增長幅度為2.5倍。
3、更新的記憶體架構:RV770首發支持了最新的GDDR5技術,比起RV670,RV770還加入了顯存讀/寫快取區,但在顯存位寬上,RV770還是保持了原來的256bit。
4、重新最佳化過架構的Render Back Ends:在架構上做了相關的最佳化,最佳化了RV770在AA特效下的性能表現。
第二代UVD
發展到今天,GPU在電腦中占有的位置無疑越來越重要,主要表示在2D/3D視頻顯示處理上。在GPU能夠實現硬體解碼之前,所有高清片源都要通過CPU來進行解碼,這樣其實大大占用了CPU的使用率,而視頻部分本來就應該由GPU來負責,因此在新一代的GPU中,無論nVIDIA又或是ATi都引入了高清硬體解碼的技術。而在這一方面,ATi無疑做得比nVIDIA更好,第一代UVD就能夠實現了H.264及VC-1的高清硬解技術,而如今隨著RV770的發布,ATi已經更新至第二代的UVD解碼器。
第二代UVD最大的改進就是支持了多流解碼,這個概念即是表示UVD2能夠支持多部高清片源同時解碼,比起nVIDIA的雙流解碼功能更為強大。而在高清片源的支持上,UVD2已經能夠支持2160P的視頻解碼了!
第二代PowerPlay技術
更低的製作工藝意味著在更小的核心體積下能夠集成更多的電晶體,ATi自RV670起就採用了55nm的先進技術,領先於競爭對手,目前RV770已經是第二代的55nm工藝顯示核心了。新的RV770核心面積260m㎡,而電晶體數量已經達到9.56億,接近10億的數量。
儘管在生產工藝上領先於對手,ATi還是沒有放棄節能技術上的開發,上代RV670就推出了第一代桌面級顯示卡的PowerPlay節能技術——一個類似於筆記本的節能技術,當GPU空閒時顯示卡就會自動降頻以達到節能的目的。而現在RV770又再推出了第二代的PowerPlay節能技術,而ATI也給它起了另外一個名字“Power on Demand”,最大的特色是顯示卡會根據GPU、顯存的占用率來自動調配資源。
Havok物理加速技術
我們常說的物理加速引擎主要分為PhysX和Havok兩種,其中開發的PhysX的Ageia已經被nVIDIA收購,而nVIDIA在G92和最新的GT200系列顯示卡上都加入了PhysX的物理加速功能,在以後nVIDIA將會針對支持物理加速的顯示卡推出新的驅動,用戶僅需通過更新驅動就能免費獲得顯示卡性能提升。
目前nVIDIA和Intel針對GPU和CPU展開了激烈的話題討論,雙方各執一詞,nVIDIA希望往後的發展會靠向GPU這一邊,而Intel始終堅持PC里GPU只作輔助CPU之用,而在這場口水戰中,AMD占據的位置無疑更為重要,因為目前就全球來說,僅有AMD一家擁有CPU和GPU整個組合平台,AMD認為只有合理的分配好CPU和GPU,平台才能發揮出最佳的性能表現。目前nVIDIA和Intel已經分別將兩家擁有物理技術的公司Ageia和Havok收購,作為對抗nVIDIA的PhysX物理引擎,ATi這次藉助了Intel的Havok API來展開對物理加速引擎的支持。
其實在很早之前,大量PS2、Xbox平台遊戲都已經開始採用Havok引擎,這款物理引擎現在被廣泛用於3D MAX設計和遊戲開發中,是目前世界上最快、最方便的跨平台遊戲圖形解決方案,也是現今套用最為廣泛的物理引擎之一。據AMD表示,在未來的日子裡,將會有大量遊戲開發商以他們及Havok的物理技術去創造新的3D遊戲,相信相關的開發成品已經迫在眼前。
開放式GPGPU技術
nVIDIA提出了CUDA(Compute Unified Device Architecture)這個新的基礎架構,這個架構可以使用GPU來解決商業、工業以及科學方面的複雜計算問題。無可否認,隨著GPU技術的不斷發展,GPU目前在整套PC中占有的位置已經越來越重要,而nVIDIA於早段時間推出的GeForce GTX 280除了擁有超強的圖形運算能力,同時也是一款非常出色處理器並行架構處理器,浮點運算能力也達到了933GFlops,是目前CPU處理器的10倍左右。
而ATi最新發布的RV770,就Radeon HD 4850來看,其浮點運算能力已經達到1TFOLPS,比起nVIDIA的新旗艦顯示卡GTX280還要高出不少,從理論來看,ATI RV770在並行處理能力上還是占有不少優勢的,當然還得看實際的運行效率。
ATi垂青的是由蘋果公布的OpenCL開放式標準,它其中包括了物理運算、科學、圖形工作和娛樂等多方面的協調,旨在高度利用GPU的資源,來承擔更多的工作。
GDDR5顯存
從功能上理解,我們可以將顯存看作是GPU核心與像素渲染管線之間的橋樑或與倉庫。顯然,顯存的容量決定“倉庫”的大小,而顯存的頻寬決定“橋樑”的寬窄,兩者缺一不可,這也就是我們常常說道的“顯存容量”與“顯存速度”。更快速的顯存技術對整體3D性能表現有重大的貢獻,數據在渲染管線間傳送所花的時間通常比GPU執行功能所花的時間更長,因此提高顯存頻寬往往能夠比提高GPU核心頻率取得更為明顯的效果。
從上面的概念理解,我們可以知道顯存頻寬對於決定顯示卡的性能起到相當大的作用,由顯存頻寬=(顯存位寬 x 顯存工作頻率)/ 8 的公式可知,決定顯存頻寬的主要有顯存位寬和顯存頻率,ATi的R600,因為配備了512bit的顯存位寬,因此它顯存頻寬達到史無前例的106GB/sec,而到了RV670,ATi通過精簡架構,將顯存位寬重新定位在256bit上,雖然通過搭配頻率更高的GDDR4顯存,在一定程度上能夠提高顯存頻寬,帶始終GDDR4存在較大延時,也導致了GDDR4對比GDDR3時沒有太大的優勢。如今ATi的Radeon HD 4870將採用GDDR5顯存,顯存頻率能夠達到3600Mhz甚至更高,這也補充了RV770 256bit顯存位寬的不足。
從AMD的官方資料來看,顯存頻寬得益於GDDR的更新換代,在近幾年有了不少的飛躍,其中DDR2——GDDR3顯存頻寬經歷了一次成倍的增長,而另一次顯存頻寬的大爆發,將在GDDR4——GDDR5的這段過程上發生。
ATi在顯存技術上向來走在業界的最前端,在競爭對手還是使用GDDR3顯存時,ATi的RV770已經投入到GDDR5技術了。目前投產於GDDR5顯存技術的已經有奇夢達、三星、海力士三家,而其中奇夢達更是搶先和AMD達成了合作,據了解首批出貨的Radeon HD 4870都是採用奇夢達的GDDR5顯存,額定運行頻率為3600Mhz。
我們可以看見ATI的Radeon HD4870將採用奇夢達GDDR5的顯存顆粒,編號為“IDGV51-05A1F1C-40X”,理論運行頻率能夠達到4000Mhz。