核心
電晶體數達6.66億個,發熱低、體積小
支持PCI Express 2.0圖形接口,將匯流排數據傳輸率提高一倍
全球首顆55nm工藝的GPU,基於R600大幅度改良
率先支持DirectX 10.1,可實時渲染全局照明等新特效
最佳化的記憶體控制器,256bit即可達到原先512bit的性能
支持四卡交火,性能相對單卡提升可達3.2倍
支持Avivo HD,無論H.264還是VC-1都能完美硬解碼
支持HDMI,未來可兼容Displayport輸出接口
顯示卡
核心擁有320個處理器
採用單槽散熱設計,節約空間
設計功耗95w,相對2900XT下降超過一半
官方定價1299元,超強性價比
不但如此,採用RV670核心的HD 3800系列的功耗控制及其出色,設計功耗不到HD 2900XT的一半,但是性能並未縮水。RV670在規格上也有先進之處,所支持的PCI-E 2.0和DX10.1都是顯示卡未來的發展趨勢。而最佳化的256bit記憶體控制器,不能實現了之前512bit的性能,更是將成本大幅度縮減,為廣大用戶帶來了性價比至強的顯示卡。
本文將主要基於HD3850,HD3870從規格上說只是比HD 3850頻率更高,關於HD3870的詳細評測我們會在後續文章中專門介紹。
數字決定定位
由HD 3800開始,ATI顯示卡不再以以往的XTX、XT以及Pro命名。同時新產品名稱中的“70”代表定位高端,“50”則代表定位中端,據稱“30”則是主攻主流市場。據稱ATI隨後將會推出採用AGP插槽的HD 3850,也就是現有的HD 3850搭配橋接晶片的版本。不過目前這款產品的各種信息都屬於保密範圍。
ATI表示3800系列代表著ATI針對高端顯示卡的3大全新理念:
1.高端顯示卡應該具備中端卡的價格,3850接近1000元的價格,卻提供2900XT的性能;
2.高端顯示卡應該估計用戶的使用感受,他們的功耗和噪音都應該和符合中端卡的標準,此次3800系列採用的POWERPLAY的筆記本技術大大降低了系統的噪音;
3.高端筆記本應該有其他競爭產品沒有的高規格,比如DX10.1和PCIE2.0,以及整合音效卡的HDMI輸出,UVD以及55nm工藝。
3800系列開創3A平台
ATI從3800系列開始強調平台的概念。用戶在購買顯示卡之後,不僅獲得顯示卡的性能提升,還將從AMD整體平台獲得更多的性能提升。針對顯示卡部分,具體可以表現在3個部分:
1.AMD獨有的OVERDRIVER可以針對所有系統自動超頻,包括顯示卡。只針對ATI、AMD平台起作用,和NVIDIA、Intel的不同,任何廠商都會獲權使用這個軟體。
OVERDRIVER
2.也是最重要的,當用戶採用AMD的CPU+主機板晶片組以及顯示卡的時候,系統的BIOS會自動偵測到用戶的機器配置,並且通過CPU自動提升7%的性能。而非ATI的顯示卡則不會獲得這個提高。
RD790主機板將是HD3800系列的最佳搭檔
3.之前AMD和NVIDIA的主機板晶片組與顯示卡之間偶爾會出現兼容性問題。在AMD發布AMD史上最強大的RD780/790平台之後,主機板的價格從500一直覆蓋到2000元,給消費者提供強大而豐富的選擇,避免兼容性問題的產生。
架構解析
最早出現統一渲染特性的顯示核心是在ATI與AMD合併之前,ATI為微軟的次世代主機Xbox 360設計開發的Xeons處理器,不過僅基於DirectX 9架構。ATI在R600上第一次全面採用支持DirectX 10的統一渲染晶片架構,而本次的RV670雖然是R600基本架構的延續,但是首次支持DirectX 10.1。
RV670架構源自R600
從圖中我們可以看到Ultra-Threaded Dispatch Processor這個處理器負責整個GPU內部的執行緒調度,使得所有的Stream Processing Unite在同一時間運行不同的Shader程式,從而實現不同的運算功能。但是這種執行緒級運算很容易因為延遲導致性能下降,而ATI引入的虛擬執行緒技術正是為了解決這一問題而來。
SIMD在渲染流程中的位置
該技術可以讓Ultra-Threaded Dispatch Processor時刻保持滿載狀態,這些執行緒最終會被送進SIMD(Single-Instruction Multiple-Date)陣列,然後通過位於這四組SIMD陣列後各自獨立的指令處理單元完成指令運算。
多達64組,每組5個ALU,合計達320個Stream Processer也為RV670的性能提供了充足的保證。和競爭對手的8800GT一樣,其運算負載由當前渲染幀中的幾何與像素運算比例所決定,並且進行動態調整並始終保持滿負荷狀態,從而達到最佳性能。
RV670的紋理單元及快取部分
此外RV670核心還包含了四組相互獨立的Texture Unite,它們可以並行運作,共享L2 Cache中的幾何頂點數據。位於整個渲染流程尾部的是傳統的Render Back-Ends部分,RV670在此處相比R600加入了全新的特性,使得全螢幕抗鋸齒的性能得到了不小的提升。
顯存位寬
旗艦級產品都是不惜成本、片面追求性能的產物,NVIDIA的G80核心擁有384Bit顯存控制器(降格版8800GTS是320Bit),而AMD的R600則首次使用了512Bit顯存控制器,再搭配以高速的GDDR3/4顯存顆粒,使得顯存頻寬大增。但代價就是PCB和顯存成本增加不少,成本無法得到有效控制,各大AIC/AIB也無法推出非公版產品。
2900和8800都不存在非公版產品,核心與PCB造價都非常昂貴
實現512Bit顯存需要多達16顆顯存,不但顯存顆粒採購成本高,而且PCB布線非常複雜,HD2900XT使用了14層PCB,正反兩面各分布8顆顯存才達到要求,整卡成本可想而知會有多么昂貴,AMD基本是賠本在賣。而NVIDIA的8800實現384Bit也需要多達12顆顯存,成本方面難以控制,即便是10顆顯存的8800GTS 320MB也幾乎沒有降價的空間。
HD 3850的供電部分相對頂級卡簡化了不少
如今HD 3850返璞歸真,重新啟用256Bit顯存規格。256Bit只需要8顆顯存就能達到要求,前幾代高端顯示卡都是256Bit規格,PCB設計沒有任何難度,成本可以得到大幅下降,雖然性能方面無法取得突破,但超高的性價比
相信是很多用戶喜聞樂見的!
處理器資源
既然顯存頻寬並非瓶頸,那么當務之急就是提高核心渲染能力。RV670雖然不是旗艦級產品,但它的核心規格不但沒有下降,反而有所提升。RV670核心擁有和R600相同的320個流處理器,只是將顯存位寬由512Bit降至256Bit,可以說和競爭對手G92的做法完全相同。不過ATI暫時沒有禁止流處理器的計畫,也就是說基於RV670核心的HD 3800系列都是320個流處理器的規格,只通過頻率來劃分定位。
RV670核心面積雖小,但核心規格沒有任何縮水
流處理器數目保持不變,但新工藝的採用讓頻率可以達到更高,高頻率讓GPU純渲染能力大幅提升。
高清硬解碼
以往的高端DX顯示卡令人遺憾的是都不提供高清視頻硬體加速解決方案,只有中端和低端核心支持硬體加速,G80隻支持HDCP,R600可以支持HDCP和HDMI,沒有UVD。
雙方對於高端產品不支持硬體加速給出了相同的解釋:使用高端顯示卡的用戶會搭配高端雙核甚至四核CPU,流暢播放HD影片不成問題;此外G80和R600的電晶體數已經非常恐怖了,很難再容納下額外的硬解碼模組。這種解釋聽起來很有道理,但也令高端用戶比較遺憾,畢竟硬體加速能夠將CPU占用率降至最低,GPU只要動用很小的模組就能進行視頻解碼,所以系統整體功耗和發熱會大幅下降,這種技術無論對高端用戶和低端用戶都很實用。
NVIDIA將G84/G86核心中的BSP+VP2模組原封未動的植入G92核心當中,雖然使得8800GT能支持H.264編碼高清視頻的完全硬解碼,但是對與VC-1編碼的高清視頻還是需要CPU承擔大部分解碼工作。NVIDIA用VP2模組負責後三個步驟的解碼任務,VP2對於H.264和VC-1視頻都有效。而BSP引擎專門負責H.264解碼的第一個步驟,這也是負載最重的一步,但它無法解碼VC-1的第一步,還是交由CPU處理。
高清解碼步驟
本次RV670核心則集成了原先包含在RV630/RV610核心中的UVD引擎,毫無疑問,UVD引擎要強於PV2,主要原因就是PV2無法做到VC-1純硬體解碼,CPU還需要參與一些解碼工作。UVD引擎是一個單獨的模組,它能夠獨立負責所有四個步驟的解碼任務,H.264和VC-1支持度沒有區別,這樣就真正做到了對藍光和HD-DVD兩大高清視頻的純硬體解碼!
UVD在VC-1方面解碼優勢很容易理解,但ATI也表示,UVD在H.264方面的解碼能力也是要略強於BSP+VP2模組,因為NVIDIA是通過BSP和VP2兩個模組協同完成解碼,兩者之間的數據轉移可能會占用更多的顯存和CPU使用率,而單獨的UVD模組就要稍勝一籌!
RV670新特性:集成5.1聲道音效卡,方便HDMI一線輸出
R6XX全系列顯示卡集成杜比5.1聲道音效卡,為HDMI輸出音頻
此外R6XX全系列核心都集成了音效卡,全面支持HDMI,安裝使用非常方便,而很多GF8顯示卡都不支持HDMI,即便提供支持的產品安裝使用起來也比較麻煩。
A卡專用DVI轉HDMI輸出轉接頭
DVI是數字接頭,各個針腳傳輸的數據都經過了編碼進行串列的高頻傳輸,只要GPU能輸出音頻信號到DVI接口,就可以通過特殊的轉接頭將數字音頻信號提取出來,按照HDMI的標準傳輸