北方群島

北方群島

Radeon HD 6000系列是一次妥協的產物,仍舊使用R600以來的核心架構體系,製造工藝也還是40nm,不過在諸多內部細節和技術特性方面進行了廣泛的增強,無論性能還是功能都大大優於Radeon HD 5000系列,而且產品良率也完全不再是問題。

命名解析

Radeon HD 6000系列的來歷可以說是相當曲折。按照AMD最早的計畫,Radeon HD 5000系列之後要轉向新的核心架構,代號“南方群島”(Southern Islands),製造工藝也會更新,但是無奈負責代工的台積電40nm工藝花了很長時間才成熟起來,又突然決定取消32nm工藝而直奔28nm,AMD隨之被迫更改了產品研發和發布計畫,於是就有了新的“北方群島”(Northern Islands),也就是Radeon HD 6000系列。

簡單來說, Radeon HD 6000系列是一次妥協的產物,仍舊使用R600以來的核心架構體系,製造工藝也還是40nm,不過在諸多內部細節和技術特性方面進行了廣泛的增強,無論性能還是功能都大大優於Radeon HD 5000系列,而且產品良率也完全不再是問題。

但是在產品編號上,AMD耍了一個小小的花招。儘管還是一目了然的四位數字,但並不只是簡單地把首位從5換成6。上代首發的Radeon HD 5800系列面向的是高端市場,而現在所謂的Radeon HD 6800系列並不完全與之對應,從市場區間劃分上來說其實是Radeon HD 5700系列的後輩。等到下個月,AMD還會推出更高端型號 Radeon HD 6970、Radeon HD 6950,開發代號“Cayman”,繼續穩固高端市場地位;年底的時候,我們就將看到新的旗艦型單卡雙芯產品 Radeon HD 6990,開發代號“Antilles”。這一次,AMD同樣打算速戰速決,不給對手任何喘息之機。

這種新的命名方式一方面源於AMD在顯示卡市場上掌握著絕對的主動權,有充足的空間按照自己的意願調整產品線,另一方面也是因為新系列產品的性能表現有了長足的進步,有足夠的資本將自己提升一個檔次。

HD6800 Barts

定位解析:直擊GTX460

定位解析 定位解析

Radeon HD 5000/6000系列高端產品的性能順序可以排列為: 6990>5970>6970>6950>5870>6870>5850>6850>5770>5750。它也直接證明新的編號體系並非只是個數字遊戲而已。

Radeon HD 6870的性能其實稍弱於Radeon HD 5870,但是價格上也要便宜很大一個檔次,因此性價比同樣再次有了明顯的提高,延續了AMD高端顯示卡近年來的一貫趨勢。

Barts: Radeon HD 6800系列、Cayman: Radeon HD 6900系列將會共同取代Cypress:Radeon HD 5800系列,以更豐富的產品型號對市場進行細化,滿足不同價位消費則會的需要; Radeon HD 5700系列則並不會立即消失,而是將伴隨新系列繼續銷售,有訊息稱可能會改名為Radeon HD 6700系列,但是AMD還沒有做出最終決定。

架構與規格:延續傳統、全面增強

HD6800架構解析 HD6800架構解析

架構方面之前曾有各種各樣的傳聞,但是受到各方面限制,特別是台積電代工工藝的落後,Radeon HD 6800系列所屬的“北方群島”家族並沒有在核心架構方面進行大規模的重新設計,而是基本沿用了R600以來的4D+1D式SIMD流處理器結構,並在諸多細節上做了最佳化和增強,AMD稱之為“第二代DX11設計”。總的來說,北方群島更像是一次承前啟後的過渡,再往後的下一代我們才會看到基於28nm新工藝的新架構,不出意外就是同樣風傳了很久的“南方群島”。

按照AMD的說法,Radeon HD 6000系列架構重點有五大方面的進步:

1、更強的單位面積性能,比上代提升最多35%;

2、第二代DX11設計,更快的曲面細分和幾何吞吐;

3、新的和改進的畫質功能,包括抗鋸齒和各向異性過濾;

4、增強的多媒體加速,包括UVD3硬體解碼引擎、AMD APP並行異構計算技術、藍光3D立體技術;

5、下一代顯示技術,包括Eyefinity+多屏輸出、HDMI 1.4a規範、DisplayPort 1.2規範。

Radeon HD 6800系列對核心設計做了重新配置,單精度浮點性能最高能夠突破2TFlops(每秒2萬億次計算)大關,每秒鐘能夠處理的像素也能超過240億,同時曲面細分單元進行了特別增強(第七代),光柵器(Rasterizer)也配備了兩個,Hub部分有PCI-E 2.1匯流排控制器、UVD3硬體解碼引擎、CrossFireX管理引擎、Eyefinity顯示控制器等,顯存控制器則依然是四個64-bit,總位寬256-bit,繼續搭配高速GDDR5顯存顆粒。

新核心集成了17億個電晶體,核心面積為255平方毫米。Radeon HD 6870/6850分別有14個、12個SIMD引擎,每個引擎還是80個流處理器,總共1140個、960個,紋理單元56個、48個,ROP光柵單元都是32個。

Radeon HD 6870被AMD稱為“市場甜點的輕鬆贏家”,核心頻率900MHz,單精度浮點性能2.0TFlops,搭載1GB GDDR5顯存,等效頻率4200MHz,整卡空閒功耗19W、滿載功耗151W,使用雙插槽散熱器和雙六針輔助供電接口,輸出接口兩個DVI、兩個mini DisplayPort、一個HDMI。

Radeon HD 6870國內官方建議零售價1899-1999元人民幣,直接競爭對手最初被定為GeForce GTX 460 1GB,官方測試數據顯示平均超出25-30%,最多可超過50%,不過在最後關頭,AMD將對手提高到了GeForce GTX 470,顯示了充足的自信心。

Radeon HD 6850則號稱是“DX11性能、功耗和價格的新典範”,核心頻率775MHz,單精度浮點性能1.5TFlops,同樣搭載1GB GDDR5顯存,但是等效頻率降至4000MHz,整卡空閒功耗仍是19W,但是滿載功耗降低到127W,只需單六針輔助供電,不過公版散熱器也是雙插槽設計,另外輸出接口同為兩個DVI、兩個mini DP、一個HDMI。

Radeon HD 6850國內官方建議零售價1299-1399元人民幣,直接競爭對手最初定為GeForce GTX 460 768MB,官方測試數據顯示平均超出也有30%左右,最多可超過60%,最後時刻又改成了GeForce GTX 460 1GB。

現在我們就對比一下Radeon HD 6870、Radeon HD 5850。後者核心面積和電晶體規模要大不少(334平方毫米和21.5億個),流處理器、紋理單元分別多出120個、16個,顯存頻寬甚至也稍高一些(153.6GB/s和134.4GB/s),但是根據AMD提供的數據,二者3DMark Vantage得分分別為X7730、X7403,也就是說Radeon HD 6870以更小的核心規模實現了更高的性能,單位面積的性能自然更是高出一大截,而且更喜人的是滿載功耗保持在同樣的水平(151W),空閒功耗更是降低了8W,按幅度計算就是30%,顯然新卡的性能功耗比也要好得多。

另外值得一提的是,重新設計的新核心在幾何吞吐能力方面也有顯著進步,Radeon HD 6870達到了每秒鐘9億個三角形,Radeon HD 5850則是7.25億個。這可以看作是對NVIDIA宣傳幾何性能的一個回應。

新特性:強化畫質

畫質增強 畫質增強

消費級顯示卡最主要的使命自然是提供更好的3D遊戲性能和畫面,而提升畫質最傳統、最廣泛的方法當屬抗鋸齒(AA)和各向異性過濾(AF)。Radeon HD 6800在這兩方面都有所革新,還特別簡化了相關用戶界面,方便使用。

Radeon HD 6800支持新的形態抗鋸齒(Morphological Anti-Aliasing),簡稱MLAA。該技術由Intel提出,不過此前是基於CPU運算的,AMD則將其移植到了GPU上,使用後期處理過濾技術結合DirectCompute進行加速,全面支持DX9/10/11應用程式。AMD宣稱,MLAA可提供全場景抗鋸齒,而不限於多邊形邊緣、Alpha測試表面,速度也要比超級採樣,性能上接近於可程式過濾抗鋸齒(CFAA)。

MLAA抗鋸齒屬於一種後期處理效果,換言之就是首先正常渲染每一幀,然後再進行一次著色器處理來執行過濾,這不同於傳統的多重採樣抗鋸齒(MSAA)和超級採樣抗鋸齒(SSAA),後者都是在幀渲染的同時執行過濾。事實上,MLAA也能用來消除靜態圖像的鋸齒,只不過用在動態畫面上效果更好。

MLAA中,過濾器會首先按照不同的像素尺寸樣式檢測高對比度邊緣(鋸齒產生的主要原因),假設它們應該是與像素邊緣不切合的直線,然後消除每個邊緣理想線的長度和角度,根據邊緣旁邊每個像素的較深和較淺顏色確定符合比例的覆蓋範圍,最終實現抗鋸齒。

由於邊緣檢測步驟需要頻繁的對相鄰像素顏色進行採樣和重採樣,數據重新使用的幾率很高。AMD使用LDS(本地數據共享)硬體避免冗餘數據預取、顯著提升性能。

各向異性過濾也有所改進,尤其是算法方面,還保持了全面的性能和角度獨立性。

配合新技術,催化劑控制中心的3D部分同樣有了變化,可在此開啟MLAA抗鋸齒,還有全新的Catalyst A.I.滑塊,能夠直接控制紋理過濾和最佳化。

新特性:高效曲面細分

增強曲面細分 增強曲面細分

DX11帶來了諸多新特性、新技術,曲面細分(Tessellation)按說只是其中的一種,但因為顯示卡廠商的種種不同宣傳而備受關注,也引發了不少爭議,比如按照NVIDIA的說法,他們的Fermi架構才是真正的DX11架構,因為設計了專門的曲面細分單元,高負載下性能更好。

事實上,當年ATI在Radeon 8500上就首次試驗了這種技術的雛形,使用了固頂功能的PN三角形。雖然當時的技術還極不成熟,遊戲套用也未普及,但ATI並未放棄,此後每一代產品都在進行更新和完善,比如Xbox 360 GPU上加入了位移映射和自適應曲面細分,Radeon HD 2000、3000兩代產品分別支持DX10、DX10.1,Radeon HD 4000系列又增強了性能,但直到Radeon HD 5000系列上才借著DX11的東風修成正果,成為業界標準規範的一部分。Radeon HD 6000系列針對曲面細分又做了深入最佳化,重點改進了執行緒管理和緩衝。

AMD提供的數據顯示, Radeon HD 6870相比於Radeon HD 5870在曲面細分性能上有了最多一倍的增加,不過具體取決於曲面細分因子,1-13的時候普遍都能超過50%,其中5-10的時候效果是最好的。

AMD還特意講解了部署曲面細分的正確方法,包括將最重要的細節添加到場景中,同時有效壓縮幾何;專注於最有效的使用模式,理想情況下每個多邊形16個像素,取得畫質和性能的最佳平衡;自適應曲面細分非常有效,只有在接近觀眾的物體、邊緣輪廓、高細節區域才使用高級別的曲面細分,反之則使用低級別。

AMD聲稱,過量使用曲面細分並不會有太好的畫質效果,反而會讓顯示卡失去效率,比如陰影過多、抗鋸齒處理多邊形邊緣過多等等,暴力使用只是一種無謂的浪費。

新特性:改進影音多媒體

影音播放一貫是A卡的優勢,近年來在這方面的投入力度也是越來越強,對HTPC玩家的吸引力也越來越強,源碼輸出、催化劑畫質增強都廣為津津樂道。

UVD3.0 UVD3.0

Radeon HD 6800上又提出了 “EyeSpeed”視覺加速技術,包括兩大方面:一是GPU並行計算,基於開放的OpenCL、DirectCompute 11標準規範;二是高清視頻的解碼、輸出與播放,支持藍光3D立體技術,並整合了第三代UVD 3.0視頻解碼硬體引擎。

UVD 3.0對高清玩家來說尤其誘人。相比前兩代,它增 加了MPEG-2、MPEG-4 Part 2 (DivX/XviD)、Blu-Ray 3D (MVC)等編碼格式的全程硬體解碼,用戶可以將更多視頻解碼工作交給GPU處理,進一步減輕CPU負擔。篇幅所限,有關UVD3等視頻播放新特性日後會專文深入介紹。

AMD還提到了Radeon HD 6800系列精確的色彩校正技術。藉助色域映射引擎,AMD可以在廣色域液晶面板上精確地再現原始色彩,並在整個管線內保存色彩細節。

先進的硬體技術自然需要廣泛的套用軟體支持。經過廣泛深入的合作,AMD已經拉上了多家知名的多媒體播放與編輯廠商,Radeon HD 6800尚未發布就獲得了大量播放器、編輯器的輔佐,包括ArcSoftTotalMedia Theatre、TotalMediaShowBiz,Corel WinDVD Pro 2010、DigitalStudio 2010,CyberLinkPowerDVD 10 Mark II,DDD TriDef (3D),DivX Plus等等。

新特性:靈活多屏輸出Eyefinity+

Eyefinity Eyefinity+

Eyefinity(寬域)多顯輸出技術是Radeo n HD 5000系列最閃亮的地方之一,只要一塊顯示卡就可以組建最多六屏系統,大大降低了多屏架設的成本,既極大地拓寬了遊戲玩家的視野,也非常適合辦公、渲染、展示等專業場合。現在,Radeon HD 6000系列又進一步提升,帶來了增強版的“Eyefinity+”。

Eyefinity+技術的精髓是DisplayPort 1.2標準規範。相比於此前的1.1a版本,最新的 1.2版本將數據頻寬從10.8Gbps翻番到21.6Gbps,視頻輸出率也從8.64Gbps翻番到17.28Gbps,60Hz 24bpp下的最大解析度支持提升到2560×2048之上,而且特別支持多流輸出(MTS)。

得益於此,Eyefinity+獲得了更高的傳輸頻寬,再加上帶內立體3D信號,就為支持3D立體技術打開了方便之門,而且尤其是支持單接口多數據流、多顯示輸出,通俗地說就是一個接口可以連線多台顯示器,因而只需要兩個DisplayPort接口就能連線六台顯示器。

而此前的Eyefinity只能一個接口對應一台顯示器,想組建六屏系統就得同時使用六個接口,所以才有了Radeon HD 5870 Eyefinity 6特別版。

Radeon HD 6800系列公版都配備了多大五個輸出接口,包括兩個mini DisplayPort、兩個DVI、一個HDMI,組建多屏系統的方式也非常靈活。

第一種方法: 只使用兩個mini DisplayPort接口,其一通過MTS Hub轉接來連線三台顯示器,其二通過菊花鏈方式依次連線三台顯示器,這就完成了六屏系統。

第二種方法: 同樣只使用兩個mini DisplayPort接口,分別連線一台MTS Hub,再分別接上三台顯示器,六屏搞定。

第三種方法: 其中一個mini DisplayPort接口連線MST Hub之後擴展四台顯示器,另外兩個DVI接口分別連線一台,同樣是六屏。

MTS Hub還可以連線多種不同解析度的顯示器,全高清、高清、高清+可以並存。

努力拓展產業生態系統支持也是Eyefinity技術的重中之重。迄今為止,DisplayPort接口顯示產品在市面上已經超過35款,Eyefinity認證遊戲超過45款、兼容遊戲數百款,不久前AMD還與顯示卡廠商合作推出了相對廉價的DisplayPort轉單連結DVI適配器。

性能方面,AMD給出的數據是3×1920×1080水平模式下,Radeon HD 6850/6850單卡在所有主流遊戲中都能獲得30FPS以上的穩定幀率,部分還可達到甚至超過60FPS。

配合Eyefinity、CrossFireX技術,AMD雙卡互連的執行效率也是越來越搞,號稱兩塊Radeon HD 6850相比單卡的性能提升幅度最高可達驚人的99%(《Far Cry 2》),少的也能超過80%。

3×1920×1080三屏模式下,同為雙卡的Radeon HD 6870 CrossFireX相比於GeForce GTX 460 1GB SLI的優勢也是非常明顯,領先幅度少則接近20%,多則達到80%。當然了,這些都是官方宣傳數據,僅供參考。

新特性:3D立體

HD3D HD3D

現如今,3D立體已經成為不可阻擋的大勢所趨,NVIDIA 3D Vision技術都已經獲得了上千件產品的支持,AMD自然也不能落後,此番推出了“HD3D”(高清立體)技術。

不過不同於對手的捆綁式方案,AMD選擇了與業界合作的開放態度,靈活提供多種解決方案,給用戶自主選擇的機會,成本也更低。

AMD的3D立體方案中,自己只提供Radeon HD 6000系列顯示卡硬體,中間件可選Dynamic Digital Depth(DDD)、iZ3D等供應商合作夥伴的方案(前者的就是TriDef),視頻和藍光3D播放軟體來自ArcSoft、Corel、CyberLink、Roxio,眼鏡及發射器來自Bit Cauldron、XpanD、RealD,至於3D電視、投影儀、顯示器等顯示設備就廣泛多了,某些廠商也正在專門針對AMD方案開發和發布相關顯示設備。

為了支持3D立體,Radeon HD 6800系列配備的HDMI接口都已經升級支持HDMI 1.4a規範,支持新款3D立體電視和HDMI幀包裝格式。

3D遊戲方面,AMD Radeon HD 6000支持DX9/10/11四緩衝,配合DDD、iZ3D的轉換軟體可為400多款遊戲帶來立體效果,2011年還會有原生的3D立體遊戲。

性能上AMD也給出了一些數據。Radeon HD 6870配合iZ3D中間件在優派的120Hz 3D顯示器上以1080p全高清解析度運行3D立體遊戲,平均幀率不低於35FPS,高可接近70FPS。

HD6900 Cayman

定位解析:避開GTX580

北方群島 北方群島

Radeon HD 6900系列當然是面向高端遊戲市場的,將會取代現在的Radeon HD 5800系列,而與Radeon HD 6800/5700系列並肩打江山。當然了,這裡不可避免地得重新解釋一下AMD的產品型號命名策略。根據最初的計畫,Barts、Cayman核心應該分別叫作Radeon HD 6700/6800系列而替代Radeon HD 5700/5800系列,但是首先AMD自然為Barts核心非常優秀,配得上更高的地位,其次Radeon HD 5700系列在主流市場上非常熱門、廣為追捧,直接就這么拿下實在可惜,於是AMD就玩兒了一個從市場策略上看很聰明、從消費角度看很混亂的做法:Barts、Cayman核心分別提升一個檔次,命名為Radeon HD 6800/6900系列,Radeon HD 5700系列則繼續留在市場上籠絡中端用戶,而新的單卡雙芯型號則被擠到了頂,只能叫Radeon HD 6990。AMD這么做自然有其充分的理由,畢竟廠商的目標是利用各種可能的手段賺儘可能多的錢,也就是追求利潤最大化。AMD在DX11市場上居於領先地位,也有一定的空間和餘地按照自己的意願去部署產品線,作為消費者就只能被動接受了。不管怎么說,Radeon HD 6000系列畢竟是新核心新產品,總比直接改名的馬甲好得多。

按照AMD最後時刻敲定的策略, Radeon HD 6970在國內的官方建議零售價為2999-3099元人民幣,Radeon HD 6950則是2299-2399元人民幣,遠遠低於此前預計的3999元、2999元。至於競爭對手,AMD延續了田忌賽馬的策略, Radeon HD 6900系列避開鋒芒畢露的GeForce GTX 580(3999元)而攜手殺向剛剛誕生的GeForce GTX 570(2999元)或者更確切地說主要由Radeon HD 6970去對付GeForce GTX 570,Radeon HD 6950則暫時沒有很直接的對手,因為往下的GeForce GTX 460、GeForce GTS 450分別交給了Radeon HD 6800系列、5700系列。

當然了,GeForce GTX 580也不會被放任自流,因為AMD仍有迄今為止地球上最快的顯示卡Radeon HD 5970,明年初還會更新為Radeon HD 6990,繼續二打一的策略。

全新核心架構:4D圖形與計算

無論開發什麼新產品,設計人員總要首先設定一些預期目標,然後通過技術上的努力去實現,從而滿足市場和用戶的需要。可以說,只有合理的目標與順利的執行有機結合才能誕生一款優秀的產品。

4D圖形與計算 4D圖形與計算

在Cayman Radeon HD 6900系列身上,AMD就提出了 四大目標:高效的圖形與計算架構、強大的幾何性能、新的畫質技術、新的能效與功耗管理。下邊我們就從這四個方面著手,細細品位Radeon HD 6900的核心架構與技術精髓。

為了實現高效的圖形與計算架構,AMD該用了 重新定義的VLIW4架構,同時還引入了雙圖形引擎、更多SIMD引擎與紋理單元、升級的渲染後端、更高的顯存頻寬、新的GPU計算技術。

VLIW全稱為Very Long Instruction Word,意思是超常指令字架構,是一種非常長的指令組合,通過把許多條指令連在一起來增加運算的速度。從第一代DX10 R600核心開始,AMD就一直使用VLIW5方式,又稱5D式,也就是五個流處理器編為一組,但並非所有流處理器都是相同的,其中四個較小、較簡單,另一個較大、較複雜做為特殊單元。這種架構設計在硬體方面看有著很高的效率和很深的潛力,但是結構比較複雜,對應的軟體編程就很困難,始終難以真正發揮全部實力。

如今AMD終於在核心層面翻新為VLIW4方式(4D式),每個編組由四個流處理器、一個分支單元、一個通用目的暫存器組成,其中四個流處理器的整數、浮點執行功能完全相同(不再有T-Unit),可以執行四路並行發射,但是特殊功能占據四個發射位中的三個。

AMD宣稱,VLIW4架構有著更好的利用率,能將性能與核心面積比提高10%,簡化調度與暫存器管理,邏輯核心也可以很好地重複使用。

除了前端,渲染器後端也進行了升級,支持寫入操作合併,16位整數操作提速兩倍,32位浮點操作也快了兩到四倍。

GPU並行計算方面,新核心最大的亮點就是增加了一個全局異步暫存器,從而支持異步分配,可以同時執行多個計算核心,每個核心都有自己的命令佇列與受保護虛擬定址域。此外還有兩個雙向DMA引擎(更快的系統記憶體讀寫速度)、著色器讀取操作合併、LDS(本地數據存儲)直接預取、流控制改進、更快雙精度操作(單精度的1/5提高到1/4)。

全新核心架構:曲面細分性能

曲面細分性能 曲面細分性能

在NVIDIA所謂真DX11的大肆宣傳下,幾 何性能特別是曲面細分性能的地位被提高到了一個誇張的地步,但事實上AMD在這方面早已經歷了多個時代的進化,現在更是發展到了第八代曲面細分單元——Radeon HD 6800、5000系列分別是第七代和第六代。

Radeon HD 6900配備了 兩個獨立又合作的圖形引擎,每時鐘周期內都能處理兩個原語(Primitive),具備基於區塊的負載均衡,轉換和隱面消除率翻番。 每個圖形引擎內都有一個光柵器與一個第八代曲面細分單元,前者每時鐘周期內可處理最多32個像素,後者 結合用於更高曲面細分等級的片外緩衝,可實現最多三倍於Radeon HD 5870的曲面細分性能,至少也會有1.5倍。《異形大戰鐵血戰士》、《捷運2033》、《失落的星球2》、《潛行者:普里皮亞季的呼喚》、Unigine Heaven等一系列NVIDIA宣傳自己曲面細分性能強勁的遊戲和測試程式中,Radeon HD 6970相比於Radeon HD 5870能帶來30-69%的大幅性能提升。

不過我們還是想嘮叨一句: 曲面細分是個好技術,但終究只是DX11技術群中的一份子而已,並不是唯一,多執行緒、計算著色器、紋理壓縮等技術的重要性絲毫不比它弱。AMD、NVIDIA都完全實現了對DX11技術的支持,只不過因為發展思路和策略不同,具體方式和執行效率有所差異,不存在什麼真假之說

全新核心架構:AA/AF增強畫質

抗鋸齒 抗鋸齒

畫質增強技術方面,AMD每一代新產品都會加入新功能,此番除了形態抗鋸齒(MLAA)之外還有 增強畫質抗鋸齒(EQAA)、增強各向異性過濾與紋理過濾

EQAA其實並不是全新的抗鋸齒技術,而是 屬於多重採樣抗鋸齒(MSAA)的一種新模式,每像素最多16個覆蓋採樣點,雙倍於標準的MSAA,而且色彩與覆蓋採樣點的數量可以獨立控制,並能夠自定義採樣模式與過濾器。有趣的是, EQAA兼容自適應抗鋸齒(AAA)、超級採樣抗鋸齒(SSAA)、MLAA,換言之就是能夠同時使用,共同改善畫質。

AMD宣稱, EQAA可以在同等量的顯存消耗下帶來更好的畫質,對性能的影響也最多不過5%左右

MLAA就不再重複介紹了,只看看AMD舉的一個例子,照此說來MLAA、MSAA搭檔合作效果最佳。

全新核心架構:全新功耗管理

功耗管理 功耗管理

說起高端顯 卡,除了強大的性能之外往往還伴隨著恐怖的高功耗,以及隨之而來的複雜散熱器、煩人噪音、巨額電費。GeForce GTX 580引入了硬體電源監控電路,Radeon HD 6900則在Radeon HD 5000/6800系列的基礎上又祭出了全新技術“PowerTune”(電源調節),靈活性上遠勝歷史悠久的ATI PowePlay。

首先必須解釋一個很常見的名字:TDP(熱設計功耗)。和微處理器(CPU)一樣,GPU圖形核心也會在運行中消耗能量,並將其轉換成熱量,再散發出去,能量消耗的速度受限於系統提供能量、揮發熱量的雙重能力。為此GPU廠商就向系統製造商提供了熱設計功耗這么一個參數,代表穩定運行所需要的最大能量消耗值,方便他們合理地設計系統,而且該參數受電壓、核心頻率、工作負載、漏電率、環境溫度等多種因素的影響。

ATI PowerPlay只是簡單地指定了顯示卡核心與顯存頻率的兩三個等級,分別對應待機、日常負載、遊戲和拷機負載等套用,一旦確定就不可再更改。 AMD PowerTune則利用顯示卡上集成的控制處理器來實時監視GPU負載、內部計算GPU功耗,藉此實時動態調整運行頻率,從而在滿足熱設計功耗限制的前提下帶來更高的性能,特別是允許GPU在高負載狀態下運行於更高的頻率

換句話說,GPU以往只有中間狀態、最高狀態等幾種僵死的P-State性能等級,現在 加入AMD PowerTune技術後就有了幾乎無數種狀態並能實時調節轉換,允許最高狀態下的核心頻率更高,同時仍然滿足熱設計功耗要求,而那些受熱設計功耗限制的應用程式也可以從這種更高頻率中獲益。

除此之外,Radeon HD 6900系列還支持 直接控制GPU功耗,不需要再繞過頻率和電壓調節,並支持AMD OverDrive工具。

技術上講解和理解起來都很晦澀,但看看下邊的典型套用實例你就會明白了。首先大家需要知道的是,顯示卡實際功耗在不同環境下是相差很大的,FurMark、3DMark、OCCT等測試和拷機軟體往往能將顯示卡功耗發揮到很高水平甚至達到極致,但主流3D遊戲中其實都是比較低的。這就是AMD PowerTune技術進一步發威的前提。

Radeon HD 6950在默認功耗設定下運行3DMark Vantage柏林噪音測試,GPU核心頻率在700MHz上下的較大範圍內實時動態調整,程式運行幀率則穩定保持在接近150FPS。

然後 在催化劑控制中心的OverDrive頁面內,拖動功耗控制(Power Control)的滑桿,範圍從-20%到+20%,代表顯示卡功耗的降低和增加範圍

同樣的測試中,默認功耗下GPU核心頻率在很大範圍內調節,但極少超過750MHz,此時平均幀率140FPS;增加5%的功耗空間後,核心頻率大部分時間都在750MHz之上,而且是不是達到800MHz,此時幀率升至155FPS; 增加10%的功耗空間時核心頻率就一直運行在額定的800MHz,幀率繼續升至162FPS

轉到《異形大戰鐵血戰士》這樣的普通遊戲,默認設定下幀率超過55FPS,很流暢,都功耗也超過了250W,相當費電;於是將功耗空間降低10%,幀率仍有55FPS左右,實際功耗降至250W之下; 再降低20%呢,幀率跌至50FPS,依然足夠流暢,功耗卻大幅降低至220W多一點,從而在保證遊戲體驗的前提下節省耗電量

另外除了功耗控制技術的改進,Radeon HD 6900系列的散熱設計同樣毫不含糊,和Radeon HD 6800系列一樣使用了第五代真空腔均熱板(Vapor Chamber)技術,由渦輪風扇、大面積純銅底座、純銅熱管、密集散熱鰭片等部分組成。

HD6990 Antilles

定位解析:完美接任HD5970

雖然台積電28nm工藝非常不給力,致使AMD野心勃勃的南方群島計畫流產,但是AMD依舊迅速變招拿出了B計畫,開始推出第二代DX11 Radeon HD 6000系列家族,而且在市場策略、核心架構方面都有了相當大的變化,比如Radeon HD 6800系列地位提升、Radeon HD 6900系列改用VLIW4 4D式流處理器單元。雖然所謂全新架構的處子秀不算很驚艷,沒有撼動GeForce GTX 580的市場地位,但這也正好符合AMD的一貫策略,即以小核心占領性能級市場,然後再雙芯並聯去爭奪發燒級市場。後邊這一步,正是要靠Radeon HD 6990去努力。

Radeon HD 6990開發代號Antilles,原計畫在2010年底發布,但因為種種原因拖延至今。GeForce GTX 590至今神龍見首不見尾,雖說按道理性能應該更恐怖,但是看樣子還得登上一段時間(NVIDIA的下一步是本月中旬的GeForce GTX 550 Ti)。就這樣,Radeon HD 6990在並無多大壓力的情況下得以順利接過前輩的槍、榮登卡皇寶座,再次成為地球上最快的顯示卡。 不管你是否認同這種單卡雙芯的形式,它都是無可爭議的性能王者。當然了,這也標誌著Radeon HD 5970完美的一生開始結束,老卡皇可以笑著退休了。

規格解析:雙芯並聯+超頻

Radeon HD 6990使用了兩顆Cayman Radeon HD 6900圖形核心並使用PLX橋接晶片內部連,因此在架構上就沒什麼好說的了,完全繼承了Radeon HD 6970/6950的諸多新特性,包括VLIW 4D流處理器單元、升級的渲染器後端、增強的GPU計算、雙圖形引擎與兩個第八代曲面細分單元、EQAA增強畫質抗鋸齒、PowerTune功耗管理技術等等。當然了,Radeon HD 6870/6850以來引入的大量功能特性也都延續了下來,包括MLAA形態抗鋸齒、改進的各向異性過濾、UVD3視頻解碼引擎、增強的多屏輸出Eyefinity等等。無論從哪方面看,Radeon HD 6990都完全稱得上是集大成者,綜合了AMD迄今為止最優秀的圖形和視頻技術。

規格解析 規格解析

Radeon HD 6990擁有 多達52.8億個電晶體,3072個流處理器、192個紋理單元、64個ROP單元,顯存位寬2×256-bit,顯存容量多達4GB,都是Radeon HD 6970/6950的兩倍,不過受散熱、功耗的限制,預設頻率並沒有達到Radeon HD 6970的級別,但也高於Radeon HD 6950,其中 核心為830MHz,顯存等效為5GHz

Radeon HD 6990的 浮點計算能力因此高達驚人的單精度5.1TFlops、雙精度1.27TFlops,分別符合IEEE754-SP、IEEE754-DP標準,另外紋理填充率159.4GT/s、像素填充率53.1GP/s、顯存頻寬320GB/s。

更恐怖的是,Radeon HD 6990還有相當大的超頻空間。首先,它和Radeon HD 6970/6950一樣 配備了雙BIOS和切換開關,因此提供兩種模式:默認模式下核心電壓1.12V,頻率如上;超頻模式下核心電壓加至1.175V,頻率直接也拉升到880MHz,顯存頻率不變,基本相當於兩塊Radeon HD 5970。這時候的Radeon HD 6990將擁有 5.4TFlops單精度浮點運算能力,紋理、像素填充率也都有進一步增加。

如果遊戲玩家和發燒友們還不滿足,可以再藉助催化劑控制中心、AMD OverDrive或者第三方軟體進一步超頻。核心頻率可以輕鬆超過900MHz,藉助更強的散熱器乃至液氮等等超過1GHz也是小菜一碟,甚至催化劑控制中心預設的最高值就達到了史無前例的1200MHz。顯存頻率也能很輕易地提升到5.5GHz乃至6GHz,基本上已經是GDDR5顯存顆粒的極限了。

如此彪悍的規格自然會帶來不可小覷的發熱量和功耗。Radeon HD 6990在空閒情況下的功耗為37W,秉承了近兩代優秀的待機功耗控制能力,不過在典型遊戲狀態下整卡功耗會飆升至350W,拷機時候的峰值功耗更實惠接近375W,不得不使用了兩個八針輔助供電接口,每一個都可以供電150W。

軟硬兼施: 6990雙重手段控制功耗

在硬體設計上,AMD工程師的目標是做一塊即使功耗達到450W也依然能夠應付的超級顯示卡,對付Radeon HD 6990的350W左右自然就沒什麼問題了。為此,AMD在這塊卡上使用了極其奢華的電路設計,完全不計成本。供電方面是 第二代數字可程式Volterra供電控制器,專為VDDC電壓控制器開發的大型附屬設備,相比之前使用的效率明顯提升,可增大電流、降低溫度和功耗。

PCB布局方面也發生了很大的變化,拋棄了以往GPU核心在左、供電電路在右的傳統,改而將 供電部分設計在PCB中央,位於兩顆GPU核心之間,緊挨著PLX橋接晶片。AMD宣稱這種設計能夠為每顆GPU核心與相關的顯存晶片提供更高效率的供電。

電路板本身也是精挑細選的,只為保證更高的速度、更低的漏電率。

功耗控制 功耗控制

散熱器外部看上去和Radeon HD 6800/6900系列非常相似,但是內部已經根據PCB的變化做了相應調整。 全封閉的外殼中,每顆GPU核心對應一個真空均熱板散熱模組,中間供電電路對應渦輪風扇,還特別加入了相變導熱材料(TIM),聲稱可將散熱性能提升8%,綜合起來散熱能力比Radeon HD 5970增加了20%之多,足以對付450W的功耗和發熱

最為難得的是,相比於前輩Radeon HD 5970,Radeon HD 6990的PCB長度、散熱器體積都沒有增大,其中 PCB還是11.5英寸(292毫米)。雖然握在手裡依然形如超大型板磚,但至少沒有更加變態。

Radeon HD 6970/6950身上開始實踐的PowerTune技術這次終於到了真正發揮作用的時刻。

PowerTune是此前PowerPlay技術的進化版本,而且不僅僅是用於節能,更用於加速。它利用顯示卡上集成的控制處理器來實時監視GPU負載、內部計算GPU功耗,藉此實時、動態地調整運行頻率。

一方面,PowerTune技術下顯示卡的核心、顯存頻率都不再局限於寥寥幾種狀態,而是能夠根據實際負載無縫地調節與切換,儘可能地不造成任何能耗上的浪費。另一方面, PowerTune技術能夠讓顯示卡在高負載套用種自動加速,從而獲得更高的運行頻率和更好的遊戲性能,但又不會超過熱設計功耗的限制範圍,以避免在極限測試和拷機測試中造成硬體損壞。從一定程度上講,這有些類似AMD、Intel處理器上使用的動態加速技術Turbo Core、Turbo Boost(睿頻)。

可以說,有了PowerTune技術之後顯示卡就變得非常智慧型了,會隨時根據實際負載來調節自己的運行狀態。負載要求低的時候就逐漸降下來,省電節能降噪;負載要求高的時候就看情況加速上去,根據不同的要求自動超頻,帶來更好的性能。

按照AMD給出的測試數據,Radeon HD 6990結合PowerTune技術能將最大功耗控制在375W,遊戲速度普遍有20-30FPS的提升,FurMark、OCCT等非遊戲類的拷機測試中也能適當地小幅加速,達到性能與功耗的兼顧與平衡,而不像NVIDIA GeForce GTX 500系列那樣碰到拷機測試就自動降頻,看起來功耗低了,但只是一種被動的保護措施而已。

Eyefinity再升級:支持單卡垂直五屏

eyefinty eyefinty

Radeon HD 6990的輸出接口配置也很特別, 一個雙連結DVI,四個mini DisplayPort 1.2,搭配MTS Hub轉接器或者採用菊花鏈串聯形式同樣可以支持最多六屏輸出。至於為什麼這么安排,自然有其特殊理由,馬上你就可以看到了。

為了方便玩家組建多屏系統並降低成本, AMD將隨卡附送三個轉接頭,分別可以將mini DP轉接為被動式單連結DVI、主動式單連結DVI、被動式HDMI。

迄今為止,AMD已經發布了21款DX11顯示卡,全部支持Eyefinity多屏輸出技術,而且有數十種不同的多屏配置方式,單卡最多可連線六台顯示器。與此同時,通過認證或者準備就緒的Eyefinity兼容遊戲、套用軟體也達到了69款。

而除了傳統的各種多屏模式,Radeon HD 6990又帶來一種視野廣闊、環繞效果更為震撼的新模式: 五台顯示器垂直並列,解析度支持5×900×1600、5×1080×1920、5×1200×1920等等。

相關詞條

熱門詞條

聯絡我們