南方群島[AMD出產的GPU處理器架構]:南方群島是AMD出產的GPU處 -百科知識中文網

顯示卡命名

AMD的下一代顯示卡“南方群島”(Southern Islands)已經流片成功了，很可能會在 NVIDIA新系列布局完畢之前就搶先登場。

據報導，南方群島(SI)晶片已經在最近流片，並移交代工廠台積電。據AMD聲稱，AMD將在10月12日正式發布“南方群島”，顯示卡商計畫將在11月份開始銷售。

根據此前訊息，南方群島是基於下一代全新架構“北方群島”(Northern Islands)和當前架構Evergreen的混合設計產物，而製造工藝方面因為台積電取消了32nm，更高級的28nm HKMG得等到明年，所以南方群島仍然選擇了已經逐漸成熟起來的40nm，不過按照AMD官方的說法，北方群島就會改用GlobalFoundries 28nm HKMG工藝了。

最新曝料顯示，南方群島使用了北方群島的一些非核心部分，並對Evergreen的流處理器進行了小幅度的升級，顯存方面北方群島計畫使用升級版GDDR5+，但由於顯存廠商還沒有準備好，南方群島仍舊還是GDDR5。

諜報一：HD6750/6770詳細規格透露

在此之前，我們曾多次為大家報導過有關於AMD下一代DX11產品Radeon HD 6000系列顯示卡的相關信息。而近日，我們從chiphell得到了一份PPT頁面，該頁面詳細的介紹了有關於Barts核心產品的詳細規格參數，這份PPT上的信息貌似比之前曝光的訊息更為可信，下面，我們就一起來看看吧。

我們可以看出，上圖中透露出的信息與之前曝光的訊息有不小的出入，之前曾有訊息稱，Barts核心的產品將會被AMD命名為Radeon HD 6800系列，而在上圖中則顯示為HD6770/50。AMD最終到底如何命名我們暫且先不討論，這種事情不到產品最終發布我們都無法確定。先讓我們來看一看兩款Barts核心的規格參數吧。

從上圖中我們可以看出， Barts XT核心的產品最終將會擁有 1280個流處理單元，64個紋理單元以及32個光柵處理器，默認核心頻率高達900MHz。顯存方面不出意外的搭載了GDDR5顯存，默認頻率為4200MHz。滿載功耗在146W左右，而待機功耗則僅有23W左右。

基於 Barts Pro核心的產品將會擁有 1120個流處理單元，56個紋理單元以及32個光柵處理器，默認核心頻率為725MHz，比Barts XT低一些。顯存方面同樣為GDDR5顯存，頻率方面同樣相比Barts XT核心的產品稍低，為4000MHz。滿載功耗在114W左右，待機功耗在20W左右。

從此次透露出的規格信息來看， “Radeon HD 6770”的處理能力已高達2.304 TFlops，比Radeon HD 5850的2.088 TFlops還要高。看來最終“HD 6770”的性能極有可能超越HD 5850，如果真是這樣的話，AMD的這一代產品相當值得期待。

諜報二：傳AMD 5700系列將更名6700

【轉載自PCPOP】

有關AMD即將推出的Radeon HD 6000系列顯示卡，近一段時間可謂是眾說紛紜。甚至連它們的代號究竟是“北方群島”還是“南方群島”都有不少爭議。德國媒體最新傳出的訊息是，Radeon HD 6000系列中的中端性能級產品HD 6700，實際上將是目前HD 5700系列的更名之作。

根據一張泄露出來的內部幻燈片截圖，AMD為HD 6000系列準備了兩套命名方案。其中一套是一一對應的升級，即Caicos對應HD 6400，Turks對應HD 6600/6500，Barts對應HD 6700，Cayman對應HD 6800，Antilles對應HD 6900。

但新的命名計畫則是，最先推出的Barts直接命名為HD 6870/6850。由於Barts實際上是Juniper（桌面HD 5700系列/移動HD 5800）的升級版本，它晉級升入HD 6800系列後，199美元以下的HD 6700系列市場由誰來繼承呢？

答案就是更名，原有的Juniper HD 5770/5750將直接更名為HD 6770/6750。而Barts以上的GPU則會水漲船高各晉一級，Cayman成為HD 6970/6950，雙芯Antilles只有叫做HD 6990了。

據稱AMD已經確認選擇了這種新的命名方式。至於HD 6700究竟會以怎樣的形式出現，是提高頻率、增加功能還是直接更名，恐怕只有等產品發布才會知曉了。

諜報三：6870/50實物照片+測試成績曝光

發布前的最後時刻，圍繞著AMD Radeon HD 6000系列規格特性的疑問卻越來越多。首先是涉及改版更新還是升級換代，北方群島還是南方群島的爭論。再後來又出現了Radeon HD 5700系列直接更名為Radeon HD 6700系列的說法。

目前已經基本確認，之前一直被視為Radeon HD 6700系列的“Barts”最終推出時將以Radeon HD 6800系列示人，即Barts Pro對應HD 6850，Barts XT對應HD 6870。昨天，有台灣網站就曝出了Barts Radeon HD 6800系列的實測成績，其中還包括Barts Pro HD 6850的實物照片。

據稱，Barts XT Radeon HD 6870將提供1120個流處理單元，核心頻率900MHz，256bit 1050MHz GDDR5顯存，3DMark Vantage的得分為P16270和X7538，3DMark06 成績為19480。

Barts Pro Radeon HD 6850則為960個流處理單元，核心頻率775MHz，256bit 1000MHz GDDR5顯存。3DMark Vantage得分P14872、X6549，3DMark 06成績為18750。

同條件下的各款顯示卡性能排位（3DMark Vantage/3DMark 06得分）如下： NVIDIA

GeForce GTX 480: P18376/19671

GeForce GTX 460 (256bit 1GB): P13623/18601

GeForce GTX 460 (192bit 768 MB): P13386/18259

GeForce GTS 450: P9792/15793

AMD

ATI Radeon HD 5870: P17924/19433

AMD Radeon HD 6870: P16270/19480

ATI Radeon HD 5850: P15593/18762

AMD Radeon HD 6850: P14872/18750

ATI Radeon HD 5830: P14014/17298

ATI Radeon HD 5770: P11017/16358

ATI Radeon HD 5750: P9124/14966

看起來HD 6870/6850的性能還不如HD 5870/5850，似乎有些說不過去，但這其中也應該有新卡驅動尚未完善的原因。

HD6800系列產品官方資料及核心圖曝光

Radeon HD 6800系列顯示卡核心代號為Barts，從曝光的核心測量圖顯示，其核心面積為171.09*134.61mm=230.30mm2；而Radeon HD 5800系列的Cypress核心面積為184.18*183.49mm=337.95mm2。由此看來，Barts核心面積僅為Cypress的68.15%左右。

● 下面我們再來仔細看看HD 6800系列產品的官方資料：

首先是產品路線圖，核心代號為Barts XT的HD 6870以及Barts Pro的HD 6 850將會在本月發布；

11月下旬會有Cayman XT/Pro核心的Radeon HD 6970/6950顯示卡出爐；而12月則有Antilles核心的新雙核產品Radeon HD 6990登場。

新產品市場定點陣圖顯示， Barts核心對應的是NVIDIA最熱門的GeForce GTX 460顯示卡；而Juniper則堅守中端市場，打壓GeForce GTS 450；Cayman核心產品以GeForce GTX 480/470為競爭對手；至於最頂級的Antilles雙核心顯示卡則接過Radeon HD 5970的皇冠成為新一代雙核王者。

● Northern Islands新特性：

HD 6800系列顯示卡的DX11性能將會得到提升（AMD稱之為第二代DX11）；

新的顯示輸出標準，支持DP 1.2以及HDMI 1.4規範；

通過HDMI 1.4以及DP 1.2接口，可支持3D立體視頻以及遊戲；

採用UVD 3.0引擎，支持MPEG-2/DivX/BluRay3D MVC硬解。

HD 6000系列產品將配備雙DVI、HDMI以及雙mini DisplayPort共5個輸出接口。mini DP接口為1.2規範，可支持多視頻流，使用兩個接口即可實現6屏輸出。從右表可看出，HD 6870（Barts XT）將搭配雙6pin供電接口，TDP大於150w；而HD 6850（Barts Pro）則僅具備單6pin供電接口即可，TDP在150w以下。

Cayman XT/Pro核心產品將會在11月底發布，前者需要6pin+8pin供電接口，TDP在300w以下；而後者則具備雙6pin供電接口，TDP少於225w。

兩者均搭配1GB GDDR5顯存，其中前者規格更高，速度可達6Gbps，而後者則為5Gbps。

HD6970/6950規格曝光

昨天，國外網站Xtreview曝光了基於Cayman XT/Pro核心的Radeon HD 6970/6950顯示卡部分規格參數。目前，我們可以知道Radeon HD 6970/6950顯示卡的信息包括PCB、散熱系統、功耗、頻率以及顯存容量等。　 Radeon HD 6970/6950都將配備1GB GDDR5顯存，根據兩者的市場定位，HD 6950將擁有5000MHz的頻率，而HD 6970則擁有高達7000MHz的顯存頻率。

HD 6970在散熱方面，只搭配了渦輪風扇，功耗為300W，配備了一個6pin和一個8pin供電接口。HD 6950不僅可以搭配渦輪風扇，也可以選擇其他類型的風扇，功耗則為225W，配備了兩個6pin供電接口。　輸出接口方面，Radeon HD 6970/6950均為2×DVI+HDMI+2×mini-DisplayPort。

Radeon HD 6970/6950預計將於11月底發布，其目標顯然是GeForce GTX 480/470。

公版HD6870 PCB諜照首度曝光

今天，國外媒體曝光了一組Radoen HD 6870公版產品的PCB照片。從圖片上來看，這組圖片應該是來自中國香港。從照片上來看，HD6870公版產品將會配備雙6pin外接供電接口，兩個個DVI接口、一個HDMI接口和兩個mini DisplayPort接口。與之前曝光的訊息保持了一致。從左圖中我們可以了解到，Radeon HD 6870採用了4相供電設計，與以往不同的是，供電部分位於核心的左側。PCB正面搭載了8顆GDDR5顯存顆粒，組成了1GB/256bit的顯存規格。

這張圖片則顯示出了Barts核心仍然採用了小核心設計，核心為長方形，在香港硬幣的旁邊尺寸顯得非常小。另外，據此前訊息稱，Radeon HD 6870將會與下周發布，核心內建960個流處理單元，默認運行頻率為900MHz。擁有1GB容量的GDDR5顯存默認工作在4200MHz。預計售價將會在250美元左右。

HD6800最終規格全曝光

近日，techpowerup曝光了來自chiphell的Radeon HD 6800系列最終版官方PPT，即將發布的兩款新品的最終詳細規格及參數也終於水落石出。下面，趕快讓我們來一睹為快吧。

從第一張曝光的PPT頁面簡單的介紹了一下經過改良後架構的一些基本信息，我們可以看出，首先是在性能方面，這一代新品將會比上代產品在每平方毫米的晶片面積上有35%的性能提升，並且在DirectX 11的關鍵因素tessellation上及幾何吞吐量上做了進一步的改進。此外還加入了全新的改進畫質功能，在反鋸齒及各向異性過濾方面有所提高。最後還加入了UVD3、AMD APP、藍光3D的加速技術以及新一代的AMD Eyefinity、HDMI 1.4a和DisplayPort 1.2等新技術。

而第二張PPT則顯示出了HD6800系列的邏輯架構圖及一些相關信息，我們可以了解到HD 6800系列將會擁有最高2.0 TFLOPs的浮點運算能力。另外在架構上增強了tessellation單元，配備雙光柵引擎以及256bit GDDR5顯存控制器。將能夠在比HD 5850節省25%核心面積的的前提下性能較前者有更佳的表現。

接下來的這兩張曝光的PPT頁面則顯示出了玩家們最為關心的產品規格方面的信息。我們可以看到，HD6870擁有2.0 TFLOPs的浮點運算能力，擁有1120個流處理單元、32個光柵處理器。默認核心頻率為900MHz。搭配了1GB容量的GDDR5顯存，擁有256bit顯存位寬，默認顯存頻率為4200MHz。滿載及待機功耗方面分別為151W和19W。提供了雙6pin外接供電接口。輸出接口方面則提供了2個DVI、2個mini DP及1個HDMI接口。

而HD6850則會擁有1.5 TFLOPs的浮點運算能力，相對HD6870來說有所下降。將會搭載960個流處理單元和32個光柵處理器。默認核心頻率為775MHz。同樣搭配了1GB容量的GDDR5顯存和256bit顯存位寬，默認顯存頻率為4000MHz。滿載及待機功耗方面為127W和19W，僅提供了單6pin外接供電接口。接口方面的配備與HD6870保持了一致。

從最後的這張PPT頁面中我們可以了解到，Radeon HD 6800系列由於支持DisplayPort 1.2技術，可實現多數據流傳輸，單張顯示卡通過兩個mini DisplayPort接口便可實現多達6屏的顯示輸出效果。

最後，筆者要說的是，AMD下一代DX11新品Radeon HD 6800系列將於2010年10月22日正式發布，也就是本周五，屆時我們也將在第一時間推出相關產品的首發評測文章，敬請關注！

顯示卡架構解析

HD6800依然沿用R600架構

下圖為AMD官方公布的Bart（HD6870/6850）核心架構圖，看上去和Cypress（HD5870/5850）並無太大區別，整體依然沿用了自R600（HD2900XT）以來的SIMD（單指令多數據流）架構，流處理器部分沒有太多改進，歷代產品的改進都是集中在周邊控制模組上面。

從Cypress到Barts最明顯的改變就是，SIMD陣列從原來的20組降為14組，這樣流處理器數量就從1600（20x16x5）個減至1120（14x16x5）個，正好與現有HD5830的流處理器數量相等。

也就是說Barts相比Cypress，流處理器數量是70%，電晶體規模是79%，晶片面積是68%。

可以看出，HD6870的理論性能和規格，其實還不如HD5850，而HD6850也不如上代的HD5830，那么其優勢到底在哪呢？

兩個超執行緒分配處理器

我們知道，NVIDIA從GF100到GF104，雖然CUDA核心方面的改進不大，但對SM（流處理器簇）整體架構進行了重新的排列組合，部分指令分配單元和特殊功能單元被增強。

NVIDIA的MIMD（多指令多數據流）架構將並行指令的調度單元、分配單元都和特殊功能模組設計在了GPC（圖形處理器集群）或者SM（流處理器簇）內部。而AMD的SIMD（單指令多數據流）架構則是整顆GPU共享單一的控制單元，自R600以來都是如此。

但隨著電晶體規模和流處理器數量的迅速膨脹，單一的控制單元已經無法滿足大規模並行指令分配的需要，因此從Cypress開始，AMD採用了“雙核心”的設計，將SIMD陣列一分為二，也就是類似於NVIDIA GPC的設計。與此相對應的，圖形裝配引擎雖然只有一個，內部卻設計了兩個Hierarchical Z（分層消影器）和Rasterizer（光柵器），但是其它的特殊功能模組均只有一個。

Barts和Cypress一樣，依然保持了雙核心設計，圖形裝配引擎也只有一個，內部的功能模組並沒有太多變化。但是Ultra-Treaded Dispatch Processor（超執行緒分配處理器）卻變成了兩個，相對應的，超執行緒分配處理器的指令快取也變成了兩份。

我們知道，Barts的流處理器數量是Cypress的70%，按理說執行緒分配壓力有所下降，那么設計兩個執行緒分配處理器的目的只有一個，那就是提升效率。在DX11時代，幾何著色再加上曲面細分單元引入之後，圖形裝配引擎會產生更多的並行執行緒及指令轉交SIMD進行處理，因此分配效率成為了新的瓶頸。

SIMD架構的優勢就是可以用較少的電晶體製造成龐大的流處理器規模，擁有恐怖的理論運算能力；但缺點就是流處理器執行效率比MIMD架構低，其效率高低完全依賴於分配單元的派發效率。因此Barts這種雙執行緒分配處理器的設計意義重大！

曲面細分性能翻倍

在Barts核心的圖形裝配引擎內部，還有一個毫不起眼的變化，那就是Tessellator（曲面細分單元）升級到了第七代，那么這一代到底有什麼改進呢？

我們知道，NVIDIAGF100核心內部擁有多達16個曲面細分單元，GF104核心也有8個之多，而AMD的HD5000全系列都只有1個曲面細分單元，現如今HD6000系列還是維持全局共享1個的設計不變，其低下的曲面細分性能成為了NVIDIA攻擊AMD最充分的理由。

HD6000系列可以說是半代改進的架構，既然數量上維持不變，就只能從改進效率的方面考慮了。而改進的內容就是加強執行緒管理和緩衝，也就是上頁我們介紹過的“雙倍的超執行緒分配處理器和指令快取”。

根據AMD官方提供的數據來看，HD6870的曲面細分性能最多可達HD5870的兩倍，這種情況出現在10級左右的中等細分程度，當曲面細分達到20級以上的時候，那么它們的性能就基本上沒有區別了。

由此可見， Barts核心當中的Tessellator單元本身在性能方面應該沒有改進，其性能提升主要源於兩顆超執行緒分配處理器。中等級別的曲面細分在指令分配方面是瓶頸，Barts改進的架構消除了這一瓶頸，所以性能提升十分顯著，但如果細分級別特別高時，Tessellator本身的運算能力將成為瓶頸，此時執行緒派遣器的效率再高，也無濟於事

曲面分太細沒有意義

通過前文的分析我們可以知道，HD6000在曲面細分方面的改進其實與雙執行緒分配處理器是一回事，性能提升也是在特定的情況下才會出現。但總的來說還是能有1.5倍-2倍的提升，這對於消除A卡在Tessellation方面的瓶頸還是很有意義的。

不過，AMD還是堅持認為當今的GPU和遊戲尚不需要特彆強悍的曲面細分能力，簡而言之就是“曲面分得太細並不能讓圖形畫質變得更好，但卻會造成圖形性能大幅下降”。其實，筆者也認同這種觀點，但曲面細分性能也不能太弱。

下面我們就看圖說話，筆者選擇了目前曲面細分級別最高的一款DX11 Benchmark程式和NVIDIA官方曲面細分演示Demo進行說明：

Heaven是款不錯的DX11 Benchmark程式，其1.0版本是基於HD5000而開發的，Tessellation只有Normal級別。在GTX480發布之後，很快就誕生了2.0版本，其測試場景並沒有太大變化，最核心的內容就是將Tessellation提升至Extreme級別，大家可以發現，片面提升曲面細分的結果就是： 除了FPS暴降之外很難看出畫面有什麼提升！

然後通過測試成績我們就可以發現，Heaven 1.0的成績是很正常的，四款顯示卡的性能表現完全在意料之中。而在Heaven 2.0當中，局勢完全被逆轉，GTX480超越了雙核的HD5970，GTX470都大幅領先與HD5870。這組成績確實證明了GTX480和GTX470在重度曲面細分環境下擁有非常出色的效能，而HD5000將會出現嚴重瓶頸導致效能大降，但實際上卻沒有多少實際意義，因為 加重曲面細分級別並沒有帶來畫質改善，那么我們憑什麼非要開到Extreme級別呢？

綜上所述，通過兩款曲面細分的代表Demo截圖我們就會發現，當今的遊戲其實並不需要把曲面分得太細，只要將插值頂點的數目控制在一定的範圍之內，畫面就非常精細了，盲目提高插值級別的做法沒有太大意義，可謂是得不償失。

事實上，當今所有的DX11都是這么做的，雖然使用了Tessellation技術，但都只是蜻蜓點水、適可而止，即便如此已經可以讓遊戲畫面得到很大的改善。遊戲不同於技術演示Demo或者SDK，而是本著實用化的原則，追求高效率運行，而不是專門用來刁難顯示卡的。

也就是說，以現有HD5000的Tessellation運算能力，是完全足以勝任今後較長一段時間內DX11遊戲的需要。GTX480/470雖然擁有N倍於HD5000的Tessellation運算能力，但除了能夠在為數不多的幾款Demo當中蹂躪A卡外，似乎並沒有其它用途。等到未來遊戲真正需要更強的曲面細分性能時，當今的頂級顯示卡可能幾百塊錢處理都處理不掉了，未來的遊戲同樣需要更強的浮點運算能力，而不是片面注重某一特定技術的性能。

改進AA和AF畫質效率

從G80時代開始，NVIDIA不滿足於業界標準MSAA（多重採樣抗鋸齒），推出了自己的CSAA（CoverageSamplingAnti-Aliasing，覆蓋採樣抗鋸齒）標準，從而實現了更高的精度和更佳的效率。

而AMD也不逞多讓，爭鋒相對的推出了CFAA（Custom Filter Anti-Aliasing，定製過濾抗鋸齒），實現了更高倍數的抗鋸齒模式。但是這種CFAA並沒有得到遊戲廠商的認可，因為這種自定義擴大採樣色彩採樣範圍的抗鋸齒模式，會出現將物體邊緣變模糊的現象。

從G80發布至今，NVIDIA的CSAA技術得到了越來越多遊戲開發商的認可，相信很多玩家都注意到了，現在不少遊戲都直接在選單中提供了CSAA選項，N卡用戶不用進入驅動控制臺就能非常方便的調用。而AMD的CFAA雖然從HD2000時代已經沿用到了HD5000時代，但幾乎無人問津。

終於到了HD6000時代，AMD拋棄了實用價值並不高的CFAA，開發了一種新的抗鋸齒方案——Morphological AA，直譯為形態抗鋸齒。這種抗鋸齒採用了DirectCompute計算技術來進行高效率的後處理器過濾，

新的抗鋸齒模式適用範圍比傳統的MSAA更廣，而且精度最高可達24x，效率方面比SSAA（超級採樣抗鋸齒）快很多，與最高精度的CFAA差不多，但畫質要更好。

除此之外，HD6000系列還改進了AF（各項異性過濾）算法，使得紋理材質的清晰度和畫質進一步提高，且不至於出現失真和變形。每一代新產品出現後NVIDIA和AMD都會強調AF畫質和效率會更好，事實上它們前幾代產品已經做得足夠好了，新的改進除了用專業測試軟體才能看出很小的區別外，在普通遊戲中誰會注意到如此微不足道的變化呢？

UVD3.0支持DIVX/XVID硬解碼

在3D引擎部分，Barts核心相對於Cypress的改進並不多，只有超執行緒分配處理器、指令快取、曲面細分模組和AA/AF算法這些。

從架構圖中我們可以注意點，AMD的UVD（Unified Video Decoder，通用視頻解碼器）引擎現在升級到了第三代：

上圖非常直觀的揭示了UVD三代引擎在功能方面的改進，UVD2主要是加入了對即將淘汰的MPEG-2編碼的硬解支持，讓CPU占用率進一步下降，性能方面接近於NVIDIAVP3引擎。

★ UVD3引擎改進之一：MPEG-2完全硬解碼

UVD3的改進最為徹底，MPEG-2編碼最複雜的熵解碼部分也可以支持硬解了，從而實現了完全硬解碼，達到了NVIDIAVP3的水平。不過對於這種即將被淘汰的編碼進行改進並不是UVD3的重點。

★ UVD3引擎改進之二：多屏、超高解析度、多路視頻流、3D藍光硬解碼

UVD3最有價值的改進就在於對與Eyefinity多屏套用模式下，超高解析度視頻解碼的支持，以及多路視頻流解碼支持，還有3D藍光硬解碼支持。

★ UVD3引擎改進之三：加入了DivX/xVid視頻硬解碼支持

目前網際網路上流行的很多盜版電影都是採用了DivX壓縮格式，主要集中在DVDrip以及部分720p高清視頻電影方面。另外新興的XviD標準也因為更高的壓縮率和畫質在迅速成長。這兩種由MPEG-4衍生出來的視頻編碼有著為數不少的影片（尤其是日本動作片）。

低解析度的DivX/xVid視頻碼率並不高，對於CPU要求較低。但近年來也有朝著高清發展的趨勢，解析度提高之後的影片由於其壓縮率很高因此解碼時的CPU占用率並不低。此次UVD3解碼器對DivX和Xvid提供了支持，可謂是民心所向。

★ UVD3引擎改進之四：視頻畫質接近滿分

根據AMD官方公布的數據來看，在HQV Benchmark 2.0測試中，HD6870幾乎可以達到滿分的成績，遠勝過NVIDIA最新的GTX460顯示卡，和Intel的整合顯示卡不在一個檔次。

南方群島[AMD出產的GPU處理器架構]