現有的酷睿i系列已經是智慧型處理器了,而SNB在此基礎上智慧型特性全面升級,並且無縫融合了圖形顯示核心。 英特爾這次推出的SNB處理器還重新定義了“整合平台”的概念,之前沿用多年的“集成顯示卡”將一去不復返,取而代之的是被處理器“無縫融合”的“核芯顯示卡”。
簡單地說,SNB(sandy bridge)是intel今年的產品。
SNB稱為Bridge,是因為它是環形架構。SNB是平面的32nm工藝技術。
NB一般來講是指北橋(north bridge)晶片,是離cpu最近的晶片,北橋是控制記憶體與CPU的聯繫的,有控制記憶體的作用。NB頻率則直接影響到記憶體的速度。上一代的westmere、現在的SNB、明年的IVB的CPU中都集成了北橋記憶體控制器,還集成了顯示晶片(就是所謂的核心顯示卡),所以表面上看功耗比較高。
另外SB一般是 南橋(south bridge)的意思,為了避免混淆,所以sandy bridge稱為SNB。
NB、SB都是指主機板上或者集成到CPU中的一種晶片,而SNB是指一代平台,主要指CPU,也包括用於這一代CPU的主機板。
SNB架構開啟智慧型新時代
在今年的年初,英特爾高調發布了全新的Sandy Bridge酷睿家族,而遠在大洋彼岸的拉斯維加斯也順利的召開了ces大展,豐富的產品讓2011年伊始便發出了格外奪目的色彩。新品的發布,讓不少的玩家都再次有了升級電腦,攢新換舊的念想。
在節前,村裡的經銷商們也都開始忙裡忙外,推出了各式各樣的促銷活動,以迎接這一嶄新的一年。相信不少的用戶都在節前攢配好了自己的機器,而也有不少的用戶持觀望的態度,畢竟對於新的產品,很多細節都還不是很了解。今天,就讓我們走進SNB,深入了解一下第二代英特爾智慧型酷睿處理器的幾大秘笈。
這款被Intel寄予厚望的架構產品在命名上採取了全新的方式。之前我們一直所稱的Sandy Bridge被賦予了第二代英智慧型酷睿處理器的名號,而其具體的產品名稱將繼續沿用酷睿這一命名方式,不過數字編號部分升級成為了4位。三條產品線分別為高端酷睿i7,中端酷睿i5和低端酷睿i3。而未來還將會推出基於相同架構的更為地段產品奔騰和賽揚處理器。
從已知的訊息中我們了解到,新的第二代英智慧型酷睿處理器在明年發布時將推出共13個型號。仍然沿用酷睿i7/i5/i3的品牌搭配子系列命名方式,編號上則採用四位數字:
其中第一位均為“2”,代表第二代Core ix系列,最後末尾往往還有一個代表不同含義的字母:K代表不鎖定倍頻,都是高端產品;S代表性能最佳化,原始頻率比沒有字母后綴的低很多,但是單核心加速最高頻率基本相同,另外熱設計功耗都是65W;T代表功耗最佳化,熱設計功耗只有45W或35W,但是頻率也是最低的。另外它們還將全部整合圖形核心,而且SandyBrige的顯示核心的頻率也會擁有動態加速的功能。能夠根據負載來自動調節頻率的高低。
第二代英特爾智慧型酷睿處理器架構解析
在前面,我們已經了解到了第二代英智慧型酷睿處理器的產品線劃分,也能看出英特爾在產品線劃分上已經不單單是依據處理器的頻率及硬體參數,更多的時候睿頻加速技術2.0,超執行緒等智慧型技術也成為了產品劃分的依據。那么對於第二代英智慧型酷睿處理器而言,其架構是怎樣的一個變化?
其實從高級層面角度看,SNB架構只是一次進化,但是如果看看Nehalem/Westmere以來電晶體變化的規模,那就足以稱得上是一次革命。從下面的圖便可以看出英特爾第二代英智慧型酷睿處理器在核心架構較上代產品有了變化。
我們可以看到與上代產品相比,SNB的核芯顯示卡晶片與處理器完全集成在了一起,而記憶體控制器也進一步進行了集成。在SNB中,三級快取依然延續。其中L1快取的設計與酷睿微架構相同,而L2快取則採用超低延遲的設計,而L3快取也依然採用的是共享式設計。英特爾第二代英智慧型酷睿處理器的酷睿i3、i5、i7依然可以通過對超執行緒技術的支持與否而劃分定位。雖然處理器型號不同不過架構基本類似。
英特爾第二代英智慧型酷睿處理器產品的三級快取由核心完全共享,它幾乎可以處理所有的一致性流量問題,同時不需要單獨打擾每顆獨立核心自己的L1、L2快取。優秀的架構所賦予的諸多全新特性為新酷睿家族處理器提供了強大的性能保證。當然,在英特爾第二代英智慧型酷睿處理器身上還有許許多多的變化,下面就讓我們更加細緻的來一起了解。
第二代英特爾智慧型酷睿處理器-核芯顯示卡
其實在Westmere中,酷睿i5/酷睿i3雖然也自帶了圖形核心,但與CPU是雙核心封裝,只是通過45nm工藝、更多著色硬體、更高頻率提升了性能,SNB架構的第二代英智慧型酷睿處理器則將CPU、GPU封裝在同一核心中,全部採用32nm工藝,特別是顯著提高了IPC(指令/時鐘)。
Sandy Bridge架構顯示能力的簡單介紹,Sandy Bridge的GPU和CPU被製造在同一32nm技術核心(DIE)內,而不再是封裝在一個PCB上的2個核心。更讓人激動的是GPU和CPU擁有共享的L3 Cache和記憶體控制器,並都掛在高頻寬的晶片內環形匯流排上,這一改變是革命性的,英特爾核芯顯示卡為處理器市場樹立了新的里程碑。同時,Sandy Bridge的GPU將享受到獨立型GPU都無法企望的與CPU最深級別的數據共享和回響速度。融合為王,性能至上的觀點在該晶片之上得到了很好的延續。
可程式著色硬體被稱為EU,包含著色器、核心、執行單元等,可以從多個執行緒雙發射時取指令。內部ISA映射和絕大多數DX10 API指令一一對應,架構很像CISC,結果就是有效擴大了EU的寬度,IPC也顯著提升。抽象數學運算由EU內的硬體負責,性能得以同步提高。Intel表示,正弦(sine)、餘弦(cosine)操作的速度比現在的HD Graphics提升了幾個數量級。
英特爾此前的圖形架構中,暫存器檔案都是即時重新分配的。如果一個執行緒需要的暫存器較少,剩餘暫存器jiuihui分配給其他執行緒。這樣雖能節省核心面積,但也會限制性能,很多時候執行緒可能會面臨沒有暫存器可用的尷尬。晶片組集成時代,每個執行緒平均64個暫存器,Westmere時代的HD Graphics提高到平均80個,SNB則每個執行緒固定為120個。SNB里每個EU的指令吞吐量都比現在的HD Graphics增加了一倍。
在第二代智慧型英特爾酷睿處理器所發布的產品當中,酷睿i5 2500K(網購最低價 1167.0元)以及酷睿i7 2600K(網購最低價 1800.0元)是唯一兩款具備了12個EU執行單元的產品,因此他們的顯示性能表現更強。
第二代英特爾智慧型酷睿處理器的核芯顯示卡有自己的電源島和時鐘域,也支持Turbo Boost技術,可以獨立加速或降頻,並共享三級快取。顯示卡驅動會控制訪問三級快取的許可權,甚至可以限制GPU使用多少快取。將圖形數據放在快取里就不用繞道去遙遠而“緩慢”的記憶體了,這對提升性能、降低功耗都大有裨益。
據了解Sandy Bridge圖形核心在睿頻技術的幫助下最高可以達到1350MHz,如此之高的核心頻率想必會幫助顯示核心性能大幅度增長。
第二代英特爾智慧型酷睿處理器- 媒體加速
在前面我們了解了第二代英智慧型酷睿處理器集成的核芯顯示卡的特性及架構,那么對於第二代英智慧型酷睿處理器產品而言,它們與上一代的產品相比都有哪些不同的特性及優秀的功能呢?它的性能表現相比上代產品又有著哪些的改變呢?
第二代英特爾智慧型酷睿處理器集成的GPU圖形核心分為兩大版本,分別擁有6個、12個EU。首批發布的移動版全部是12個EU,桌面版則根據型號不同而有兩種配置,高端12個、低端6個。得益於每個EU吞吐量翻番、運行頻率更高、共享三級快取等特點,即使只有六個的時候性能也會相當令人滿意。
得益於以上種種升級與改進,SandyBridge可輕而易舉地支持立體3D藍光電影播放和高清線上電視。為消費者提供更優異、更清晰的畫面,同時提供所有這些性能的同時卻更加省電和節省電池用量。值得一提的是,SandyBridge還擁有全新、實用的技術,實現超出常規和預期的速度和數據傳送的提升。其中的英特爾無線顯示技術(Intel WirelessDisplay)即可將高清內容無線傳輸至大螢幕電視。
同時在媒體特性等方面,全新的酷睿家族平台同上一代產品相比也有著很大的突破。其中全新的酷睿家族平台能夠支持雙視頻解碼,在顏色控制,HDMI輸出等方面也有提升。
同時SNB中還有一個媒體處理器,專門負責視頻解碼、編碼。新的硬體加速解碼引擎中,整個視頻管線都通過固定功能單元進行解碼,和現在正好相反。Intel據此宣稱,SNB在播放視頻的時候功耗可降低一半。
這種多媒體邏輯和ATI/NVIDIA的GPU設計非常相似,而之前Intel是一直使用CPU邏輯進行多媒體視頻操作的,尤其是編碼方面。Sandy Bridge的這個媒體處理器讓我們有些迷惑:這明顯就是Intel的硬體編碼/解碼方案,藍色巨頭似乎悄悄的放棄了繼續使用x86 CPU+軟體在視頻處理上與NVIDIA那些怪獸級別GPU的硬體解碼、編碼對抗。在未來,Sandy Bridge所帶來的完美視覺,必將成為主流之選。
第二代英特爾智慧型酷睿處理器-高速視頻同步
高速視頻同步乍聽起來似乎並不是特別易懂,不過如果說是視頻編解碼技術應該就能夠好理解的多了。第二代英智慧型酷睿處理器有一項名為Quick Sync Video(高速視頻同步)的功能,該功能便是英特爾HD顯示卡所具備的最新視頻轉碼功能。
雖然視頻轉碼並非新鮮事,在NVIDIA或者是AMD的顯示卡中都能夠很好的支持,不過英特爾之前的集成顯示卡完全只能依靠CPU軟解碼。
在新一代HD顯示卡上,英特爾加強了核芯顯示卡的通用計算能力,增加了對視頻轉碼的支持,縮短了轉換時間的消耗。英特爾Quick Sync Video(高速視頻同步)技術通過處理器的硬體解碼來進行運算,讓視頻轉換變得更加輕鬆。
在最新的Media Converter 7中,我們已經能夠看到該軟體對Intel Quick Synv Video(高速視頻同步)技術的支持。該軟體能夠調節視頻轉碼所使用的處理器的核心數量,同時能夠自動識別處理器是否能夠支持高速視頻同步。同時該軟體能夠支持將普通片源轉換為3D效果,英特爾具備高速視頻同步技術的處理器產品無疑能夠提供更好的選擇。
可以看出,第二代英特爾智慧型酷睿處理器的全線產品均能夠支持Quick Sync Video(高速視頻同步)技術,這無疑為消費者們帶來了更好的體驗,也正是高速視頻同步技術的出現令第二代英特爾智慧型酷睿處理器成為一款劃時代的產品奠定了更多基礎。
第二代智慧型酷睿處理器-睿頻加速2.0
在Nehalem架構處理器發布之時,Intel推出了一個用於提高CPU核心工作效率的新技術,官方名稱Turbo Boost睿頻加速技術。該技術的理解很簡單,就是利用處理器核心空閒時的TDP,轉移到正在全速運算的核心之上,提高該核心的或者多個核心的頻率以換取更高的性能。
該技術的運用進一步提高了處理器的智慧型化,也在節能的同時提高了處理器的運行效率。時隔2年之後,Sandy Bridge推出了Turbo Boost睿頻加速技術第二代技術。
第二代睿頻加速技術其實可以算作是第一代睿頻加速技術的加強版,主要加強了在多核心情況下處理器核心頻率能夠進一步提高。說的簡單一些就是多核心下原有第一代可能提高1個倍頻,在二代情況下有可能提高的是2個倍頻甚至更多。這也就是說在第二代睿頻加速技術的幫助下,無論是單執行緒還是多執行緒Sandy Bridge處理器都可以獲得非常優秀的性能表現。即使是主頻較低的產品。
現有處理器都是假設一旦開啟動態加速,就會達到TDP限制,但事實上並非如此,處理器不會立即變得很熱,而是有一段時間發熱量距離TDP還差很多。SNB利用這一點特性,允許單元控制單元(PCU)在短時間內將活躍核心加速到TDP以上,然後慢慢降下來。PCU會在空閒時跟蹤散熱剩餘空間,在系統負載加大時予以利用。處理器空閒的時間越長,能夠超越TDP的時間就越長,但最長不超過25秒鐘。所以第二代睿頻加速實際上就是PCU*單元不斷監測CPU內每個核心的狀態,一旦有一個或多個多個核心處於Unactive狀態,PCU就會自動提升處於Active狀態的核心的運行頻率,直到達到TDP限制。
同時由於核芯顯示卡也整合在同一晶片,因此Sandy Bridge架構也把核芯顯示卡的TDP納入睿頻加速的超頻空間。當中包括3D Processing Unit、Execution Units及Media Processing Unit,當它們閒置時會把TDP的超頻空間也轉化給處理單元,反之處理單元閒置也可把TDP變成圖形單元的超頻空間。
* PCU:Intel專門在CPU內部設計了PCU(Power Control Unit,功耗控制)單元,PCU會以1ms(每秒1000次)的速度實時監測這四個核心的溫度、電流及功耗等參數。
第二代智慧型酷睿處理器-超執行緒技術
第二代智慧型酷睿處理器中超執行緒技術也成為了不可不提的智慧型套用。其中從前面的產品分布表格中我們便可以看出,核心數量,睿頻加速技術2.0和超執行緒已經成為了劃分產品定位的標準。我們知道,Nehalem架構重新啟用了曾經在NetBurst上套用過的超執行緒技術,不過已經更名為同步多執行緒技術(Simultaneous Multi-Threading,SMT)。NetBurst架構上的超執行緒技術局限於FSB和記憶體傳輸數據頻寬,實際帶來的性能提升可能並不明顯,因此後來的酷睿2處理器直接拋棄了超執行緒技術。
SandyBrige架構將QPI和集成記憶體控制器引入後直接帶來驚人的頻寬,重新啟動同步多執行緒技術毫無疑問不用再擔心傳輸頻寬所產生的瓶頸。
第二代智慧型酷睿處理器所採用的同步多執行緒技術基於2路設計,即每顆核心可以同時執行2個執行緒。在多任務情況下可以有效提升性能,採用這種模擬的邏輯運算核心絕對比直接增加一顆物理運算核心成本低。Intel表示SMT技術可以在能耗增加不明顯的情況下提升20-30%性能。
第二代智慧型酷睿處理器-AVX指令集
除了二代增強型的睿頻加速功能以及超執行緒技術等等之外,Sandy Bridge還將是第一個擁有高級矢量擴展指令集(Advanced Vector Extensions)的微架構。AVX,即Advanced Vector Extensions高級矢量擴展。AVX的特點由以下幾個方面展現:
>>從128bit擴展到256bit的SIMD運算單元;
>>增強的數據重排,單個操作可同時處理8個32-bit共256bit數據
>>單條指令支持3運算元和4運算元
>>支持彈性的訪存地址不對齊
>>AVX指令支持VEX前綴
這些運算邏輯上的技術細節讓人頭大,落實到套用上,AVX主要針對密集型浮點運算,3D遊戲、CAD/CAM、數字內容創建等套用是這類計算的代表。Intel宣稱,Sandy Bridge的AVX進行矩陣計算的時候將比SSE技術快90%!
核心面積的精簡正是AVX指令(SNB最主要革新之一)集得以實現並保證良好性能的關鍵所在。以最小的核心面積代價,Intel將所有SIMD單元都轉向了256-bit。
AVX支持256-bit運算元,相當消耗電晶體與核心面積,而RPF的使用加大了亂序執行緩衝,能夠很好地滿足更高吞吐量的浮點引擎。
SNB允許256-bit AVX指令借用128-bit的整數SIMD數據路徑,這就使用最小的核心面積實現了雙倍的浮點吞吐量,每個時鐘可以進行兩個256-bit AVX操作。另外執行硬體和路徑的上位128-bit是受電源柵極(Power Gate)控制的,標準128-bit SSE操作不因為256-bit擴展增加功耗。