InterCorei7處理器

Intel Core i7是一款45nm原生四核處理器,處理器擁有8MB三級快取,支持三通道 DDR3記憶體。處理器採用LGA 1366針腳設計,支持第二代超執行緒技術,也就是處理器能以八執行緒運行。根據網上流傳的測試,同頻Core i7比Core 2 Quad性能要高出很多。 註:標題上的inter(R)應該是intel(R)

基本介紹

基於 Nehalem架構的下一代桌面處理器沿用“ Core”( 酷睿)名稱,命名為“Intel Core i7”系列,至尊版的名稱是“Intel Core i7 Extreme”系列。而同架構伺服器處理器將繼續延用“ Xeon”名稱。至於為什麼是“ i7”,而不是大多數人認為的“ Core 3 ”,Intel還沒給出詳細的解釋,估計意思是Intel的第七代處理器,但2000年推出NetBrust架構的Pentium 4處理器應該是屬於第七代產品的綜合之前的資料來看,英特爾首先會發布三款Intel Core i7處理器,頻率分別為3.2GHz、2.93GHz和2.66GHz,主頻為3.2GHz的屬於Intel Core i7 Extreme,處理器售價為999美元,當然這款頂級處理器面向的是發燒級用戶。而頻率較低的2.66GHz的定價為284美元,約合1940元人民幣,面向的是普通消費者。全新一代Core i7處理器將於2008第四季度推出。

Intel於2008年11月18日發布了三款Core i7處理器,分別為Core i7 920、Core i7 940和Core i7 Extreme Edition 965。而從英特爾技術峰會2008(IDF2008)上英特爾展示的情況來看,core i7的能力在core2 extreme qx9770(3.2GHz)的三倍左右。

IDF上,intel工作人員使用一顆core i7 3.2GHz處理器演示了CineBench R10多執行緒渲染,結果很驚人。渲染開始後,四顆核心的八個執行緒同時開始工作,僅僅19秒鐘後完整的畫面就呈現在了螢幕上,得分超過45800。相比之下,core2 extreme qx9770 3.2GHz只能得到12000分左右,超頻到4.0GHz才勉強超過15000分,不到core i7的3分之一。core i7的超強實力由此可窺見一斑。

1. 基於Nehalem微架構

2. 2-8顆核心。

3. 內置三通道DDR3記憶體控制器。

4. 每顆核心獨享256KB二級快取。

5. 8 MB共享三級快取。

6. SSE 4.2指令集(七條新指令)。

7. 超執行緒技術。

8. Turbo mode(自動超頻)。

9. 微架構最佳化(支持64-bit模式的宏融合,提高環形數據流監測器性能,六個數據發射連線埠等等)

10. 提升預判單元性能,增加第二組分支照準快取。

11. 第二組512路的TLB。

12. 對於非整的SSE指令提升性能。

13. 提升虛擬機性能(根據Intel官方數據顯示,Nehalem相對65nm Core 2在雙程虛擬潛伏上有60%的提升,而相對45nm Core 2產品提升了20%)

14. 新的QPI匯流排。

15. 新的能源管理單元。

16. 45nm製程,32nm製程產品隨後上線,代號Westmere。

17. 新的1366針腳接口。

Nehalem相當於65nm產品有著如下幾個最重要的新增功能。

1. SSE4.1指令集(47個新SSE指令)。

2. 深層休眠技術(C6級休眠,只在移動晶片上使用)。

3. 加強型Intel動態加速技術(只在移動晶片上使用)。

4. 快速Radix-16分頻器和Super Shuffle engine,加強FPU性能

5. 加強型虛擬技術,虛擬機之間互動性能提升25%-75%。

Nehalem的核心部分比Core微架構改進了以下部分:

Cache設計:採用三級全內含式Cache設計,L1的設計與Core微架構一樣;L2採用超低延遲的設計,每個核心各擁有256KB的L2 Cache;L3則是採用共享式設計,被片上所有核心共享使用。

集成了記憶體控制器(IMC):記憶體控制器從北橋晶片組上轉移到CPU片上,支持三通道DDR3記憶體,記憶體讀取延遲大幅減少,記憶體頻寬則大幅提升,最多可達三倍。

快速通道互聯(QPI):取代前端匯流排(FSB)的一種點到點連線技術,20位寬的QPI連線其頻寬可達驚人的每秒25.6GB,遠超過原來的FSB。QPI最初能夠發放異彩的是支持多個處理器的伺服器平台,QPI可以用於多處理器之間的互聯。

Nehalem的核心部分比Core微架構新增加的功能主要有以下幾方面:

New SSE4.2 Instructions (新增加SSE4.2指令)

Turbo Mode (核心加速模式)

Improved Lock Support (改進的鎖定支持)

Additional Caching Hierarchy (新的快取層次體系)

Deeper Buffers (更深的緩衝)

Improved Loop Streaming (改進的循環流)

Simultaneous Multi-Threading (同步多執行緒)

Faster Virtualization (更快的虛擬化)

Better Branch Prediction (更好的分支預測)

改進

原生四核+全新快取設計

我們知道,Core 2 Quad系列四核處理器其實是把兩個Core 2 Duo處理器封裝在一起,並非原生的四核設計,通過狹窄的前端匯流排FSB來通信,這樣的缺點是數據延遲問題比較嚴重,性能並不盡如人意。Core i7則採用了原生四核設計,採用先進的QPI(QuickPath Interconnect,下面將進行介紹)匯流排進行通訊,傳輸速度是FSB的5倍。

快取方面也採用了三級內含式Cache設計,L1的設計和Core微架構一樣;L2採用超低延遲的設計,每個核心256KB(256x4 KB);L3採用共享式設計,被片上所有核心共享,容量為8MB。

採用全新QPI匯流排

Core i7的Nehalem架構最大的改進在前端匯流排(FSB)上,傳統的並行傳輸方式被徹底廢棄,轉而採用基於PCI Express串列點對點傳輸技術的通用系統接口(CSI),被Intel稱為QuickPath。QuickPath的傳輸速率為6.4Gbps,這樣一條32bit的QuickPath頻寬就能達到25.6GB/sec。QuickPath的傳輸速率是FSB 1333MHz的5倍,前者雖然數據位寬較窄,但傳輸頻寬仍然是後者的2.5倍。由於分別用於雙處理器和單處理平台,Gainestown有兩條QuickPath,而Bloomfield僅有一條。不難看出,在AMD推出HyperTransport高速串列匯流排,並逐漸在高性能運算領域建立優勢之後,Intel也迎頭趕上。若干年前,關於串列傳輸將一統天下的預言已經變成了現實,我們所要等待的是串列記憶體何時重返市場。

集成記憶體控制器

記憶體控制器相信大家不會感到陌生,競爭對手AMD早在K8時代CPU已經集成了記憶體控制器,能大幅提升記憶體性能,而Intel方面則表示由於時機還不合適,因此沒有在Core2中使用,現在最新的Core i7終於擁有集成記憶體控制器IMC(Integrated Memory Controller),可以支持三通道的DDR3記憶體,運行在DDR3-1333,記憶體位寬從128位提升到192位,這樣總共的峰值頻寬就可以達到32GB/s,達到了Core 2的2-4倍。處理器採用了集成記憶體控制器後,它就能直接與物理存儲器陣列相連線,從而極大程度上減少了記憶體延遲的現象。

同步多執行緒技術

原生四核Core i7有八個邏輯核心

超執行緒技術(Hyper-Threading),最早出現在130nm的Pentium 4上,超執行緒技術就是利用特殊的硬體指令,把兩個邏輯核心模擬成兩個物理晶片,讓單個處理器都能使用執行緒級並行計算,進而兼容多執行緒作業系統和軟體,減少了CPU的閒置時間,提高的CPU的運行效率。超執行緒技術使得Pentium 4單核CPU也擁有較出色的多任務性能,現在通過改進後的超執行緒技術再次回歸到Core i7處理器上,新命名為同步多執行緒技術(Simultaneous Multi-Threading,SMT)。

同步多執行緒(Simultaneous Multi-Threading,SMT)是2-way的,每核心可以同時執行2個執行緒。對於執行引擎來說,在多執行緒任務的情況下,就可以掩蓋單個執行緒的延遲。SMT功能的好處是只需要消耗很小的核心面積代價,就可以在多任務的情況下提供顯著的性能提升,比起完全再添加一個物理核心來說要划算得多。比起Pentium 4的超執行緒技術(Hyper-Threading),Core i7的優勢是有更大的快取和更大的記憶體頻寬,這樣就更能夠有效的發揮多執行緒的作用。按照INTEL的說法,Nehalem的SMT可以在增加很少能耗的情況下,讓性能提升20-30%。

為什麼Core 2沒有使用SMT?很顯然,它是可以做到的。SMT是在節省電力的基礎上增加了性能,而且軟體支持的基礎建設也早就有了。有2個可能的原因:一是Core 2可能沒有足夠的記憶體頻寬和CPU內部頻寬來利用SMT獲得優勢。通常,SMT能夠提升記憶體級並行(memory level parallelism,MLP),但是對於記憶體頻寬已經成為瓶頸的系統則是個麻煩。而更有可能的原因則是SMT的設計、生效等是很麻煩的,而當初設計SMT是由INTEL的Hillsboro小組主持,而並非是Haifa小組(Core 2是由這個小組負責的)。這樣Core 2不使用SMT就避免了冒險。

自動超頻,核心加速

Turbo Mode,顧名思義,就是加速模式,它是基於Nehalem架構的電源管理技術,通過分析當前CPU的負載情況,智慧型地完全關閉一些用不上的核心,把能源留給正在使用的核心,並使它們運行在更高的頻率,進一步提升性能;相反,需要多個核心時,動態開啟相應的核心,智慧型調整頻率。這樣,在不影響CPU的TDP情況下,能把核心工作頻率調得更高。

舉個簡單的例子,如果遊戲只用到一個核心,Turbo Mode就會把其他三個核心自動關閉,把正在運行遊戲的那個核心的頻率提高,也就是自動超頻,在不浪費能源的情況下獲得更好的性能。Core 2時代,即使是運行只支持單核的程式,其他核心仍會全速運行,得不到性能提升的同時,也造成了能源的浪費。

Turbo Boost默認是開啟的,通過自動調高CPU的倍頻提高性能。在Intel原廠X58主機板上,低負載時默認調高1-2個倍頻。例如Core i7 920默認頻率為2.66G,在Turbo Boost默認是開啟的情況下,運行Super PI是以單核2.8G來跑,這樣單執行緒性能也就得到提升。

超頻愛好者也許會想到,Turbo Mode自動提升的那個頻率可以手動調整嗎?如果可以,不就能利用它進行超頻嗎?答案是可以的,只要是Exterme Edition CPU,就可以手動調整,好好利用,新的超頻方式從此誕生。

文本處理再提速!完整SSE4指令支持

完整的SSE 4(Streaming SIMD Extensions 4,流式單指令多數據流擴張)指令集共包含54條指令,其中的47條指令已在45nm的Core 2上實現,稱為SSE 4.1。SSE 4.1指令的引入,進一步增強了CPU在視頻編碼/解碼、圖形處理以及遊戲等多媒體套用上的性能。其餘的7條指令在Core i7中也得以實現了,稱為SSE 4.2。SSE 4.2是對SSE 4.1的補充,主要針對的是對XML文本的字元串操作、存儲校驗CRC32的處理等。

相關詞條

相關搜尋

熱門詞條

聯絡我們