綜述
Intel官方正式確認,基於全新Nehalem架構的下一代桌面處理器將沿用“Core”(酷睿)名稱,命名為“Intel Core i7”系列,至尊版的名稱是“Intel Core i7 Extreme”系列。而同架構伺服器
將繼續延用“Xeon”名稱。至於為什麼是“I7”,而不是大多數人認為的“Core 3”,Intel方面還沒給出詳細的解釋,估計意思是Intel的第七代處理器,但2000年推出Netbrust架構的Pentium 4處理器應該是屬於第七代產品的,真正解釋還是等Intel的回答吧。
Intel Core i7是一款45nm原生四核處理器,處理器擁有8MB三級快取,支持三通道 DDR3記憶體。處理器採用LGA 1366針腳設計,支持第二代超執行緒技術,也就是處理器能以八執行緒運行。根據網上流傳的測試,同頻Core i7比Core 2 Quad性能要高出很多。
綜合之前的資料來看,英特爾首先會發布三款Intel Core i7處理器,頻率分別為3.2GHz、2.93GHz和2.66GHz,主頻為3.2GHz的屬於Intel Core i7 Extreme,處理器售價為999美元,當然這款頂級處理器面向的是發燒級用戶。而頻率較低的2.66GHz的定價為284美元,約合1940元人民幣,面向的是普通消費者。全新一代Core i7處理器將於今年第四季度推出。
而從英特爾技術峰會2008(IDF2008)上英特爾展示的情況來看,core i7的能力在core2 extreme QX9770(3.2GHz)的三倍左右。IDF上,intel工作人員使用一顆core i7 3.2GHz處理器演示了CineBench R10多執行緒渲染,結果很驚人。渲染開始後,四顆核心的八個執行緒同時開始工作,僅僅19秒鐘後完整的畫面就呈現在了螢幕上,得分超過45800。相比之下,core2 extreme qx9770 3.2GHz只能得到12000分左右,超頻到4.0GHz才勉強超過15000分,不到core i7的3分之一。core i7的超強實力由此可窺見一斑。
新特性
1. 基於Intel Core微架構
2. 2-8顆核心。
3. 內置三通道DDR3記憶體控制器。
4. 每顆核心獨享256KB二級快取。
5. 8 MB共享三級快取。
6. SSE 4.2指令集(七條新指令)。
7. 超執行緒技術。
8. Turbo mode(自動超頻)。
9. 微架構最佳化(支持64-bit模式的宏融合,提高環形數據流監測器性能,六個數據發射連線埠等等)
10. 提升預判單元性能,增加第二組分支照準快取。
11. 第二組512路的TLB。
12. 對於非整的SSE指令提升性能。
13. 提升虛擬機性能(根據Intel官方數據顯示,Nehalem相對65nm Core 2在雙程虛擬潛伏上有60%的提升,而相對45nm Core 2產品提升了20%)
14. 新的QPI匯流排。
15. 新的能源管理單元。
16. 45nm製程,32nm製程產品隨後上線,代號Westmere。
17. 新的1366針腳接口。
Nehalem相當於65nm產品有著如下幾個最重要的新增功能。
1. SSE4.1指令集(47個新SSE指令)。
2. 深層休眠技術(C6級休眠,只在移動晶片上使用)。
3. 加強型Intel動態加速技術(只在移動晶片上使用)。
4. 快速Radix-16分頻器和Super Shuffle engine,加強FPU性能
5. 加強型虛擬技術,虛擬機之間互動性能提升25%-75%。
Nehalem的核心部分比Core微架構改進了以下部分:
Cache設計:採用三級全內含式Cache設計,L1的設計與Core微架構一樣;L2採用超低延遲的設計,每個核心各擁有256KB的L2 Cache;L3則是採用共享式設計,被片上所有核心共享使用。
集成了記憶體控制器(IMC):記憶體控制器從北橋晶片組上轉移到CPU片上,支持三通道DDR3記憶體,記憶體讀取延遲大幅減少,記憶體頻寬則大幅提升,最多可達三倍。
快速通道互聯(QPI):取代前端匯流排(FSB)的一種點到點連線技術,20位寬的QPI連線其頻寬可達驚人的每秒25.6GB,遠超過原來的FSB。QPI最初能夠發放異彩的是支持多個處理器的伺服器平台,QPI可以用於多處理器之間的互聯。
Nehalem的核心部分比Core微架構新增加的功能主要有以下幾方面:
New SSE4.2 Instructions (新增加SSE4.2指令)
Turbo Mode (核心加速模式)
Improved Lock Support (改進的鎖定支持)
Additional Caching Hierarchy (新的快取層次體系)
Deeper Buffers (更深的緩衝)
Improved Loop Streaming (改進的循環流)
Simultaneous Multi-Threading (同步多執行緒)
Faster Virtualization (更快的虛擬化)
Better Branch Prediction (更好的分支預測)
Core i7的改進:原生四核+全新快取設計
我們知道,Core 2 Quad系列四核處理器其實是把兩個Core 2 Duo處理器封裝在一起,並非原生的四核設計,通過狹窄的前端匯流排FSB來通信,這樣的缺點是數據延遲問題比較嚴重,性能並
不盡如人意。Core i7則採用了原生四核設計,採用先進的QPI(QuickPath Interconnect,下面將進行介紹)匯流排進行通訊,傳輸速度是FSB的5倍。快取方面也採用了三級內含式Cache設計,L1的設計和Core微架構一樣;L2採用超低延遲的設計,每個核心256KB(256x4 KB);L3採用共享式設計,被片上所有核心共享,容量為8MB。
Core i7的改進:採用全新QPI匯流排
Core i7的Nehalem架構最大的改進在前端匯流排(FSB)上,傳統的並行傳輸方式被徹底廢棄,轉而採用基於PCI Express串列點對點傳輸技術的通用系統接口(CSI),被Intel稱為QuickPath。QuickPath的傳輸速率為6.4Gbps,這樣一條32bit的QuickPath頻寬就能達到25.6GB/sec。QuickPath的傳輸速率是FSB 1333MHz的5倍,前者雖然數據位寬較窄,但傳輸頻寬仍然是後者的2.5倍。由於分別用於雙處理器和單處理平台,Gainestown有兩條QuickPath,而Bloomfield僅有一條。不難看出,在AMD推出HyperTransport高速串列匯流排,並逐漸在高性能運算領域建立優勢之後,Intel也迎頭趕上。若干年前,關於串列傳輸將一統天下的預言已經變成了現實,我們所要等待的是串列記憶體何時重返市場。
Core i7的改進:集成記憶體控制器
記憶體控制器相信大家不會感到陌生,競爭對手AMD早在K8時代CPU已經集成了記憶體控制器,能大幅提升記憶體性能,而Intel方面則表示由於時機還不合適,因此沒有在Core2中使用,現在最新的Core i7終於擁有集成記憶體控制器IMC(Integrated Memory Controller),可以支持三通道的DDR3記憶體,運行在DDR3-1333,記憶體位寬從128位提升到192位,這樣總共的峰值頻寬就可以達到32GB/s,達到了Core 2的2-4倍。處理器採用了集成記憶體控制器後,它就能直接與物理存儲器陣列相連線,從而極大程度上減少了記憶體延遲的現象。
Core i7的改進:同步多執行緒技術
原生四核Core i7有八個邏輯核心
超執行緒技術(Hyper-Threading) ,最早出現在130nm的Pentium 4上,超執行緒技術就是利用特殊的硬體指令,把兩個邏輯核心模擬成兩個物理晶片,讓單個處理器都能使用執行緒級並行計算,進而兼容多執行緒作業系統和軟體,減少了CPU的閒置時間,提高的CPU的運行效率。超執行緒技術使得Pentium 4單核CPU也擁有較出色的多任務性能,現在通過改進後的超執行緒技術再次回歸到Core i7處理器上,新命名為同步多執行緒技術(Simultaneous Multi-Threading,SMT)。
同步多執行緒(Simultaneous Multi-Threading,SMT)是2-way的,每核心可以同時執行2個執行緒。對於執行引擎來說,在多執行緒任務的情況下,就可以掩蓋單個執行緒的延遲。SMT功能的好處是只需要消耗很小的核心面積代價,就可以在多任務的情況下提供顯著的性能提升,比起完全再添加一個物理核心來說要划算得多。比起Pentium 4的超執行緒技術(Hyper-Threading),Core i7的優勢是有更大的快取和更大的記憶體頻寬,這樣就更能夠有效的發揮多執行緒的作用。按照INTEL的說法,Nehalem的SMT可以在增加很少能耗的情況下,讓性能提升20-30%。
為什麼Core 2沒有使用SMT?很顯然,它是可以做到的。SMT是在節省電力的基礎上增加了性能,而且軟體支持的基礎建設也早就有了。有2個可能的原因:一是Core 2可能沒有足夠的記憶體頻寬和CPU內部頻寬來利用SMT獲得優勢。通常,SMT能夠提升記憶體級並行(memory level parallelism,MLP),但是對於記憶體頻寬已經成為瓶頸的系統則是個麻煩。而更有可能的原因則是SMT的設計、生效等是很麻煩的,而當初設計SMT是由INTEL的Hillsboro小組主持,而並非是Haifa小組(Core 2是由這個小組負責的)。這樣Core 2不使用SMT就避免了冒險。
Core i7的改進:自動超頻,核心加速
Turbo Mode,故名思義,就是加速模式,它是基於Nehalem架構的電源管理技術,通過分析當前CPU的負載情況,智慧型地完全關閉一些用不上的核心,把能源留給正在使用的核心,並使它們運行在更高的頻率,進一步提升性能;相反,需要多個核心時,動態開啟相應的核心,智慧型調整頻率。這樣,在不影響CPU的TDP情況下,能把核心工作頻率調得更高。
舉個簡單的例子,如果遊戲只用到一個核心,Turbo Mode就會把其他三個核心自動關閉,把正在運行遊戲的那個核心的頻率提高,也就是自動超頻,在不浪費能源的情況下獲得更好的性能。Core 2時代,即使是運行只支持單核的程式,其他核心仍會全速運行,得不到性能提升的同時,也造成了能源的浪費。
Turbo Boost默認是開啟的,通過自動調高CPU的倍頻提高性能。在Intel原廠x58主機板上,低負載時默認調高1-2個倍頻。例如Core i7 920默認頻率為2.66G,在Turbo Boost默認是開啟的情況下,運行Super PI是以單核2.8G來跑,這樣單執行緒性能也就得到提升。
超頻愛好者也許會想到,Turbo Mode自動提升的那個頻率可以手動調整嗎?如果可以,不就能利用它進行超頻嗎?答案是可以的,只要是Exterme Edition CPU,就可以手動調整,好好利用,新的超頻方式從此誕生。
Core i7的改進:完整SSE4指令支持
完整的SSE 4(Streaming SIMD Extensions 4,流式單指令多數據流擴張)指令集共包含54條指令,其中的47條指令已在45nm的Core 2上實現,稱為SSE 4.1。SSE 4.1指令的引入,進一步增強了CPU在視頻編碼/解碼、圖形處理以及遊戲等多媒體套用上的性能。其餘的7條指令在Core i7中也得以實現了,稱為SSE 4.2。SSE 4.2是對SSE 4.1的補充,主要針對的是對XML文本的字元串操作、存儲校驗CRC32的處理等。
Intel官方正式確認,基於全新Nehalem架構的下一代桌面處理器將沿用“Core”(酷睿)名稱,命名為“IntelCorei7”系列,至尊版的名稱是“IntelCorei7Extreme”系列。而同架構伺服器處理器將繼續延用“Xeon”名稱。至於為什麼是“I7”,而不是大多數人認為的“Core3”,Intel方面還沒給出詳細的解釋,估計意思是Intel的第七代處理器,但2000年推出NetBrust架構的Pentium4處理器應該是屬於第七代產品的,真正解釋還是等Intel的回答吧。
IntelCorei7是一款45nm原生四核處理器,處理器擁有8MB三級快取,支持三通道DDR3記憶體。處理器採用LGA1366針腳設計,支持第二代超執行緒技術,也就是處理器能以八執行緒運行。根據網上流傳的測試,同頻Corei7比Core2Quad性能要高出很多。
綜合之前的資料來看,英特爾首先會發布三款IntelCorei7處理器,頻率分別為3.2GHz、2.93GHz和2.66GHz,主頻為3.2GHz的屬於IntelCorei7Extreme,處理器售價為999美元,當然這款頂級處理器面向的是發燒級用戶。而頻率較低的2.66GHz的定價為284美元,約合1940元人民幣,面向的是普通消費者。全新一代Corei7處理器將於今年第四季度推出。
而從英特爾技術峰會2008(IDF2008)上英特爾展示的情況來看,corei7的能力在core2extremeqx9770(3.2GHz)的三倍左右。IDF上,intel工作人員使用一顆corei73.2GHz處理器演示了CineBenchR10多執行緒渲染,結果很驚人。渲染開始後,四顆核心的八個執行緒同時開始工作,僅僅19秒鐘後完整的畫面就呈現在了螢幕上,得分超過45800。相比之下,core2extremeqx97703.2GHz只能得到12000分左右,超頻到4.0GHz才勉強超過15000分,不到corei7的3分之一。corei7的超強實力由此可窺見一斑。
全新微架構,性能大幅提升
IntelCorei7處理器將開啟一個新的時代
Corei7是Intel採用全新Nehalem微架構的處理器產品,與上一代產品酷睿2相比有諸多改進,其中最重要的變化體現在以下幾個方面:第一,Corei7是Intel第一款原生4核處理器,並支持超執行緒技術;第二,採用了全新的LGA1366接口;第三,引入了QPI(快車直接通道)匯流排技術,同時還在CPU內部集成了三通道DDR3記憶體控制器。
除此之外,Corei7還支持“TurboboostTechnology”自動超頻、SSE4.2指令集、電源管理等值得關注的新技術。比如“PowerGate”(電源柵極),可以獨立控制單個核心的開關、加快核心喚醒速度,大大降低漏電率和金屬層電阻,而且模板化的設計使得核心、記憶體控制器、輸入輸出模組都運行在獨立的電壓和頻率上,另外對作業系統也是透明的。在能源環保問題愈加受到重視的今天,Intel把“節能”放到了非常重要的位置,高端產品也不不例外。
在性能方面Corei7的表現可謂不負眾望,Intel宣稱,Corei7在SPECint_base_rate2006基準測試中獲得了史無前例的117分,同時也是第一次有單處理器的成績突破百分大關,所以Intel驕傲地稱Corei7是“地球上最快的處理器”。根據我們的評測結果,新的頂級型號Corei7965Extreme(至尊版)與上一代旗艦產品Core2ExtremeQX9770相比,可以帶來全方位的性能飛躍,比如3DmarkVantage物理和AI(人工只能)測試提高44%~55%、圖像渲染速度提升25%、遊戲與視頻開放提升20%~60%、視頻編輯提升30%~80%、3D遊戲提升5%~35%等等。
Intel Corei7目前定位前端市場
與2006年推出酷睿微架構處理器的情況有所不同,Intel這次似乎並不打算讓Corei7迅速占領市場主流位置。由於採用了45nm製程的酷睿2處理器在市場中還顯得遊刃有餘,尚未面臨強大的競爭壓力,Intel目前只是把Corei7作為高端市場的戰略武器。
首批發售的三款Corei7分別為頻率2.66GHz的Corei7920、2.93GHz的Corei7940和3.2GHz的頂級型號Corei7965Extreme,價格分別為284美元、562美元與999美元,可以看出Corei7的上市還是挺高的,尤其是對於中國消費者來說不易接受,在今年內應該還難以進入主流市場。
Corei7平台需要的主機板和記憶體也是兩個很大的開銷。目前一線X58主機板的價格在2500元以上,2GB的DDR3記憶體在500元以上,如果要組建三通道記憶體,那么處理器、主機板、記憶體三大件就要花掉6000多元,比組建一台萬完整的基於酷睿2主流配置的電腦還貴。據主機板廠商透露,Intel正在考慮將LGA775接口平台的生命周期延長到2011年,並逐步將它轉入低端入門級市場,這意味著在未來三年內,LGA775都不會被淘汰,而是與Corei7平台共存於市。
就在不久前,AMD推出了自家的45nm處理器——“上海”,主要針對伺服器市場,即將上市的45nm四核羿龍將成為AMD新一代高端家用處理器。這的一提的是,即使是最高端的45nm四核羿龍,其售價也應該維持在1500元左右,加上配套的主機板與記憶體,不會超過3000元。在這個價格範圍內,Intel酷睿2雙核、四核處理器與配套主機板都非常完善,性能也與AMD各有所長,暫不需要援兵。也就是說,在Corei7平台,未來一段時期將沒有AMD對應的產品與它進行正面的競爭。
回敘正是這個原因,Intel對酷睿2的能力充滿信心,將Corei7與X58的價格都頂得很高,這與之前的酷睿2、P35與P45上市時的定價規則有很大區別。平台在短期內更像是具有象徵意義的前瞻性產品,比如整合記憶體處理器(未來部分規格產品還會整合圖形核心),傳統意義上的北橋將逐漸淡化,甚至消失。對於用戶和玩家來說,從Corei7開始,個人電腦的集成度將進一步提高,節能與輕巧的趨勢將愈加明顯。
要讓Corei7、X58與DDR3被普通大眾用戶接受,保守估計至少還需要半年的過度時間,在這段時間,Intel和AMD之間45nm處理器的對決將是市場的主旋律。