QPI的技術特點
頻寬更大
Intel的QuickPath Interconnect技術縮寫為QPI,譯為快速通道互聯。事實上它的官方名字叫做CSI,Common System Interface公共系統界面,用來實現晶片之間的直接互聯,而不是在通過FSB連線到北橋,矛頭直指AMD的HT匯流排。無論是速度、頻寬、每個針腳的頻寬、功耗等一切規格都要超越HT匯流排。
QPI是一種基於包傳輸的串列式高速點對點連線協定,採用差分信號與專門的時鐘進行傳輸。在延遲方面,QPI與 FSB幾乎相同,卻可以提升更高的訪問頻寬。一組QPI具有具有20條數據傳輸線,以及傳送(TX)和接收方(RX)的時鐘信號。
一個QPI數據包包含80位,需要兩個時鐘周期或四次傳輸完成整個數據包的傳送(QPI的時鐘信號速率是傳輸速率的一半)。在每次傳輸的20bit數據中,有16bit是真實有效的數據,其餘四位用於循環冗餘校驗,以提高系統的可靠性。由於QPI是雙向的,在傳送的同時也可以接收另一端傳輸來的數據,這樣,每個QPI匯流排總頻寬=每秒傳輸次數(即QPI頻率)×每次傳輸的有效數據(即16bit/8=2Byte)×雙向。所以QPI頻率為4.8GT/s的總頻寬=4.8GT/s×2Byte×2=19.2GB/s,QPI頻率為6.4GT/s的總頻寬=6.4GT/s×2Byte×2=25.6GB/s。(bit-位,Byte-位元組,1Byte=8bit)
效率更高
此外,QPI另一個亮點就是支持多條系統匯流排連線,Intel稱之為multi-FSB。系統匯流排將會被分成多條連線,並且頻率不再是單一固定的,也無須如以前那樣還要再經過FSB進行連線。根據系統各個子系統對數據吞吐量的需求,每條系統匯流排連線的速度也可不同,這種特性無疑要比AMD目前的Hypertransport匯流排更具彈性。
QPI與FSB的區別
FSB正離我們遠去
眾所周之,前端匯流排(Front Side Bus,簡稱FSB)是將CPU中央處理器連線到北橋晶片的系統匯流排,它是CPU和外界交換數據的主要通道。前端匯流排的數據傳輸能力對計算機整體性能影響很大,如果沒有足夠頻寬的前端匯流排,即使配備再強勁的CPU,用戶也不會感覺到計算機整體速度的明顯提升。
目前intel處理器主流的前端匯流排頻率有800MHz、1066MHz、1333MHz幾種,而就在2007年11月,intel再度將處理器的前端匯流排頻率提升至1600MHz(默認外頻400MHz),這比2003年最高的800MHzFSB匯流排頻率整整提升了一倍。這樣高的前端匯流排頻率,其頻寬多大呢?前端匯流排為1333MHz時,處理器與北橋之間的頻寬為10.67GB/s,而提升到1600MHz能達到12.8GB/s,增加了20%。
雖然intel處理器的前端匯流排頻率看起來已經很高,但與同時不斷提升的記憶體頻率、高性能顯示卡(特別是雙或多顯示卡系統)相比,CPU與晶片組存在的前端匯流排瓶頸仍未根本改變。例如1333MHz的FSB所提供的記憶體頻寬是1333MHz×64bit/8=10667MB/s=10.67GB/s,與雙通道的DDR2-667記憶體剛好匹配,但如果使用雙通道的DDR2-800、DDR2-1066的記憶體,這時FSB的頻寬就小於記憶體的頻寬。更不用說和未來的三通道和更高頻率的DDR3記憶體搭配了(Nehalem平台三通道DDR3-1333記憶體的頻寬可達32GB/s)。
與AMD的HyperTransport(HT)匯流排技術相比,FSB的頻寬瓶頸也很明顯。HT作為AMD CPU上廣為套用的一種端到端的匯流排技術,它可在記憶體控制器、磁碟控制器以及PCI-E匯流排控制器之間提供更高的數據傳輸頻寬。HT1.0在雙向32bit模式的匯流排頻寬為12.8GB/s,其頻寬便可匹敵目前最新的FSB頻寬。2004年AMD推出的HT2.0規格,最大頻寬又由1.0的12.8GB/s提升到了22.4GB/s。而最新的HT3.0又將工作頻率從HT2.0最高的1.4GHz提高到了2.6GHz,提升幅度幾乎又達到了一倍。這樣,HT3.0在2.6GHz高頻率32bit高位寬運行模式下,即可提供高達41.6GB/s的匯流排頻寬(即使在16bit的位寬下也能提供20.8GB/s 頻寬),相比FSB優勢明顯,應付未來兩年內記憶體、顯示卡和處理器的升級需要也沒有問題。
面對這種頻寬上的劣勢,雖然intel通過對市場的準確把握,以及其他優勢技術上的彌補(如指令集優勢、如CPU效率上intel的酷睿2雙核共享二級快取互聯架構要明顯優於AMD HT互聯下的的雙核架構等等),讓AMD的頻寬優勢並沒有因此轉化為勝勢,但intel要想改變這種處理器和北橋設備之間頻寬捉襟見肘的情況,縱使在現可在技術上將FSB頻率進一步提高到2133MHz,也難以應付未來DDR3記憶體及多顯示卡系統所帶來的頻寬需求。Intel推出新的匯流排技術勢在必行。
當世界失去FSB我們還有QPI
Intel自身也清醒的認識到,要想在通過單純提高處理器的外頻和FSB,也難以像以前那樣帶來更好的性能提升。採用全新的Nehalem架構的intel下一代CPU讓我們看到了英特爾變革的決心。目前已經正式發布,基於該架構的代號為Boomfield第一款處理器,我們可以看見很多很多技術的細節——該處理器擁有全新的規格和性能,採用全新的LGA 1366接口,45nm製程,集成三通道DDR3記憶體控制器(支持DDR3 800/1066/1333/1600記憶體規格),使用新匯流排QPI與處理器進行連線,支持SMT(Simultaneous Muti-hreading,單顆處理器就可以支持8執行緒並行技術)多執行緒技術,支持SSE4.2指令集(增加了7條新的SSE4指令),是intel第一款原生四核處理器……
當然,在其擁有的眾多技術中,最引人注目的應該還是QPI(原先宣傳的CSI匯流排)匯流排技術,他是全新的Nahalem架構之所以能在架構、功能和性能上取得大突破的關鍵性技術。
QPI能給我們帶來什麼
QPI(Quick Path Interconnect)——"快速通道互聯",取代前端匯流排(FSB)的一種點到點連線技術,20位寬的QPI連線其頻寬可達驚人的每秒25.6GB,遠非FSB可比。QPI最初能夠發放異彩的是支持多個處理器的伺服器平台,QPI可以用於多處理器之間的互聯。
1. QPI使通信更加方便
QPI是在處理器中集成記憶體控制器的體系架構,主要用於處理器之間和系統組件之間的互聯通信(諸如I/O)。他拋棄了沿用多年的的FSB,CPU可直接通過記憶體控制器訪問記憶體資源,而不是以前繁雜的“前端匯流排——北橋——記憶體控制器”模式。並且,與AMD在主流的多核處理器上採用的4HT3(4根傳輸線路,兩根用於數據傳送,兩個用於數據接收)連線方式不同,英特爾採用了4+1 QPI互聯方式(4針對處理器,1針對I/O設計),這樣多處理器的每個處理器都能直接與物理記憶體相連,每個處理器之間也能彼此互聯來充分利用不同的記憶體,可以讓多處理器的等待時間變短(訪問延遲可以下降50%以上),只用一個記憶體插槽就能實現與四路AMD皓龍處理器(AMD在伺服器領域的處理器,與intel至強同等產品定位)同等頻寬。
2. QPI、處理器間峰值頻寬可達96GB/s
在intel高端的安騰處理器系統中,QPI高速互聯方式使得CPU與CPU之間的峰值頻寬可達96GB/s,峰值記憶體頻寬可達34GB/s。這主要在於QPI採用了與PCI-E類似的點對點設計,包括一對線路,分別負責數據傳送和接收,每一條通路可傳送20bit數據。這就意味著即便是最早的QPI標準,其傳輸速度也能達到6.4GT/s——總計頻寬可達到25.6GB/s(為FSB 1600MHz的12.8GB/S的兩倍)。這樣的頻寬已可媲美AMD目前的匯流排解決方案,能滿足未來CPU與CPU、CPU與晶片的數據傳輸要求。
3. 多核間互傳資料不用經過晶片組
QPI匯流排可實現多核處理器內部的直接互聯,而無須像以前那樣還要再經過FSB進行連線。例如,針對伺服器的Nehalem架構的處理器擁有至少4組QPI傳輸,可至少組成包括4顆處理器的4路高端伺服器系統(也就是16顆運算核心至少32執行緒並行運作)。而且在多處理器作業下,每顆處理器可以互相傳送資料,並不需要經過晶片組,從而大幅提升整體系統性能。隨著未來Nehalem架構的處理器集成記憶體控制器、PCI-E 2.0圖形接口乃至圖形核心的出現,QPI架構的優勢見進一步發揮出來。
4. QPI互聯架構本身具有升級性
QPI採用串聯方式作為訊號的傳送,採用了LVDS(低電壓差分信號技術,主要用於高速數位訊號互聯,使信號能以幾百Mbps以上的速率傳輸)信號技術,可保證在高頻率下仍能保持穩定性。QPI擁有更低的延遲及更好的架構,將包括集成的存儲器控制器以及系統組件間的通信鏈路。
5. QPI匯流排架構具備可靠性和性能
可靠性、實用性和適用性特點為QPI的高可用性提供了保證。比如連結級循環冗餘碼驗證(CRC)。出現時鐘密碼故障時,時鐘能自動改路傳送到數據信道。QPI還具備熱插拔。深度改良的微架構、集成記憶體控制器設計以及QPI直接技術,令Nehalem擁有更出色的執行效率,在單執行緒同頻率下,Nehalem擁有更為出色的執行效率,在單執行緒同頻率條件下,Nehalem的運算能力在相同功耗下比現行的Penryn架構的效能可能提高30%。
QPI對AMD和NVIDIA的影響
做為行業領導性廠商,每次Intel平台的進步都是有人歡喜有人愁。比如,AMD面臨著該如何追趕Intel處理器革新速度的問題,如果未來AMD無法跟上英特爾的步伐,其市場份額肯定將變得越來越小。當然,AMD有其過硬的顯示卡技術支撐,這正是目前Intel所欠缺的。
AMD CPU如真能將其GPU整合,帶來的市場影響力也是巨大的。
NVIDIA的處境,Intel的目標是CPU整合GPU,而NVIDIA的目標則是GPU整合CPU,雖然NVIDIA自身對其信心滿滿,從目前的競爭形勢來看,一項是靠顯示卡技術、晶片組維繫的NVIDIA,面對Intel的打壓,必須在Intel平台推廣SLI,面對Intel和AMD的CPU整合GPU方案,對NVIDIA的低端、中低端顯示卡市場又非常大的影響。
QPI = Quality Performance Index﹐ 品質指標。
QPI示意圖
1、QPI---QuickPath Interconnect 用於替代FSB2、頻寬更大---數據傳送速度是FSB 1600的2倍—25.6GB/S
3、效率更高---支持多條系統匯流排連線