基本內容
微處理器(英語:Microprocessor,縮寫:µP或uP)是可程式化特殊積體電路。一種處理器,其所有組件小型化至一塊或數塊積體電路內。一種積體電路,可在其一端或多端接受編碼指令,執行此指令並輸出描述其狀態的信號。這些指令能在內部輸入、集中或存放起來。又稱半導體中央處理機(CPU),是微型計算機的一個主要部件。微處理器的組件常安裝在一個單片上或在同一組件內,但有時分布在一些不同晶片上。在具有固定指令集的微型計算機中,微處理器由算術邏輯單元和控制邏輯單元組成。在具有微程式控制的指令集的微型計算機中,它包含另外的控制存儲單元(源自:英漢雙解計算機字典)。用作處理通用數據時,叫作中央處理器。這也是最為人所知的套用(如:Intel Pentium CPU);專用於作圖像數據處理的,叫作Graphics Processing Unit圖形處理器(如Nvidia GeForce 7X0 GPU);用於音頻數據處理的,叫作Audio Processing Unit音頻處理單元(如Creative emu10k1 APU)等等。物理性來說,它就是一塊集成了數量龐大的微型電晶體與其他電子組件的半導體積體電路晶片。
之所以會稱為微處理器,並不只是因為它比迷你電腦所用的處理器還要小而已。最主要的原因,還是因為當初各大晶片廠之製程,已經進入了1 微米的階段,用1 微米的製程,所產制出來的處理器晶片,廠商就會在產品名稱上用“微”字,強調他們很高科技。就如同現在的許多商業廣告一樣,很喜歡用“奈米”字眼。
早在微處理器問世之前,電子計算機的中央處理單元就經歷了從真空管到電晶體以及再後來的離散式TTL積體電路等幾個重要階段。甚至在電子計算機以前,還出現過以齒輪、輪軸和槓桿為基礎的機械結構計算機。文藝復興時期的著名畫家兼科學家李奧納多·達·芬奇就曾做過類似的設計[來源請求],但那個時代落後的製造技術根本沒有能力將這個設計付諸實現。微處理器的發明使得複雜的電路群得以製成單一的電子組件。
最新訊息
昨天,英特爾宣布推出為高密度微型伺服器以及新級別節能存儲和網路設備打造的凌動(Atom)S1200產品家族,同時這也是全球首個低功耗64位伺服器級系統晶片(SoC)。該家族目前包含三款新品(S1220/S1240/S1260),最低功耗僅為6瓦,處理器主頻為1.6GHz。
面對這一戰略性舉動,英特爾副總裁兼數據中心與互聯繫統事業部總經理柏安娜表示:“數據中心正在不斷演變成為一個獨特的細分市場,英特爾將繼續引領這一發展趨勢。幾年前,我們就意識到市場對新型高密度高能效比伺服器和其它數據中心設備的需求。”
英特爾為何要推出基於凌動平台的微處理器,它將如何平衡凌動和至強兩大產品平台之間的關係;英特爾微伺服器與競爭對手相比,有哪些獨特的優勢,產業鏈的支持能力如何;其後續產品技術路線圖又將怎樣,帶著這些問題,中國聯保網編輯對英特爾存儲產品市場經理亢海峰進行了專訪。
無關競爭對手 面向三大類市場
在亢海峰看來,英特爾之所以推出超低功耗的微伺服器,與ARM進入伺服器市場並沒有必然關聯。“多樣化的IT使用場景和不同的工作負載,才是英特爾進入微伺服器市場的最根本因素。”
亢海峰簡略的將IT套用分為三個場景:首先是企業級套用,非常看重IT基礎設施的可用性、可靠性、高效率和易用性;其次是科學計算,更加強調性能和浮點計算能力,而對於功耗和TCO等的需求沒有計算能力需求那么強烈;第三是雲服務提供商,與前兩者套用場景不同的是,IT不再是支撐手段而是核心業務,這類客戶非常看重TCO,需要在成本收入、性能功耗等方面找到平衡。
“而從工作負載角度來看,之前業界主要簡略劃分為處理器密集型、記憶體密集型和IO密集型,”亢海峰說,“其實還有一種類型是節點密集型,強調的是高密度和多節點,特別是滿足輕量級橫向可擴展的工作負載。比如對於雲服務提供商而言,通過部署高密度多節點的IT基礎設施,可以服務於更多的有需求的用戶,因為很多用戶並不願意採用多租戶模式。”
在他看來,英特爾微處理器主要面向專用主機託管、存儲和網路交換市場。“採用傳統的伺服器晶片,單機櫃的節點數量是有限的,而採用微伺服器晶片單機櫃節點數量將會超過1000個,可以滿足主機託管市場需求;在存儲方面,則主要面向入門級中低端存儲和大數據,未來我們會對所有數據做歸檔,具備計算能力的存儲節點將會優於磁帶存儲;在網路交換方面,微處理器同樣是面向入門級產品。”
生態系統延伸 至強凌動和平共處
其實,英特爾早在數年之前就開始關注低功耗伺服器,並對至強E3產品家族進行了擴展。那么至強E3和凌動微伺服器是否會有衝突呢?
亢海峰表示,雖然至強E3和凌動微伺服器都是面向低功耗市場,但兩者之間還是有明顯的區別。至強E3和凌動微伺服器主要追求的是性能和功耗的平衡,E3突出效能,而凌動微伺服器則突出高密度。
目前E3低功耗伺服器的功耗在17瓦到45瓦之間,而凌動則在6瓦到8瓦。從兩個平台的技術路線圖來看,E3和凌動都將在明年引入22納米製程工藝,2014年引入14納米。
亢海峰不斷強調新推出的凌動S1200是數據中心級產品:英特爾凌動微處理器可確保伺服器級的可靠性和可管理性,同時大幅降低總成本。具備2顆物理核心,可通過使用英特爾超執行緒技術共支持4條執行緒。同時它還包括64位支持、支持最多可達8GB DDR3記憶體的記憶體控制器、英特爾虛擬化技術(Intel VT)、8個 PCI Express 2.0通道、可提高可靠性的錯誤代碼糾正(ECC)支持,以及與英特爾晶片組集成的其它I/O接口。
其實,我們不難發現英特爾凌動S1200系列晶片與競爭對手相比,還有一個非常大的特徵,就是完全兼容數據中心常用的x86軟體。“這將使集成新的低功率設備成為可能,並且避免導入和維護新軟體棧的額外投資。要知道,軟體測試與平台移植的成本是非常高的。”英特爾凌動S1200系列處理器在12月11日開始向用戶出貨,建議起始零售價為每千顆54美元。
基本簡介
微處理器用一片或少數幾片大規模積體電路組成的中央處理器。這些電路執行控制部件和算術邏輯部件的功能。微處理器與傳統的中央處理器相比,具有體積小、重量輕和容易模組化等優點。
微處理器的基本組成部分有:暫存器堆、運算器、時序控制電路,以及數據和地址匯流排。微處理器能完成取指令、執行指令,以及與外界存儲器和邏輯部件交換信息等操作,是微型計算機的運算控制部分。它可與存儲器和外圍電路晶片組成微型計算機。
自從人類1947年發明電晶體以來,50多年間半導體技術經歷了矽電晶體、
積體電路、超大規模積體電路、甚大規模積體電路等幾代,發展速度之快是其他產業所沒有的。半導體技術對整個社會產生了廣泛的影響,因此被稱為“產業的種子”。中央處理器是指計算機內部對數據進行處理並對處理過程進行控制的部件,伴隨著大規模積體電路技術的迅速發展,晶片集成密度越來越高,CPU可以集成在一個半導體晶片上,這種具有中央處理器功能的大規模積體電路器件,被統稱為“微處理器”。
內部結構
16位微處理器(圖中為8086微處理器)可分成兩個部分,一部分是執行部件(EU),即執行指令的部分;另
一部分是匯流排接口部件(BIU),與8086匯流排聯繫,執行從存儲器取指令的操作。微處理器分成EU和BIU後,可使取指令和執行指令的操作重疊進行。EU部分有一個暫存器堆,由8個16位的暫存器組成,可用以存放數據、變址和堆疊指針、算術運算邏輯單元(ALU)執行算術運算和邏輯操作,標誌暫存器暫存這些操作結果的條件。執行部件中的這些部件是通過數據匯流排傳送數據的。匯流排接口部件也有一個暫存器堆,其中CS、DS、SS和ES是存儲空間分段的分段暫存器。IP是指令指針。內部通信暫存器也是暫時存放數據的暫存器。指令佇列是把預先取來的指令流存放起來。匯流排接口部件還有一個地址加法器,把分段暫存器值和偏置值相加,取得20位的物理地址。數據和地址通過匯流排控制邏輯與外面的8086系統匯流排相聯繫。8086有16位數據匯流排,處理器與片外傳送數據時,一次課傳送16位二進制數。8086具有一個初級流水線結構,可以實現片內操作與片外操作的重疊。
微處理器的分類
根據微處理器的套用領域,微處理器大致可以分為三類:通用高性能微處理器、嵌入式微處理器和數位訊號處理器、微控制器。一般而言,通用處理器追求高性能,它們用於運行通用軟體,配備完備、複雜的作業系統;嵌入式微處理器強調處理特定套用問題的高性能,主要用於運行面向特定領域的專用程式,配備輕量級作業系統,主要用於蜂窩電話、CD播放機等消費類家電;微控制器價位相對較低,在微處理器市場上需求量最大,主要用於汽車、空調、自動機械等領域的自控設備。
CPU是Central Processing Unit(中央微處理器)的縮寫,它是計算機中最重要的一個部分,由運算器和控制器組成。如果把計算機比作人,那么CPU就是人的大腦。CPU的發展非常迅速,個人電腦從8088(XT)發展到Pentium 4時代,只經過了二十一年的時間。
發展歷程
CPU從最初發展至今已經有二十多年的歷史了,這期間,按照其處理信息的字長,CPU可以分為:4位微處理器、8位微處理器、16位微處理器、32位微處理器以及最新的64位微處理器,可以說個人電腦的發展是隨著CPU的發展而前進的。微機是指以大規模、超大規模積體電路為主要部件,以集成了計算機主要部件——控制器和運算器的微處理器MP(Micro Processor)為核心,所構造出的計算系經過30多年的發展,微處理器的發展大致可分為:
第一代
第一階段
(1971—1973年)通常以字長是4位或8位微處理器,典型的是美國 Intel 4004和Intel 8008微處理器。Intel 4004是一種4位微處理器,可進行4位二進制的並行運算,它有45條指令,速度0.05MIPs(Million Instruction Per Second,每秒百萬條指令)。Intel 4004的功能有限,主要用於計算器、電動打字機、照相機、台秤、電視機等家用電器上,使這些電器設備具有智慧型化,從而提高它們的性能。Intel 8008是世界上第一種8位的微處理器。存儲器採用PMOS工藝。該階段計算機工作速度較慢,微處理器的指令系統不完整,存儲器容量很小,只有幾百位元組,沒有作業系統,只有彙編語言。主要用於工業儀表、過程控制。
第二代
(1974—1977年)典型的微處理器有Intel 8080/8085,Zilog公司的Z80和Motorola公司的M6800。與第一代微處理器相比,集成度提高了1~4倍,運算速度提高了10~15倍,指令系統相對比較完善,已具備典型的計算機體系結構及中斷、直接存儲器存取等功能。
由於微處理器可用來完成很多以前需要用較大設備完成的計算任務,價格又便宜,於是各半導體公司開始競相生產微處理器晶片。Zilog公司生產了8080的增強型Z80,摩托羅拉公司生產了6800,英特爾公司於1976年又生產了增強型8085,但這些晶片基本沒有改變8080的基本特點,都屬於第二代微處理器。它們均採用NMOS工藝,集成度約9000隻電晶體,平均指令執行時間為1μS~2μS,採用彙編語言、BASIC、Fortran編程,使用單用戶作業系統。
第三代
第三階段(1978—1984年)即16位微處理器。1978 年,Intel公司率先推出16位微處理器8086,同時,為了方便原來的8位機用戶,Intel公司又提出了一種準16位微處理器8088。
8086微處理器最高主頻速度為8MHz,具有16位數據通道,記憶體定址能力為1MB。同時英特爾還生產出與之相配合的數學協處理器i8087,這兩種晶片使用相互兼容的指令集,但i8087指令集中增加了一些專門用於對數、指數和三角函式等數學計算的指令。人們將這些指令集統一稱之為 x86指令集。雖然以後英特爾又陸續生產出第二代、第三代等更先進和更快的新型CPU,但都仍然兼容原來的x86指令,而且英特爾在後續CPU的命名上沿用了原先的x86序列,直到後來因商標註冊問題,才放棄了繼續用阿拉伯數字命名。
1979年,英特爾公司又開發出了8088。8086和8088在晶片內部均採用16位數據傳輸,所以都稱為16位微處理器,但8086每周期能傳送或接收16位數據,而8088每周期只採用8位。因為最初的大部分設備和晶片是8位的,而8088的外部8位數據傳送、接收能與這些設備相兼容。8088採用40針的DIP封裝,工作頻率為6.66MHz、7.16MHz或8MHz,微處理器集成了大約29000個電晶體。
在Intel公司推出8086、8088 CPU之後,各公司也相繼推出了同類的產品,有Zilog公司Z8000和Motorola公司的M68000等。16位微處理器比8位微處理器有更大的定址空間、更強的運算能力、更快的處理速度和更完善的指令系統。所以,16位微處理器已能夠替代部分小型機的功能,特別在單任務、單用戶的系統中,8086等16位微處理器更是得到了廣泛的套用。
1981年,美國IBM公司將8088晶片用於其研製的IBM-PC機中,從而開創了全新的微機時代。也正是從8088開始,個人電腦(PC)的概念開始在全世界範圍內發展起來。從8088套用到IBM PC機上開始,個人電腦真正走進了人們的工作和生活之中,它也標誌著一個新時代的開始。
1982年,英特爾公司在8086的基礎上,研製出了80286微處理器,該微處理器的最大主頻為20MHz,內、外部數據傳輸均為16位,使用24位記憶體儲器的定址,記憶體定址能力為16MB。80286可工作於兩種方式,一種叫實模式,另一種叫保護方式。
在實模式下,微處理器可以訪問的記憶體總量限制在1兆位元組;而在保護方式之下,80286可直接訪問16兆位元組的記憶體。此外,80286工作在保護方式之下,可以保護作業系統,使之不像實模式或8086等不受保護的微處理器那樣,在遇到異常套用時會使系統停機。
IBM公司將80286微處理器用在先進技術微機即AT機中,引起了極大的轟動。80286在以下四個方面比它的前輩有顯著的改進:支持更大的記憶體;能夠模擬記憶體空間;能同時運行多個任務;提高了處理速度。
最早PC機的速度是4MHz,第一台基於80286的AT機運行速度為6MHz至8MHz,一些製造商還自行提高速度,使80286達到了20MHz,這意味著性能上有了重大的進步。
80286的封裝是一種被稱為PGA的正方形包裝。PGA是源於PLCC的便宜封裝,它有一塊內部和外部固體插腳,在這個封裝中,80286集成了大約130000個電晶體。
IBM PC/AT微機的匯流排保持了XT的三層匯流排結構,並增加了高低位位元組匯流排驅動器轉換邏輯和高位位元組匯流排。與XT機一樣,CPU也是焊接在主機板上的。
第四代
第四階段(1985—1992年)即32位微處理器。1985年10月17日,英特爾劃時代的產品——80386DX正式發布了,其內部包含27.5萬個電晶體,時鐘頻率為12.5MHz,後逐步提高到20MHz、25MHz、33MHz,最後還有少量的40MHz產品。
80386DX的內部和外部數據匯流排是32位,地址匯流排也是32位,可以定址到4GB記憶體,並可以管理64TB的虛擬存儲空間。它的運算模式除了具有實模式和保護模式以外,還增加了一種“虛擬86”的工作方式,可以通過同時模擬多個8086微處理器來提供多任務能力。
80386DX有比80286更多的指令,頻率為12.5MHz的80386每秒鐘可執行6百萬條指令,比頻率為16MHz的80286快2.2倍。80386最經典的產品為80386DX-33MHz,一般我們說的80386就是指它。
由於32位微處理器的強大運算能力,PC的套用擴展到很多的領域,如商業辦公和計算、工程設計和計算、數據中心、個人娛樂。80386使32位CPU成為了PC工業的標準。
1989年英特爾公司又推出準32位微處理器晶片80386SX。這是Intel為了擴大市場份額而推出的一種較便宜的普及型CPU,它的內部數據匯流排為32位,外部數據匯流排為16位,它可以接受為80286開發的16位輸入/輸出接口晶片,降低整機成本。80386SX推出後,受到市場的廣泛的歡迎,因為80386SX的性能大大優於80286,而價格只是80386的三分之一。
1989年,我們大家耳熟能詳的80486晶片由英特爾推出。這款經過四年開發和3億美元資金投入的晶片的偉大之處在於它首次實破了100萬個電晶體的界限,集成了120萬個電晶體,使用1微米的製造工藝。80486的時鐘頻率從25MHz逐步提高到33MHz、40MHz、50MHz。
80486是將80386和數學協微處理器80387以及一個8KB的高速快取集成在一個晶片內。80486中集成的80487的數字運算速度是以前80387的兩倍,內部快取縮短了微處理器與慢速DRAM的等待時間。並且,在80x86系列中首次採用了RISC(精簡指令集)技術,可以在一個時鐘周期內執行一條指令。它還採用了突發匯流排方式,大大提高了與記憶體的數據交換速度。由於這些改進,80486的性能比帶有80387數學協微處理器的80386 DX性能提高了4倍。
第五代
第5階段(1993-2005年)是奔騰(pentium)系列微處理器時代,通常稱為第5代。典型產品是Intel公司的奔騰系列晶片及與之兼容的AMD的K6系列微處理器晶片。內部採用了超標量指令流水線結構,並具有相互獨立的指令和數據高速快取。隨著MMX(MultiMediaeXtended)微處理器的出現,使微機的發展在網路化、多媒體化和智慧型化等方面跨上了更高的台階。
早期的奔騰75MHz~120MHz使用0.5微米的製造工藝,後期120MHz頻率以上的奔騰則改用0.35微米工藝。經典奔騰的性能相當平均,整數運算和浮點運算都不錯。為了提高電腦在多媒體、3D圖形方面的套用能力,許多新指令集應運而生,其中最著名的三種便是英特爾的MMX、SSE和AMD的3D NOW!。 MMX(MultiMedia Extensions,多媒體擴展指令集)是英特爾於1996年發明的一項多媒體指令增強技術,包括57條多媒體指令,這些指令可以一次處理多個數據,MMX技術在軟體的配合下,就可以得到更好的性能。
多能奔騰(Pentium MMX)的正式名稱就是“帶有MMX技術的Pentium”,是在1996年底發布的。從多能奔騰開始,英特爾就對其生產的CPU開始鎖倍頻了,但是MMX的CPU超外頻能力特彆強,而且還可以通過提高核心電壓來超倍頻,所以那個時候超頻是一個很時髦的行動。超頻這個詞語也是從那個時候開始流行的。
多能奔騰是繼Pentium後英特爾又一個成功的產品,其生命力也相當頑強。多能奔騰在原Pentium的基礎上進行了重大的改進,增加了片內16KB數據快取和16KB指令快取,4路寫快取以及分支預測單元和返回堆疊技術。特別是新增加的57條MMX多媒體指令,使得多能奔騰即使在運行非MMX最佳化的程式時,也比同主頻的Pentium CPU要快得多。
1997年推出的Pentium II處理器結合了Intel MMX技術,能以極高的效率處理影片、音效、以及繪圖資料,首次採用Single Edge Contact (S.E.C) 匣型封裝,內建了高速快取記憶體。這款晶片讓電腦使用者擷取、編輯、以及透過網際網路和親友分享數位相片、編輯與新增文字、音樂或製作家庭電影的轉場效果、使用視訊電話以及透過標準電話線與網際網路傳送影片,Intel Pentium II處理器電晶體數目為750萬顆。
Pentium III 處理器加入70個新指令,加入網際網路串流SIMD延伸集稱為MMX,能大幅提升先進影像、3D、串流音樂、影片、語音辨識等套用的性能,它能大幅提升網際網路的使用經驗,讓使用者能瀏覽逼真的線上博物館與商店,以及下載高品質影片,Intel首次導入0.25微米技術,Intel Pentium III電晶體數目約為950萬顆。
與此同年,英特爾還發布了PentiumIII Xeon處理器。作為PentiumII Xeon的後繼者,除了在核心架構上採納全新設計以外,也繼承了Pentium III處理器新增的70條指令集,以更好執行多媒體、流媒體套用軟體。除了面對企業級的市場以外,Pentium III Xeon加強了電子商務套用與高階商務計算的能力。在快取速度與系統匯流排結構上,也有很多進步,很大程度提升了性能,並為更好的多處理器協同工作進行了設計。
2000年推出的Pentium 4處理器內建了4200萬個電晶體,以及採用0.18微米的電路,Pentium 4初期推出版本的速度就高達1.5GHz,電晶體數目約為4200萬顆,翌年8月,Pentium 4 處理理達到2 GHz的里程碑。2002年英特爾推出新款Intel Pentium 4處理器內含創新的Hyper-Threading(HT)超執行緒技術。超執行緒技術打造出新等級的高性能桌上型電腦,能同時快速執行多項運算套用,或針對支持多重執行緒的軟體帶來更高的性能。超執行緒技術讓電腦性能增加25%。除了為桌上型電腦使用者提供超執行緒技術外,英特爾也達成另一項電腦里程碑,就是推出運作頻率達3.06 GHz的Pentium 4處理器,是首款每秒執行30億個運算周期的商業微處理器,如此優異的性能要歸功於當時業界最先進的0.13微米製程技術,翌年,內建超執行緒技術的Intel Pentium 4處理器頻率達到3.2 GHz。
PentiumM:由以色列小組專門設計的新型移動CPU,Pentium M是英特爾公司的x86架構微處理器,供筆記簿型個人電腦使用,亦被作為Centrino的一部分,於2003年3月推出。公布有以下主頻:標準1.6GHz,1.5GHz,1.4GHz,1.3GHz,低電壓1.1GHz,超低電壓900MHz。為了在低主頻得到高效能,Banias作出了最佳化,使每個時鐘所能執行的指令數目更多,並通過高級分支預測來降低錯誤預測率。另外最突出的改進就L2高速快取增至1MB(P3-M和P4-M都只有512KB),估計Banias數目高達7700萬的電晶體大部分就用在這上。
此外還有一系列與減少功耗有關的設計:增強型Speedstep技術是必不可少的了,擁有多個供電電壓和計算頻率,從而使性能可以更好地滿足套用需求。
智慧型供電分布可將系統電量集中分布到處理器需要的地方,並關閉空閒的套用;移動電壓定位(MVPIV)技術可根據處理器活動動態降低電壓,從而支持更低的散熱設計功率和更小巧的外形設計;經最佳化功率的400MHz系統匯流排;Micro-opsfusion微操作指令融合技術,在存在多個可同時執行的指令的情況下,將這些指令合成為一個指令,以提高性能與電力使用效率。專用的堆疊管理器,使用記錄內部運行情況的專用硬體,處理器可無中斷執行程式。
Banias所對應的晶片組為855系列,855晶片組由北橋晶片855和南橋晶片ICH4-M組成,北橋晶片分為不帶內置顯示卡的855PM(代號Odem)和帶內置顯示卡的855GM(代號Montara-GM),支持高達2GB的DDR266/200記憶體,AGP4X,USB2.0,兩組ATA-100、AC97音效及Modem。其中855GM為三維及顯示引擎最佳化InternalClockGating,它可以在需要時才進行三維顯示引擎供電,從而降低晶片組的功率。
2005年Intel推出的雙核心處理器有Pentium D和Pentium Extreme Edition,同時推出945/955/965/975晶片組來支持新推出的雙核心處理器,採用90nm工藝生產的這兩款新推出的雙核心處理器使用是沒有針腳的LGA 775接口,但處理器底部的貼片電容數目有所增加,排列方式也有所不同。
桌面平台的核心代號Smithfield的處理器,正式命名為Pentium D處理器,除了擺脫阿拉伯數字改用英文字母來表示這次雙核心處理器的世代交替外,D的字母也更容易讓人聯想起Dual-Core雙核心的涵義。
Intel的雙核心構架更像是一個雙CPU平台,Pentium D處理器繼續沿用Prescott架構及90nm生產技術生產。Pentium D核心實際上由於兩個獨立的2獨立的Prescott核心組成,每個核心擁有獨立的1MB L2快取及執行單元,兩個核心加起來一共擁有2MB,但由於處理器中的兩個核心都擁有獨立的快取,因此必須保正每個二級快取當中的信息完全一致,否則就會出現運算錯誤。
為了解決這一問題,Intel將兩個核心之間的協調工作交給了外部的MCH(北橋)晶片,雖然快取之間的數據傳輸與存儲並不巨大,但由於需要通過外部的MCH晶片進行協調處理,毫無疑問的會對整個的處理速度帶來一定的延遲,從而影響到處理器整體性能的發揮。
由於採用Prescott核心,因此Pentium D也支持EM64T技術、XD bit安全技術。值得一提的是,Pentium D處理器將不支持Hyper-Threading技術。原因很明顯:在多個物理處理器及多個邏輯處理器之間正確分配數據流、平衡運算任務並非易事。比如,如果應用程式需要兩個運算執行緒,很明顯每個執行緒對應一個物理核心,但如果有3個運算執行緒呢?因此為了減少雙核心Pentium D架構複雜性,英特爾決定在針對主流市場的Pentium D中取消對Hyper-Threading技術的支持。
同出自Intel之手,而且Pentium D和Pentium Extreme Edition兩款雙核心處理器名字上的差別也預示著這兩款處理器在規格上也不盡相同。其中它們之間最大的不同就是對於超執行緒(Hyper-Threading)技術的支持。Pentium D不支持超執行緒技術,而Pentium Extreme Edition則沒有這方面的限制。在打開超執行緒技術的情況下,雙核心Pentium Extreme Edition處理器能夠模擬出另外兩個邏輯處理器,可以被系統認成四核心繫統。
Pentium EE系列都採用三位數字的方式來標註,形式是Pentium EE8xx或9xx,例如Pentium EE840等等,數字越大就表示規格越高或支持的特性越多。
Pentium EE8x0:表示這是Smithfield核心、每核心1MB二級快取、800MHzFSB的產品,其與PentiumD8x0系列的唯一區別僅僅只是增加了對超執行緒技術的支持,除此之外其它的技術特性和參數都完全相同。
Pentium EE9x5:表示這是Presler核心、每核心2MB二級快取、1066MHzFSB的產品,其與PentiumD9x0系列的區別只是增加了對超執行緒技術的支持以及將前端匯流排提高到1066MHzFSB,除此之外其它的技術特性和參數都完全相同。
單核心的Pentium 4、Pentium 4 EE、Celeron D以及雙核心的Pentium D和Pentium EE等CPU採用LGA775封裝。與以前的Socket 478接口CPU不同,LGA 775接口CPU的底部沒有傳統的針腳,而代之以775個觸點,即並非針腳式而是觸點式,通過與對應的LGA 775插槽內的775根觸針接觸來傳輸信號。LGA 775接口不僅能夠有效提升處理器的信號強度、提升處理器頻率,同時也可以提高處理器生產的良品率、降低生產成本。
第六代
第6階段(2005年至今)是酷睿(core)系列微處理器時代,通常稱為第6代。“酷睿”是一款領先節能的新型微架構,設計的出發點是提供卓然出眾的性能和能效,提高每瓦特性能,也就是所謂的能效比。早期的酷睿是基於筆記本處理器的。 酷睿2:英文名稱為Core 2 Duo,是英特爾在2006年推出的新一代基於Core微架構的產品體系統稱。於2006年7月27日發布。酷睿2是一個跨平台的構架體系,包括伺服器版、桌面版、移動版三大領域。其中,伺服器版的開發代號為Woodcrest,桌面版的開發代號為Conroe,移動版的開發代號為Merom。
酷睿2處理器的Core微架構是Intel的以色列設計團隊在Yonah微架構基礎之上改進而來的新一代英特爾架構。最顯著的變化在於在各個關鍵部分進行強化。為了提高兩個核心的內部數據交換效率採取共享式二級快取設計,2個核心共享高達4MB的二級快取。
繼LGA775接口之後,Intel首先推出了LGA1366平台,定位高端旗艦系列。首顆採用LGA 1366接口的處理器代號為Bloomfield,採用經改良的Nehalem核心,基於45納米製程及原生四核心設計,內建8-12MB三級快取。LGA1366平台再次引入了Intel超執行緒技術,同時QPI匯流排技術取代了由Pentium 4時代沿用至今的前端匯流排設計。最重要的是LGA1366平台是支持三通道記憶體設計的平台,在實際的效能方面有了更大的提升,這也是LGA1366旗艦平台與其他平台定位上的一個主要區別。
作為高端旗艦的代表,早期LGA1366接口的處理器主要包括45nm Bloomfield核心酷睿i7四核處理器。隨著Intel在2010年買入32nm工藝製程,高端旗艦的代表被酷睿i7-980X處理器取代,全新的32nm工藝解決六核心技術,擁有最強大的性能表現。對於準備組建高端平台的用戶而言,LGA1366依然占據著高端市場,酷睿i7-980X以及酷睿i7-950依舊是不錯的選擇。
Intel Core i7是一款45nm原生四核處理器,處理器擁有8MB三級快取,支持三通道DDR3記憶體。處理器採用LGA 1366針腳設計,支持第二代超執行緒技術,也就是處理器能以八執行緒運行。根據網上流傳的測試,同頻Core i7比Core 2 Quad性能要高出很多。
綜合之前的資料來看,英特爾首先會發布三款Intel Core i7處理器,頻率分別為3.2GHz、2.93GHz和2.66GHz,主頻為3.2GHz的屬於Intel Core i7 Extreme,處理器售價為999美元,當然這款頂級處理器面向的是發燒級用戶。而頻率較低的2.66GHz的定價為284美元,約合1940元人民幣,面向的是普通消費者。全新一代Core i7處理器將於2013年第四季度推出。
而從英特爾技術峰會2008(IDF2008)上英特爾展示的情況來看,core i7的能力在core2 extreme qx9770(3.2GHz)的三倍左右。IDF上,intel工作人員使用一顆core i7 3.2GHz處理器演示了CineBench R10多執行緒渲染,結果很驚人。渲染開始後,四顆核心的八個執行緒同時開始工作,僅僅19秒鐘後完整的畫面就呈現在了螢幕上,得分超過45800。相比之下,core2 extreme qx 9770 3.2GHz只能得到一萬兩千分左右,超頻到4.0GHz才勉強超過15000分,不到core i7的3分之一。core i7的超強實力由此可窺見一斑。
Core i5是一款基於Nehalem架構的四核處理器,採用整合記憶體控制器,三級快取模式,L3達到8MB,支持Turbo Boost等技術的新處理器電腦配置。它和Core i7(Bloomfield)的主要區別在於匯流排不採用QPI,採用的是成熟的DMI(Direct Media Interface),並且只支持雙通道的DDR3記憶體。結構上它用的是LGA1156 接口,Core i7用的是LGA1366。i5有睿頻技術,可以在一定情況下超頻。
Core i3可看作是Core i5的進一步精簡版(或閹割版),將有32nm工藝版本(研發代號為Clarkdale,基於Westmere架構)這種版本。Core i3最大的特點是整合GPU(圖形處理器),也就是說Core i3將由CPU+GPU兩個核心封裝而成。由於整合的GPU性能有限,用戶想獲得更好的3D性能,可以外加顯示卡。值得注意的是,即使是Clarkdale,顯示核心部分的製作工藝仍會是45nm。i3 i5 區別最大之處是 i3沒有睿頻技術。
2010年6月,Intel再次發布革命性的處理器——第二代Core i3/i5/i7。第二代Core i3/i5/i7隸屬於第二代智慧型酷睿家族,全部基於全新的Sandy Bridge微架構,相比第一代產品主要帶來五點重要革新:1、採用全新32nm的Sandy Bridge微架構,更低功耗、更強性能。2、內置高性能GPU(核芯顯示卡),視頻編碼、圖形性能更強。 3、睿頻加速技術2.0,更智慧型、更高效能。4、引入全新環形架構,帶來更高頻寬與更低延遲。5、全新的AVX、AES指令集,加強浮點運算與加密解密運算。
SNB(Sandy Bridge)是英特爾在2011年初發布的新一代處理器微架構,這一構架的最大意義莫過於重新定義了“整合平台”的概念,與處理器“無縫融合”的“核芯顯示卡”終結了“集成顯示卡”的時代。這一創舉得益於全新的32nm製造工藝。由於Sandy Bridge 構架下的處理器採用了比之前的45nm工藝更加先進的32nm製造工藝,理論上實現了CPU功耗的進一步降低,及其電路尺寸和性能的顯著最佳化,這就為將整合圖形核心(核芯顯示卡)與CPU封裝在同一塊基板上創造了有利條件。此外,第二代酷睿還加入了全新的高清視頻處理單元。視頻轉解碼速度的高與低跟處理器是有直接關係的,由於高清視頻處理單元的加入,新一代酷睿處理器的視頻處理時間比老款處理器至少提升了30%。新一代Sandy Bridge處理器採用全新LGA1155接口設計,並且無法無LGA1156接口兼容。Sandy Bridge是將取代Nehalem的一種新的微架構,不過仍將採用32nm工藝製程。比較吸引人的一點是這次Intel不再是將CPU核心與GPU核心用“膠水”粘在一起,而是將兩者真正做到了一個核心裡。
在2012年4月24日下午北京天文館,intel正式發布了ivy bridge(IVB)處理器。22nm Ivy Bridge會將執行單元的數量翻一番,達到最多24個,自然會帶來性能上的進一步躍進。Ivy Bridge會加入對DX11的支持的集成顯示卡。另外新加入的XHCI USB 3.0控制器則共享其中四條通道,從而提供最多四個USB 3.0,從而支持原生USB3.0。cpu的製作採用3D電晶體技術的CPU耗電量會減少一半。
組成
微處理器由算術邏輯單元(ALU,Arithmetic Logical Unit);累加器和通用暫存器組;程式計數器(也叫指令指標器);時序和控制邏輯部件;數據與地址鎖存器/緩衝器;內部匯流排組成。其中運算器和控制器是其主要組成部分。
算術邏輯單元
算術邏輯單元ALU主要完成算術運算(+,-、×、÷、比較)和各種邏
輯運算(與、或、非、異或、移位)等操作。ALU是組合電路,本身無暫存運算元的功能,因而必須有保存運算元的兩個暫存器:暫存器TMP和累加器AC,累加器既向ALU提供運算元,又接收ALU的運算結果。
暫存器陣列實際上相當於微處理器內部的RAM,它包括通用暫存器組和專用暫存器組兩部分,通用暫存器(A,B,C,D)用來存放參加運算的數據、中間結果或地址。它們一般均可作為兩個8位的暫存器來使用。處理器內部有了這些暫存器之後,就可避免頻繁地訪問存儲器,可縮短指令長度和指令執行時間,提高機器的運行速度,也給編程帶來方便。專用暫存器包括程式計數器PC、堆疊指示器SP和標誌暫存器FR,它們的作用是固定的,用來存放地址或地址基值。其中:
A)程式計數器PC用來存放下一條要執行的指令地址,因而它控制著程式的執行順序。在順序執行指令的條件下,每取出指令的一個位元組,PC的內容自動加1。當程式發生轉移時,就必須把新的指令地址(目標地址)裝入PC,這通常由轉移指令來實現。
B)堆疊指示器SP用來存放棧頂地址。堆疊是存儲器中的一個特定區域
。它按“後進先出”方式工作,當新的數據壓入堆疊時,棧中原存信息不變,只改變棧頂位置,當數據從棧彈出時,彈出的是棧頂位置的數據,彈出後自動調正棧頂位置。也就是說,數據在進行壓棧、出棧操作時,總是在棧頂進行。堆疊一旦初始化(即確定了棧底在記憶體中的位置)後,SP的內容(即棧頂位置)使由CPU自動管理。
C)標誌暫存器也稱程式狀態字(PSW)暫存器,用來存放算術、邏輯運算指令執行後的結果特徵,如結果為0時,產生進位或溢出標誌等。
定時與控制邏輯是微處理器的核心控制部件,負責對整個計算機進行控制、包括從存儲器中取指令,分析指令(即指令解碼)確定指令操作和運算元地址,取運算元,執行指令規定的操作,送運算結果到存儲器或I/O連線埠等。它還向微機的其它各部件發出相應的控制信號,使CPU內、外各部件間協調工作。
內部匯流排用來連線微處理器的各功能部件並傳送微處理器內部的數據和控制信號。
必須指出,微處理器本身並不能單獨構成一個獨立的工作系統,也不能獨立地執行程式,必須配上存 儲器、輸入輸出設備構成一個完整的微型計算機後才能獨立工作。
存儲器
微型計算機的存儲器用來存放當前正在使用的或經常使用的程式和數據。存儲器按讀、寫方式分為隨機存儲器RAM(Random Access Memory)和唯讀存儲器ROM(Read only Memory)。RAM也稱為讀/寫存儲器,工作過程中CPU可根據需要隨時對其內容進行讀或寫操作。RAM是易失性存儲器,即其內容在斷電後會全部丟失,因而只能存放暫時性的程式和數據。ROM的內容只能讀出不能寫入,斷電後其所存信息仍保留不變,是非易失性存儲器。所以ROM常用來存放永久件的程式和數據。如初始導引程式、監控程式、作業系統中的基本輸入、輸出管理程式BIOS等。
I/O接口
輸入/輸出接口電路是微型計算機的重要組成部件。他是微型計算機連線外部輸入、輸出設備及各種控制對象並與外界進行信息交換的邏輯控制電路。由於外設的結構、工作速度、信號形式和數據格式等各不相同,因此它們不能直接掛接到系統匯流排上,必須用輸入/輸出接口電路來做中間轉換,才能實現與CPU間的信息交換。I/O接口也稱I/O適配器,不同的外設必須配備不同的I/O適配器。I/O接口電路是微機套用系統必不可少的重要組成部分。任何一個微機套用系統的研製和設計,實際上主要是I/O接口的研製和設計。因此I/O接口技術是本課程討論的重要內容之一,我們將在第八章中詳細介紹。
匯流排
匯流排是計算機系統中各部件之間傳送信息的公共通道,是微型計算機的重要組成部件。它由若干條通信線和起驅動,隔離作用的各種三態門器件組成。微型計算機在結構形式上總是採用匯流排結構,即構成微機的各功能部件(微處理器、存儲器、I/O接口電路等)之間通過匯流排相連線,這是微型計算機系統結構上的獨特之處。採用匯流排結構之後,使系統中各功能部件間的相互關係轉變為各部件面向匯流排的單一關係,一個部件(功能板/卡)只要符合匯流排標準,就可以連線到採用這種匯流排標準的系統中,從而使系統功能擴充或更新容易、結構簡單、可靠性大大提高。在微型計算機中,根據他們所處位置和套用場合,匯流排可被分為以下四級,如圖1.4所示。
(1)片內匯流排:它位於微處理器晶片內部,故稱為晶片內部匯流排。用於微處理器內部ALU和各種暫存器等部件間的互連及信息傳送(如圖1.3中的內部匯流排就是片內匯流排)。由於受晶片面積及對外引腳數的限制,片內匯流排大多採用單匯流排結構,這有利於晶片集成度和成品率的提高,如果要求加快內部數據傳送速度,也可採用雙匯流排或三匯流排結構。
(2)片匯流排:片匯流排又稱元件級(晶片級)匯流排或局部匯流排。微機主機板、單扳機以及其它一些外掛程式板、卡(如各種I/O接口板/卡),它們本身就是一個完整的子系統,板/卡上包含有CPU,RAM,ROM,I/O接口等各種晶片,這些晶片間也是通過匯流排來連線的,因為這有利於簡化結構,減少連線,提高可靠性,方便信息的傳送與控制。通常把各種板、卡上實現晶片間相互連線的匯流排稱為片匯流排或元件級匯流排。
相對於一台完整的微型計算機來說,各種板/卡只是一個子系統,是一個局部,故又把片匯流排稱為局部匯流排,而把用於連線微機各功能部件插卡的匯流排稱為系統匯流排。局部匯流排是一個重要的概念,我們將在第七章中討論。
(3)內匯流排:內匯流排又稱系統匯流排或板級匯流排。因為該匯流排是用來連線微機各功能部件而構成一個完整微機系統的,如圖1.2中所示,所以稱之為系統匯流排。系統匯流排是微機系統中最重要的匯流排,人們平常所說的微機匯流排就是指系統匯流排,如PC匯流排、AT匯流排(ISA匯流排)、PCI匯流排等。系統匯流排是我們要討論的重點內容之一。
系統匯流排上傳送的信息包括數據信息、地址信息、控制信息,因此,系統匯流排包含有三種不同功能的匯流排,即數據匯流排DB(Data Bus)、地址匯流排AB(Address Bus)和控制匯流排CB(Control Bus),如圖1.2中所示。
數據匯流排DB用於傳送數據信息。數據匯流排是雙向三態形式的匯流排,即他既可以把CPU的數據傳送到存儲器或I/O接口等其它部件,也可以將其它部件的數據傳送到CPU。數據匯流排的位數是微型計算機的一個重要指標,通常與微處理的字長相一致。例如Intel 8086微處理器字長16位,其數據匯流排寬度也是16位。需要指出的是,數據的含義是廣義的,它可以是真正的數據,也可以指令代碼或狀態信息,有時甚至是一個控制信息,因此,在實際工作中,數據匯流排上傳送的並不一定僅僅是真正意義上的數據。
地址匯流排AB是專門用來傳送地址的,由於地址只能從CPU傳向外部存儲器或I/O連線埠,所以地址匯流排總是單向三態的,這與數據匯流排不同。地址匯流排的位數決定了CPU可直接定址的記憶體空間大小,比如8位微機的地址匯流排為16位,則其最大可定址空間為2^16=64KB,16位微型機的地址匯流排為20位,其可定址空間為2^20=1MB。一般來說,若地址匯流排為n位,則可定址空間為2^n位元組。
控制匯流排CB用來傳送控制信號和時序信號。控制信號中,有的是微處理器送往存儲器和I/O接口電路的,如讀/寫信號,片選信號、中斷回響信號等;也有是其它部件反饋給CPU的,比如:中斷申請信號、復位信號、匯流排請求信號、限備就緒信號等。因此,控制匯流排的傳送方向由具體控制信號而定,一般是雙向的,控制匯流排的位數要根據系統的實際控制需要而定。實際上控制匯流排的具體情況主要取決於CPU。
(4)外匯流排:也稱通信匯流排。用於兩個系統之間的連線與通信,如兩台微機系統之間、微機系統與其他電子儀器或電子設備之間的通信。常用的通信匯流排有IEEE-488匯流排,VXI匯流排和RS-232串列匯流排等。外匯流排不是微機系統本身固有的,只有微型機套用系統中才有。
AMDCPU
K5
K5是AMD公司第一個獨立生產的x86級CPU,發布時間在1996年。由於K5在開發上遇到了問題,其上市時間比英特爾的Pentium晚了許多,再加上性能不好,這個不成功的產品一度使得AMD的市場份額大量喪失。K5的性能非常一般,整數運算能力不如Cyrix的6x86,但是仍比Pentium略強,浮點運算能力遠遠比不上Pentium,但稍強於Cyrix。綜合來看,K5屬於實力比較平均的那一種產品。K5低廉的價格顯然比其性能更能吸引消費者,低價是這款CPU最大的賣點。AMD 自然不甘心Pentium在CPU市場上呼風喚雨,因此它們在1997年又推出了K6。K6這款CPU的設計指標是相當高的,它擁有全新的MMX指令以及64KB L1 Cache(比奔騰MMX多了一倍),整體性能要優於奔騰MMX,接近同主頻PⅡ的水平。K6與K5相比,可以平行地處理更多的指令,並運行在更高的時鐘頻率上。AMD在整數運算方面做得非常成功,K6稍微落後的地方是在運行需要使用到MMX或浮點運算的應用程式方面,比起同樣頻率的Pentium 要差許多。
K6
K6擁有32KB數據L1 Cache,32KB指令L1 Cache,集成了880萬個電晶體,採用0.35微米技術,五層CMOS,C4工藝反裝晶片,核心面積168平方毫米(新產品為68平方毫米),使用Socket7架構。Cyrix 也算是一家老資格的CPU開發商了,早在x86時代,它和英特爾,AMD就形成了三雄並立的局面。
K6-2
AMD於1998年4月正式推出了K6-2微處理器。它採用0.25微米工藝製造,晶片面積減小到了68平方毫米,電晶體數目也增加到930萬個。另外,K6-2具有64KB L1 Cache,二級快取集成在主機板上,容量從512KB到2MB之間,速度與系統匯流排頻率同步,工作電壓為2.2V,支持Socket 7架構。
K6-2是一個K6晶片加上100MHz匯流排頻率和支持3D Now!浮點指令的“結合物”。3D Now!技術是對x86體系的重大突破,它大大加強了處理3D圖形和多媒體所需要的密集浮點運算性能。此外,K6-2支持超標量MMX技術,支持100MHz匯流排頻率,這意味著系統與L2快取和記憶體的傳輸率提高近50%,從而大大提高了整個系統的表現。作為Cyrix公司獨自研發的最後一款微處理器,Cyrix MⅡ是於1998年3月開始生產的。除了具有6x86本身的特性外,該微處理器還支持MMX指令,其核心電壓為2.9V,具有256位元組指令;3.5X倍頻;核心內集成650萬個電晶體,功耗20.6瓦;64KB一級快取。
K6-Ⅲ
AMD於1999年2月推出了代號為“Sharptooth”(利齒)的K6-Ⅲ,它是該公司最後一款支持Super 7架構和CPGA封裝形式的CPU,採用0.25微米製造工藝、核心面積是135平方毫米,集成了2130萬個電晶體,工作電壓為2.2V/2.4V。
Athlon(K7)
相對於K6-2而言,K6-Ⅲ最大的變化就是內部集成了256KB二級快取(新賽揚只有128KB),並以CPU的主頻速度運行。K6-Ⅲ的這一變化將能夠更大限度發揮高主頻的優勢。此外,該微處理器還帶有64KB一級快取(32KB用於指令,另32KB用於數據),而且在主機板上還集成了以系統匯流排頻率同步運行的三級快取,其容量大小從512KB到2MB之間。1999年6月23日,AMD公司推出了具有重大戰略意義的K7微處理器,並將其正式命名為Athlon。K7有兩種規格的產品:第一種採用0.25微米工藝製造,使用K7核心,工作電壓為1.6V(其快取以主頻速度的一半運行);第二種採用0.18微米工藝製造,使用K75核心;工作電壓有1.7V和1.8V兩種。上述兩種類型的K7微處理器內部都集成了2130萬個電晶體,外頻均為200MHz。
Athlon包含128KB的L1 Cache(PⅡ/PⅢ只有32KB);512KB~1MB L2 Cache的片外快取。同時,它還採用了全新的宏處理結構,擁有三個並行的x86指令解碼器,可以動態推測時序,亂序執行;K7擁有一個強勁的浮點處理單元,在3DNOW!指令的幫助下會有更進一步的3D和多媒體處理能力,這個先進的FPU使K7擁有超越其他x86微處理器2倍的性能!另外,K7採用了一種類似於Slot 1的全新的Slot A架構,從物理結構上兩者可以互換,但後者的電器性能和前者完全不兼容。在匯流排方面,使用的是Digital公司的Alpha系統匯流排協定EV6,外頻達200MHz;Athlon是AMD第一個具有SMP(對稱多微處理器技術)能力的桌面CPU,即使用者可以用Athlon構建雙微處理器甚至4微處理器系統!AMD公司在2000年6月份連續推出了新款的Thunderbird(雷鳥)、Duron(毒龍)微處理器,再次向英特爾Coppermine(銅礦)核心的微處理器發出了強有力的挑戰。
Thunderbird(雷鳥)
Thunderbird是AMD面向高端的Athlon系列延續產品,採用0.18微米的製造工藝,共有Slot A和Socket A兩種不同的架構,但它們在設計上大致相同:均內置128KB的一級快取和256KB的二級快取,其二級快取與CPU主頻速度同步運行;工作電壓為1.70V~1.75V,相應的功耗也比老的Athlon要小;集成3700萬個電晶體,核心面積達到120平方毫米。
另外,Thunderbird微處理器支持200MHz系統匯流排頻率,提供巨大的頻寬,且支持Alpha EV6匯流排協定,具有多重並行x86指令解碼器。
Duron(毒龍)
Duron微處理器是AMD首款基於Athlon核心改進的低端微處理器,它原來的研發代號稱為“Spitfire”。Duron外頻也是200MHz,內置128KB的一級快取和64KB的全速二級快取,它的工作電壓為1.5V,因而功耗要較Thunderbird小。而且它核心面積是100平方毫米,內部集成的電晶體數量為2500萬個,比K7核心的Athlon多300萬個。這些特點符合了AMD面對低端市場的策略,即低成本低功耗而又高性能。在浮點性能上,基於K7體系的Duron明顯優於採用P6核心設計的Intel系列微處理器,它具有三個全流水亂序執行單元,一個用於加/減運算,一個用於複合指令還有一個是浮點存儲單元。
其他微處理器發展
1975年,IBM公司生產了幾款基於RISC 設計的處理器。其中801就是RISC之父John Cocke的傑作。最終15年後設計出Power 架構系列產品,若干年後更出出現一個影響深遠的RISC結構的晶片系列ARM
這是八十年代後,RISC架構被工業界認可後發展起的一種,HP的HPPA-RISC
1975年,摩托羅拉推出 6800 ,該款處理器擁有78條指令集。摩托羅拉很多款單片裝處理器和微處理器的設計思想都來源於6800 ,即使曾經很流行功能強大的6809 也是繼承了6800 血統。1985年,摩托羅拉推出MC68010和已經命名為88000的32位RISC處理器系列。但1990年由於要全力研製PowerPC而被迫停產。
Z-80是由從Intel離走的Frederico Faggin設計的8位微處理器,被認為是8080的增強版,------是也是當年很牛的一款單片機,比後來風光無限的51系列更早進入中國,八十年代初學校都是以Z80為基礎教學,那種需要用電視作顯示器的單板電腦就是用的這種晶片。
不過最先推出的單晶片16位處理器當數TI TMS 9900。雖然出道後勢頭強勁,但TI為了發展DSP業務,不得不在1982年縮小9900的產量
半導體行業另一巨頭,美國國家半導體公司,就是後來收購了設計X86系列處理器的Cyrix公司的,這是1983年由國家半導體(National Semiconductor)推出NS32032,也是一款RISC處理器,但是可惜的是RISC架構的處理器在個人電腦套用中只有POWERPC晶片的市場還算比較成功,其它的都可以說很失敗,不過在另一領域:嵌入式套用中,RISC架構的處理器確是風光無限。
1981年,由史丹福大學和部分研究者研製出MIPS。處理器利用了深度流水線技術。它通過簡化指令的操作周期,解決了流水線的瓶頸-聯鎖問題,促成RISC思想的重要轉變。
1982年,由美國伯克利大學研製的RISC-I,只有32條指令,並且具有流水線操作和使用暫存器視窗,性能比同時代單晶片設計都優越
ARM是一家晶片設計公司,自己不生產晶片,而是通過授權生產來發展ARM系列處理器 。ARM公司在1990年11月英國劍橋的一個穀倉里成立,最初只有12人,經過11年多的發展,今日的ARM公司已經擁有700多名員工,其中60%以上都從事研發工作,ARM公司是一家既不生產晶片(fabless)也不銷售晶片(chipless)的公司,它通過出售晶片技術授權,建立起新型的微處理器設計、生產和銷售商業模式。更重要的是,這種商業模式取得極大的成功,採用ARM技術IP核的微處理器遍及各類電子產品:汽車、消費電子、成像、工業控制、海量存儲、網路、安保和無線等市場,ARM技術幾乎無處不在。ARM將其技術授權給世界上許多著名的半導體、軟體和OEM廠商,每個廠商得到的都是一套獨一無二的ARM相關技術及服務。利用這種合夥關係,ARM很快成為許多全球性RISC標準的締造者。總共有30家半導體公司與ARM簽訂了硬體技術使用許可協定,其中包括Intel、IBM、LG半導體、NEC、SONY、菲利浦和國民半導體這樣的大公司。至於軟體系統的合伙人,則包括微軟、昇陽和MRI等一系列知名公司。
其他資料
中國微處理器簡介
2004年2月18日,由清華大學自主研發的32位微處理器THUMP晶片終於領到了由國家教育部頒發的“身份證”:典型工作頻率400MHz,功耗1.17mW/MHz,晶片顆粒40片,最高工作頻率可達500MHz,是目前國內工作頻率最高的微處理器。 “這標誌著我國在自主研發CPU晶片領域邁開了實質性的一大步。”教育部對THUMP的誕生給予了較高評價。
在龍芯1號、龍芯2號的基礎上,中國正在自主研發新一代的龍芯3號。
龍芯3A的工作頻率為900MHz~1GHz,功耗約15W,頻率為1GHz時雙精度浮點運算速度峰值達到每秒160億次,單精度浮點運算速度峰值每秒320億次。龍芯3A採用意法半導體公司(STMicro)65納米CMOS工藝生產,電晶體數目達4.25億個,晶片採用BGA封裝,引腳的數目為1121個,功耗小於15瓦。 龍芯3A集成了四個64位超標量處理器核、4MB的二級Cache、兩個DDR2/3記憶體控制器、兩個高性能HyperTransport控制器、一個PCI/PCIX控制器以及LPC、SPI、UART、GPIO等低速I/O控制器。龍芯3A的指令系統與MIPS64兼容並通過指令擴展支持X86二進制翻譯。 龍芯3號在包括伺服器、高性能計算機、低能耗數據中心、個人高性能計算機、高端桌面套用、高吞吐計算套用、工業控制、數位訊號處理、高端嵌入式套用等產品中具有廣闊的市場套用前景。
工作原理
可用電晶體的數量對處理器性能有巨大影響。如上所述,在8088這樣的處理器中,通常要花費15個時鐘周期才能執行一條指令。由於乘法器的設計方式,在 8088上進行16位的乘法運算大約需要80個時鐘周期。而電晶體越多,就越有可能在一個周期中執行更多的乘法運算。
電晶體數量的增多還使我們能夠使用一種稱為流水線的技術。在流水線式的體系結構中,指令的執行過程是相互重疊的。所以,雖然需要花費5個時鐘周期來執行每條指令,但是可以同時執行5條指令的各個階段。這樣,表面看起來在每個時鐘周期內即可執行完一條指令。
許多現代的處理器具有多個指令解碼器,每一個都有自己的流水線。這樣便存在多個指令流,也就是說每個時鐘周期可以完成多條指令。但是這種技術實現起來非常複雜,因此需要使用大量的電晶體。
發展趨勢
處理器設計的發展趨勢主要是:完全32位的ALU(內置快速浮點處理器)和多指令流的流水線式執行方式。處理器設計的最新進展是64位ALU,預計在下一個十年中家用PC就會用上這種處理器。此外,還存在為處理器添加可高效執行某些操作的特殊指令(例如MMX指令)的趨勢,以及在處理器晶片中增加硬體虛擬記憶體支持和L1快取的趨勢。所有這些趨勢都進一步增加了電晶體的數量,導致現在的處理器包含數千萬個電晶體。而這些處理器每秒大約可以執行十億條指令。
十大最具顛覆性科技
美國生活科學網站評出世界上十大最具顛覆性的科學技術,其中網際網路和飛機的發明分別位列第一和第二位。 |