精簡指令集的運用
在最初發明計算機的數十年里,隨著計算機功能日趨增大,性能日趨變強,內部元器件也越來越多,指令集日趨複雜,過於冗雜的指令嚴重的影響了計算機的工作效率。後來經過研究發現,在計算機中,80%程式只用到了20%的指令集,基於這一發現,RISC精簡指令集被提了出來,這是計算機系統架構的一次深刻革命。RISC體系結構的基本思路是:抓住CISC指令系統指令種類太多、指令格式不規範、定址方式太多的缺點,通過減少指令種類、規範指令格式和簡化定址方式,方便處理器內部的並行處理,提高VLSI器件的使用效率,從而大幅度地提高處理器的性能。RISC指令集有許多特徵,其中最重要的有:指令種類少,指令格式規範:
RISC指令集通常只使用一種或少數幾種格式。指令長度單一(一般4個位元組),並且在字邊界上對齊,欄位位置、特別是操作碼的位置是固定的。
定址方式簡化:
幾乎所有指令都使用暫存器定址方式,定址方式總數一般不超過5個。其他更為複雜的定址方式,如間接定址等則由軟體利用簡單的定址方式來合成。
大量利用暫存器間操作:
RISC指令集中大多數操作都是暫存器到暫存器操作,只以簡單的Load和Store操作訪問記憶體。因此,每條指令中訪問的記憶體地址不會超過1個,訪問記憶體的操作不會與算術操作混在一起。
簡化處理器結構:
使用RISC指令集,可以大大簡化處理器的控制器和其他功能單元的設計,不必使用大量專用暫存器,特別是允許以硬體線路來實現指令操作,而不必像CISC處理器那樣使用微程式來實現指令操作。因此RISC處理器不必像CISC處理器那樣設定微程式控制存儲器,就能夠快速地直接執行指令。
便於使用VLSI技術:
隨著LSI和VLSI技術的發展,整個處理器(甚至多個處理器)都可以放在一個晶片上。RISC體系結構可以給設計單晶片處理器帶來很多好處,有利於提高性能,簡化VLSI晶片的設計和實現。基於VLSI技術,製造RISC處理器要比CISC處理器工作量小得多,成本也低得多。
加強了處理器並行能力:
RISC指令集能夠非常有效地適合於採用流水線、超流水線和超標量技術,從而實現指令級並行操作,提高處理器的性能。目前常用的處理器內部並行操作技術基本上是基於RISC體系結構發展和走向成熟的。
正由於RISC體系所具有的優勢,它在高端系統得到了廣泛的套用,而CISC體系則在桌面系統中占據統治地位。而在如今,在桌面領域,RISC也不斷滲透,預計未來,RISC將要一統江湖。
CPU的擴展指令集
對於CPU來說,在基本功能方面,它們的差別並不太大,基本的指令集也都差不多,但是許多廠家為了提升某一方面性能,又開發了擴展指令集,擴展指令集定義了新的數據和指令,能夠大大提高某方面數據處理能力,但必需要有軟體支持。MMX 指令集
MMX(Multi Media eXtension,多媒體擴展指令集)指令集是Intel公司於1996年推出的一項多媒體指令增強技術。MMX指令集中包括有57條多媒體指令,通過這些指令可以一次處理多個數據,在處理結果超過實際處理能力的時候也能進行正常處理,這樣在軟體的配合下,就可以得到更高的性能。MMX的益處在於,當時存在的作業系統不必為此而做出任何修改便可以輕鬆地執行MMX程式。但是,問題也比較明顯,那就是MMX指令集與x87
浮點運算指令不能夠同時執行,必須做密集式的交錯切換才可以正常執行,這種情況就勢必造成整個系統運行質量的下降。SSE指令集
SSE(Streaming SIMD Extensions,單指令多數據流擴展)指令集是Intel在Pentium III處理器中率先推出的。其實,早在PIII正式推出之前,Intel公司就曾經通過各種渠道公布過所謂的KNI(Katmai New Instruction)指令集,這個指令集也就是SSE指令集的前身,並一度被很多傳媒稱之為MMX指令集的下一個版本,即MMX2指令集。究其背景,原來"KNI"指令集是Intel公司最早為其下一代晶片命名的指令集名稱,而所謂的"MMX2"則完全是硬體評論家們和媒體憑感覺和印象對"KNI"的 評價,Intel公司從未正式發布過關於MMX2的訊息。
而最終推出的SSE指令集也就是所謂勝出的"網際網路SSE"指令集。SSE指令集包括了70條指令,其中包含提高3D圖形運算效率的50條SIMD(單指令多數據技術)浮點運算指令、12條MMX 整數運算增強指令、8條最佳化記憶體中連續數據塊傳輸指令。理論上這些指令對目前流行的圖像處理、浮點運算、3D運算、視頻處理、音頻處理等諸多多媒體套用起到全面強化的作用。SSE指令與3DNow!指令彼此互不兼容,但SSE包含了3DNow!技術的絕大部分功能,只是實現的方法不同。SSE兼容MMX指令,它可以通過SIMD和單時鐘周期並行處理多
個浮點數據來有效地提高浮點運算速度。SSE2指令集
SSE2(Streaming SIMD Extensions 2,Intel官方稱為SIMD 流技術擴展 2或數據流單指令多數據擴展指令集 2)指令集是Intel公司在SSE指令集的基礎上發展起來的。相比於SSE,SSE2使用了144個新增指令,擴展了MMX技術和SSE技術,這些指令提高了廣大應用程式的運行性能。隨MMX技術引進的SIMD整數指令從64位擴展到了128 位,使SIMD整數類型操作的有效執行率成倍提高。雙倍精度浮點SIMD指令允許以 SIMD格式同時執行兩個浮點操作,提供雙倍精度操作支持有助於加速內容創建、財務、工程和科學套用。除SSE2指令之外,最初的SSE指令也得到增強,通過支持多種數據類型(例如,雙字和四字)的算術運算,支持靈活並且動態範圍更廣的計算功能。SSE2指令可讓軟體開發員極其靈活的實施算法,並在運行諸如MPEG-2
、MP3、3D圖形等之類的軟體時增強性能。Intel是從Willamette核心的Pentium 4開始支持SSE2指令集的,而AMD則是從K8架構的SledgeHammer核心的Opteron開始才支持SSE2指令集的。SSE3指令集
SSE3(Streaming SIMD Extensions 3,Intel官方稱為SIMD 流技術擴展 3或數據流單指令多數據擴展指令集 3)指令集是Intel公司在SSE2指令集的基礎上發展起來的。相比於SSE2,SSE3在SSE2的基礎上又增加了13個額外的SIMD指令。SSE3 中13個新指令的主要目的是改進執行緒同步和特定應用程式領域,例如媒體和遊戲。這些新增指令強化了處理器在浮點轉換至整數、複雜算法、視頻編碼、SIMD浮點暫存器操作以及執行緒同步等五個方面的表現,最終達到提升多媒體和遊戲性能的目的。Intel是從Prescott核心的Pentium 4開始支持SSE3指令集的,而AMD則是從2005年下半年Troy核心的Opteron開始才支持SSE3的。但是需要注意的是,AMD所支持的SSE3與Intel的SSE3並不完全相同,主要是刪除了針對Intel超執行緒技術最佳化的部分指令。
3D Now!指令集
3DNow!是AMD公司開發的SIMD指令集,可以增強浮點
和多媒體運算的速度,並被AMD廣泛套用於其K6-2 、K6-3以及Athlon(K7)處理器上。3DNow!指令集技術其實就是21條機器碼的擴展指令集。與Intel公司的MMX技術側重於整數運算有所不同,3DNow!指令集主要針對三維建模、坐標變換 和效果渲染等三維套用場合,在軟體的配合下,可以大幅度提高3D處理性能。後來在Athlon上開發了Enhanced 3DNow!。這些AMD標準的SIMD指令和Intel的SSE具有相同效能。因為受到Intel在商業上以及Pentium III成功的影響,軟體在支持SSE上比起3DNow!更為普遍。Enhanced 3DNow!AMD公司繼續增加至52個指令,包含了一些SSE碼,因而在針對SSE做最佳化的軟體中能獲得更好的效能。
SSE4多媒體指令集
Intel公司真正嚴格意義
上的第五代多媒體指令集 -- Streaming SIMD Extension 4(SSE4)被視為是繼2001年的SSE2之後最為重要的多媒體指令集改進。除擴展Intel 64位指令外,還新增對於影像編輯、視訊編碼、三維渲染以及遊戲套用等方面的指令,使得處理器的效能受益性更為廣泛。將分為SSE4.1以及SSE4.2兩個版本,其中SSE4.1版本將首度於45納米Penryn家族處理器中出現,共增加了47條新的指令。全新的SSE4多媒體指令集將增加兩組不同的32-bit向量整數乘法運算單元,並引入八位無符號最大值/最小值運算支持,以及16-bit/32-bit有符號和無符號運算支持,從而有效改善編譯器執行效率並提升向量整數以及單精度代碼的運算能力。與此同時,SSE4多媒體指令集進一步改善插入、提取、尋找、離散、跨步負載以及存儲等動作模式,使得向量運算趨於專門化。第五代SSE4多媒體指令集新增六條浮點點積運算指令,支持單精度、雙精度浮點運算以及浮點生成操作,這對於3D遊戲以及三維內容生成將產生積極影響。
計算機術語
21世紀是網路和信息化的世紀,電腦的發展改變著人們的生活。通過了解計算機術語,能更清楚的認識計算機,更好的運用計算機。 |