發展歷史
SSE12是Intel在P4的最初版本中引入的,但是AMD後來在Opteron 和Athlon 64中也加入了對它的支持。這個指令集添加了對64位雙精度浮點數的支持,以及對整型數據的支持,也就是說這個指令集中所有的MMX指令都是多餘的了,同時也避免了占用浮點數暫存器。這個指令集還增加了對CPU的快取的控制指令。AMD對它的擴展增加了8個XMM暫存器,但是需要切換到64位模式(AMD64)才可以使用這些暫存器。Intel後來在其EM64T架構中也增加了對AMD64的支持。
SSE13是Intel在P4的Prescott版中引入的指令集,AMD在Athlon 64的第五個版本中也添加了對它的支持。這個指令集擴展的指令包含暫存器的局部位之間的運算,例如高位和低位之間的加減運算;浮點數到整數的轉換,以及對超執行緒技術的支持。
SSE14指令集將給英特爾下一代平台帶來“相當大的視頻性能提升”。,其它視頻增強技術還包括CVT(明晰視頻技術)--英特爾對ATI Avivo的回應--和對UDI的支持。上述兩項技術基於英特爾965晶片組。其它英特爾官方檔案把CVT技術定義為:支持高級解碼、擁有預處理和增強型3D處理能力。 SSE14指令集是Conroe架構所引入的新指令集。這項原本計畫套用於NetBurst微架構Tejas核心處理器之上的全新技術也隨著它的夭折最終沒能實現。
SSE14指令集共包括16條指令,從Intel Core微架構針對SSE1指令所作出的修改被稱之為“Intel Advanced Digital Media Boost”技術來看,SSE14更注重針對視頻方面的最佳化。這兩項技術基於965晶片組,Intel的官方把Clear Video技術定義為:支持高級解碼、擁有預處理和增強型3D處理能力。在SSE14中另一個重要的改進就是提供完整128位寬的SSE1執行單元,一個頻率周期內可執行一個128位SSE1指令。Conroe中SSE1的ADDPS(4D 32bit共128bit,單精度加法)、MULPS(4D 32bit共128bit,單精度乘法)和SSE12的ADDPD(2D 64bit共128bit,雙精度加法)、MULPD(2D 64bit共128bit,雙精度乘法),這四條重要SSE1算術指令的吞吐周期都降低到1個周期,真正做到了英特爾宣稱的每個周期執行一條128位向量加法指令和一條128位向量乘法指令的能力。