NVIDIA TEGRA 3

NVIDIA Tegra 3(代號:Project Kal-El),是NVIDIA在2011MWC上展示的全世界第一款移動四核處理器(4個Cortex-A9核心)。NVIDIA Tegra 3集成12個執行單元的GeForce GPU圖形核心,支持3D立體,並支持2048x1536的超高清解析度,CPU處理能力比上代Tegra 2提升了兩倍,而GPU圖形性能方面,圖睿2理論性能是圖睿3四分之三。基於40納米工藝,功耗與Tegra 2相比略有降低。Tegra 3改為採用四核心A9,並將頻率提升到1.5GHz,圖形處理器流處理器規模擴大一半,性能提升三倍,並且補齊Tegra 2不支持Neon的短板,支持256bit的Neon指令集,有回放High Profile的1080P視頻的能力。使得其性能相對競爭對手現有產品全面占優。

簡介

當然Tegra 3可怕的不僅僅是性能,NVIDIA還在Tegra 2/3中使用了x86領域常見的小核心策略,Tegra 3雖然集成四核心和更為強大的GPU單元,但其晶片面積僅79mm2,遠遠小於現在Apple A5 雙核的110mm2,更小的核心對於移動平台而言,意味著的不僅僅只是更低的成本和更高的產能,並且往往還意味著更好的功耗控制。在移動平台進行產品設計不能像在x86領域單純的堆砌核心數和流處理器數,而需要更為仔細的精打細算,這時NVIDIA強大的設計能力帶來的更佳的性能/核心面積比就顯得十分重要了。

NVIDIA TEGRA 3 NVIDIA TEGRA 3

而競爭對手德州儀器和三星,在2012年底A15架構之前則沒有全新產品,而是僅僅提升現有產品的頻率,NVIDIA的快速產品更新策略和小核心策略則可以使得其可以占有更多戰略上的主動權。

技術套用

vSMP架構

結構示意圖 結構示意圖

NVIDIA Tegra3的研發代號為Kal-EL,所以下面大量圖表會以這個名字出現。在第一代Tegra中,我們就知道NVIDIA使用了一顆ARM7處理器作為低負載核心搭配Cortex-a8核心進行工作,而在包括待機、音樂播放等低負載工作中,各家處理器也有不同的方式。而Tegra3的vSMP讓這個設計思路更進一步,“協核心”的出現是Tegra3的精髓所在。為了更好的控制能效,協核心同樣採用Cortex-A9架構,但工藝設計上專門為低功耗低主頻最佳化,它最高工作頻率500MHz。而其他四個主核心架構與協核心一致,這四個核心單核心工作最高主頻為1.4GHz、多核心工作時主頻最高為1.3GHz。協核心與一個或多個主核心不能同時工作,處理器通過高效的管理辦法可完成多核心間高速切換,官方給出數據是切換時間小於2毫秒。這么設計達到的目標是,在低負荷時只有協核心最高500MHz主頻工作,能效比會明顯高於主核心工作狀態下的數值。如果需要更高的性能,此時四個主核心才會按需進行切換工作。

為了保證Tegra3的高效率以及一個或多個主核心工作狀態與協核心工作狀態間無縫切換,在快取、Android系統最佳化方面Tegra3也有特別之處。正如上文所說,低功耗的協核心與一個或多個主核心是不可以共同工作的。在一般使用時,例如打開視頻或打開遊戲時,Tegra3一定會切換到主核心工作狀態,此時協核心是完全停止工作的。但要實現無縫銜接切換,在快取設計上,主核心和協核心共享1MB的二級快取,快取間返回數據速度在納秒級別。

在Android系統下,雖然系統可以允許多個核心在不同頻率下運行,但系統假設每個核心的運算能力是完全一致的,它會依次來分配計畫任務,而此時顯然多核心工作是不夠高效的。而NVIDIA表示,vSMP將一直保持被激活的核心工作在同步系統頻率上,以此方式為Android系統最佳化,從而達到更高的效率,NVIDIA還專門有關於負載平衡功能的視頻演示,大家可以在國內視頻網站搜尋Tegra3關鍵字看到相關視頻。

性能與功耗

NVIDIA官方還展示了多套數據來說明Tegra3在功耗和性能方面的優勢,兩個處理器同樣是來自台積電TSMC的40nm工藝製造。我們看到多個項目中,Tegra3功耗優勢明顯。

對比的處理器包括Tegra3四核心工作在480MHz、TI的OMAP4系列處理器工作在1GHz、QC8660即Snapdragon MSM8660/8260工作在1.2GHz以及Tegra3工作於1GHz時的功耗和性能。我們看到,Tegra3四核心工作於較低頻率時性能與目前TI和高通主流雙核處理器相當,但功耗卻只有它們的35%左右。而Tegra3的四核心工作於1GHz時,功耗仍要比TI OMAP4和MSM8660/8260低20%左右,性能卻領先一倍。隨後的多張圖表,NVIDIA是想向大家表明很簡單的道理。達到目前主流性能,Tegra3隻需要付出一半的功耗,而如果需要更高的性能,Tegra3可以提升近一倍,而功耗卻比現在雙核心主流產品低20%。

遊戲運行幀數對比 遊戲運行幀數對比

由於NVIDIA詳細的功耗對比主要以這一款Benchmark軟體為主,而且並沒有告知該軟體的測試方法、測試項目,但如果不出意外,它仍具有很高的參考性,Tegra3即便不考慮協核心的存在,它在多核心的最佳化上也明顯優於目前的主流雙核心ARM處理器。當然,這個測試中可能不包括3D圖形單元部分的運算。

此次Tegra3的發布在圖形性能方面同樣有不少的相關展示,但對GeForce部分的加強則不是重點,在Tegra2處理器中8個核心單元(4個Vertex Shader和4個Pixel Shader)被增加至12個,在功能上圖形輸出支持HDMI 1.4a規範,支持3D視頻播放和輸出,支持通過Tegra3 2D轉3D功能。同時,NVIDIA官方資料更多描述表示,目前的移動平台3D引擎可以很好的支持多核心處理器的工作,因此Tegra3的多核心會有相應的表現。從展示內容來看,我們看到更好的實時光影效果、動態模糊效果、以及物理引擎運算效果。但這些效果應該並不只是GeForce或者Tegra3獨有。

其他相關技術

在其他周邊技術方面,Tegra3也有很多項提升。它可支持3200萬像素的主攝像頭,全新的300M像素/秒的圖形處理單元。Tegra3還將支持DDR3-1500\LPDDR2-1066規範的記憶體接口,同時支持SATAII規範的存儲接口。它支持7.1聲道的音頻輸出。

設備

主要設備

手機產品平板電腦產品
LG P880Optimus 4X HD微軟Surface RT
HTC One XS720e谷歌Nexus 7
deovo V5(360特供機)華碩TF300T
天語v9(大黃蜂2勇氣版)華碩TF600T
HTC S720t(One XT)華碩TF300TG
LG P895(Optimus Vu/國際版)華碩TF700T
摩托羅拉 XT882華碩TF300T
中興Grand Memo華碩TF300T(旗艦版)
 聯想A2109
中興 U985華碩TFPad300
酷派 9070+XO索尼SGPT121CN/S
北斗小辣椒四核Q1華碩TF600TG
 優派N1010
富士通F12Arc索尼V150
HTC S728e(One X+)HTCQVertex
摩托羅拉XT992 東芝AT570
HTC EliteLG Optimus Pad2
摩托羅拉 Bullet優派N710(16G)
天語 V5(大黃蜂Touch)中興T98
中興 u950 (北斗小旋風)富士通M532
 華碩EeePad MeMO 307T
 Acer A510
  H700A

相關詞條

熱門詞條

聯絡我們