簡介
PCX1採用了TBR技術,這是PowerVR系列晶片的技術中的一大重要特點,全稱Tile Based Deferred Rendering。雖然Videologic不是第一個採用這種渲染方式的公司,但卻是將這種渲染方式成功套用於實際的市場產品上的公司。
第一代
早期缺點
眾所周知傳統早期3D顯示晶片處理過程是先進行幾何運算,然後讀取、生成紋理等操作,然後通過深度測試決定像素是否可見,之後將可見像素進行必要的處理後輸出到Framebuffer(幀快取)顯存上,之後由RAMDAC讀取顯存經過數模轉換輸出到顯示器上。這個過程中有一大缺點就是無論像素是否可見,都必須經過渲染,這將浪費大量填充率和頻寬,這被稱為overdraw。
解決方法
為了解決這一矛盾,PowerVR的TBR在幾何運算後,將螢幕的像素分成了很多矩形小塊,先經過每個小塊的深度測試,測試小塊是否可見決定小塊中的像素是否應當被渲染,之後將需要被渲染的再交給渲染管線去處理,之後輸出。這樣一來,不可見的像素已經提前被剔去不用被渲染,很大程度上節省了頻寬,減少了渲染管線的壓力。
然而這一技術並非完美無缺,在經過小塊的深度測試的過程中需要一定時間,尤其對於比較多的碎小密集的多邊形的時候這更為明顯,在PCX1/2當中這一過程需要CPU的處理,因此加重了對CPU能力的需求,PCX至少需求MMX 166才能發揮功效。此外一些涉及到Z-buffer技術的程式在TBR的模式下往往運行有問題。是延續傳統渲染模式,加大頻寬和填充率來彌補這一問題,或是採用TBR技術,二者孰優孰劣這對並無絕對定論。nVidia一直沿用傳統模式,晶片設計以更多的渲染管線、更高的頻率、更高規格的顯存來解決問題。後來ATI也拿出了自己的解決辦法---Hyper-Z。
PCX2
PCX2的性能比PCX1有了一定提升,速度並不慢,可以在運行轉為它們最佳化的Quake2的時候效果很好,硬體指標上也勝過Voodoo,達到每秒120萬多邊形和6000萬像素的填充速度,在同時代產品中首屈一指。同時支持D3D、OpengGL,SGL,其中SGL是OpenGL的部分子集特為PowerVR進行了專有擴展。但是在實際使用中,由於驅動使兼容性較差,許多遊戲運行有問題,並且對CPU要求較高(甚至不如更低平台上voodoo的速度),導致銷售收了很大影響,但在Voodoo2之前的一段時間裡市場占有率卻達到第二。
PCX1晶片的產品中比較常見的是Apocalypse 3D和NEC PC 3DEngine,PCX2中比較有名的是Matrox在看到PCX2的優勢後而決定生產的唯一沒採用自己晶片的加速卡產品M3D。
ARC-1
後來在1998年的3月的CeBit展覽Videologic拿出了ARC-1,但只是beta版,依然PCI接口,頻率66Mhz,依然僅有3D功能,貌似基於PCX2,據說創新和帝盟有意去生產此晶片的零售版顯示卡。但是似乎後來沒了音訊。
第二代
PVR250DC
此後Videologic與Sega合作,為Sega的新遊戲機設計圖形晶片,實際就是PowerVR二代,所對應的DC版核心是PVR250DC,桌面版產品叫做Neon250,採用它的Dreamcast於1998年2月推出。但是因此極大地導致了Neon250的PC桌面產品的延期,比預期Neon250發布時間晚了一年有餘,比DC推出時間則晚了一年半。這是因為NEC更看重長期的訂單量大、市場穩固的遊戲機圖形晶片的製造,遊戲機一般3-5年更新換代一次,而風雲多變的PC市場平均6個月為一周期,從長遠利益考慮,顯然NEC更願意為了上百萬訂單的遊戲機市場投入更多精力。這款晶片同時也有對應於Sega的街機NAOMI(New Arcade Operation Machine Idea)的版本,相應的圖形核心名為CLX2,搭載16MB顯存,250萬多邊形每秒,5億像素每秒,這款街機板於1998年問世。而2000年問世的NAOMI2則搭配兩顆CLX2,搭配VideoLogic的ELEN晶片做為幾何變換和光影效果加速器,搭載32MB顯存,畫面效果相當不錯。
Neon250
1998年12月2日的COMDEX剛結束,NEC和Videologic宣布聯合推出Neon250,開始提供樣片,大家對這款產品十分有信心,對外公布多邊形處理速度500萬每秒,像素渲染速度2-5億每秒。雖然比DC版性能有所下降,但是其公布的資料在當時來說性能仍然是很有競爭力的。NEC產品銷售經理Charles Bellfield說“PowerVR 250令人難忘的性能表現超出了我們的預期”,同時還表達了Neon250的戰略意義“PowerVR 250標誌著NEC/VideoLogic針對遊戲市場的跨平台戰略終於初具規模了,該戰略將使家用遊戲機、個人電腦和街頭遊戲機上的遊戲軟體具有前所未有的可移植性,因而能夠通過大量銷售的硬體和軟體極大的降低硬體系統成本和遊戲軟體價格”。一切看起來很美好,無論是性能還是戰略前景。
然而此後Neon250卻遲遲沒有真正上市,直到1999年秋季Neon250才終於上市,晶片仍然由NEC製造,也稱PVR250,有AGP-2X和PCI接口兩種,而AGP版比PCI的速度僅快很少一點。核心和顯存都是125Mhz,採用SDRAM,64bit,32MB顯存,渲染管線仍然是1條,每條管線單紋理單元。擁有250Mhz RAMDAC,支持OpenGL、SGL、DirectX6。僅由Videologic製造過此晶片的顯示卡。支持FSAA,不支持mipmap dithering,使用三線性過濾的時候不能像voodoo3/TNT2那樣通過mipmap dithering那樣來實現相同效果,所以只能用真正的三線性過濾很影響速度。因為發售時間極大地延遲,3dfx和nvidia的第四代產品已經上市了,加上它頻率低,所以其性能在當時來說比較慢,介於TNT-TNT2的程度,價格也不便宜,所以銷量很差,在歐洲市場相對於其它地方情況還算好一點,目前存世量頗小。雖然這款產品情況銷售十分糟糕,但是採用這款晶片的DC遊戲機的情況卻挺不錯。
值得一提的是從Neon250開始TBR渲染模式前期的深度測試功能不再需要CPU處理,而是集成於顯示晶片內部,分擔了CPU的負擔,以後PowerVR的顯示晶片設計亦是如此。
第三代
VideoLogic後來變為聲、顯示卡製造,從VideoLogic分出來的Imagination Technologies成為VideoLogic、PowerVR、Ensigma、Metagence這四者的母公司,其中Ensigma、Metagence是面向DSP設計。
Kyro
Imagination Technologies將PowerVR技術授權給了STMicroelectronics(意法半導體),稱為PowerVR三代的Kyro誕生,由PowerVR設計ST最終成型並且製造,此系列驅動一直由PowerVR開發。ST有自己的晶片生產廠,曾經nVidia的NV1、Riva128/ZX的晶片有很大部分就是由ST生產的。ST產的NV1叫做STG2000用於Diamond Edge 2120/2200,市場上很多riva128/ZX產品晶片上都有ST的Logo。
Kyro採用0.25微米工藝,核心代號STG 4000X,0.12億電晶體,有PCI和AGP-4X版本,工程版核心、顯存皆115Mhz,最終出貨版提升到125Mhz核心,128bit 32/64MBSDRAM顯存,270Mhz RAMDAC,2*1管線架構即雙管線單紋理單元。支持DX6、EMBM(環境凹凸貼圖),不支持T&L,繼續採用TBR模式。
Kyro的核心尺寸很小,同時發熱量也小,電晶體數量也明顯低於同期nVidia的產品,其目的在於降低生產成本,使晶圓能切割出更多的晶片,以性價比優勢來和其它產品競爭。其性能基本介於TNT2 Ultra與GF256 SDR版之間,一大特點就是32bit色相對於16bit色性能下降很小,在32bit色下甚至可勝於GF256 SDR。由於Kyro採用了塊狀渲染架構,所以進行高解析度渲染之後輸出到低解析度這樣方式的全螢幕抗鋸齒時可以避免大量高解析度下不必要的像素渲染,所以打開全螢幕抗鋸齒時速度降低也比較小。產品基本還算成功,採用其晶片的有Inno3D KYRO 2000,VideoLogic Vivid!, 撼迅Evil Kyro,Hercules 3D Prophet 4000。不過驅動仍然不算很完善,有時會出現不兼容、當機的情況。
Kyro2
僅僅過了幾個月,Kyro2推出,核心代號STG 4500,0.18微米,0.15億電晶體,核心、顯存頻率提升至175Mhz,仍然不支持T&L,依然是2*1管線,270Mhz RAMDAC,支持部分DX7功能,TBR模式。其內部接口為AGP-2X,但可通過硬改顯示卡刷新BIOS支持AGP-4X模式。採用它的晶片的有Hercules 3D Prophet 4500、VideoLogic Vivid!XS。由於ST沒有0.18微米生產能力,所以晶片的生產交由TSMC(台積電)。
Kyro2在16bit色性能介於MX和GTS,32bit性能相對於16bit色依然下降很小,此時往往比GTS還好。整體來說比KYRO平均提升1/3以上,尤其在高解析度在某些項目甚至提升可達將近1/2。在當時號稱MX400殺手,在歐洲市場較受歡迎,甚至據說比MX400銷售量還好一點,尤其Prophet 4500銷量頗大。此卡還支持渲染通道內最大8層紋理,對於多層貼圖的遊戲中比較占優勢,比如SeriousSam部分場景採用多達5層貼圖。雖然和TNT2、Voodoo3一樣都是只有兩條紋理管線,每個周期只能處理兩個層紋理,但是面對多紋理時,TNT2、Voodoo3這樣傳統架構需要擁有至少同等數量的管線才能在一個周期內處理完這樣的多層紋理,若層數超過管線數量則只能占用更多周期處理完紋理之後再進行硬體混合,將會降低運行效率。而如果依靠增加紋理管線則會使晶片過於複雜。而對於Kyro2,會把紋理分成多進程處理,將已處理過的存入緩衝區中,然後再累加進行下一個紋理合成處理,這樣就減少了以往多個管線合成所占用的資源,對於提高性能和降低頻寬利用都是有好處的。只是在早期驅動只開放了4層,而發售時的驅動已經比較完善了,驅動控制臺功能豐富,甚至包括超頻選項,運行比較穩定,而且大多數不兼容的現象都可以通過驅動程式裡面的選項設定進行解決。
Kyro2存在的問題在於渲染管線明顯太少,2*1管線相對於當時GF2的4*2管線來說填充率嚴重受到限制,並且SDR顯存提供的顯存頻寬相對於已普遍使用的DDR在一定程度上限制了性能的發揮。
KyroII
隨後KyroII SE發布,核心代號STG 4800,相對於Kyro2變化的只有核心、顯存頻率提高到200Mhz,接口完整支持AGP-4X,其它部分保持不變。採用它的顯示卡有Hercules 3D Prophet 4800、VideoLogic Vivid!XS Elite。
第四代
此後PowerVR的第四代KyroIII開始研發,代號STG5000,但是一直沒有結果。
第五代
PowerVR此後轉向掌上圖形市場並且取得很大成功,它們的顯示晶片PowerVR MBX授權給了Intel,0.13微米工藝誕生出來的就是眾所周知的2700G,代號Marathon,和PXA27x系列處理其搭配用於PPC,比如DELL X50/51v,其中2700G3/G5分別集成384/704KB顯存,可以在640*480下流暢運行Quake3。擁有83萬/秒多邊形及像素填充能力,支持全螢幕抗鋸齒和硬體T&L,擁有MPEG1/2/4解碼運算能力,功耗僅1mW左右,性能已經接近99年的台式機圖形晶片。
它們的新一代掌上圖形晶片PowerVR SGX510/520/530屬於第五代PowerVR產品,採用統一架構,SM3.0,OpenGL 2.0,依然採用TBR渲染模式,支持H264解碼,目前已經授權給NEC和Intel,作為Intel產品計畫命名為2900G。
公司評價
總體來說PowerVR是一家技術型公司,在當年顯示晶片紛爭的時候,曾有過多達150家以上公司研發顯示晶片市場,然而如今卻所剩寥寥無幾,顯示晶片更新周期短競爭激烈,不僅需要強大的研發能力,而且需要很好的市場運作。PowerVR規模和實力無法與nVIDIA、ATI相比,之所以能一直生存下來的原因是及時轉向適合自己發展方向的領域即移動市場,走精、專的路線,很好地發揮了自己的技術優勢,同時也避免了桌面圖形市場的殘酷競爭,是非常明智的。