發布
2009年9月22日ATI發布了支持DX11的基於Cypress核心的HD5800系列顯示卡,而NVIDIA才剛造出支持DX11的GT300晶片的樣品。回顧DirectX歷史,從1995年Windows95里的DX1.0開始,一直保持著很快的升級速度,只有DX9系列的幾個版本維持了四年之久。用兩年的時間從DX10更新到DX11,其實也不算快。
雖然硬體已經支持DirectX11,但支持DirectX11的遊戲2010年才會大量出現。
我們知道,DX10.1將是DX10的最後一次升級,而且是非關鍵性的,接下來微軟就會直接邁入DX11。根據此前的報導,DX11的主要目標仍是降低遊戲開發難度和成本,同時更有效地發揮新硬體的能力、提高物理效果和遊戲AI、增強畫面細節複雜度、針對多核心處理器進行全面最佳化。
2009年1月9日星期五,微軟將面向公眾發布Windows 7客戶端Beta 1測試版。而此前一天,即1月8日,微軟將率先發布Windows 7伺服器版本的Beta 1測試版。
在微軟發布的Windows 7Beta版本中,一些已經安裝使用的用戶的發現了DirectX 11已經包含其中了。DirectX 11作為3D圖形接口,不僅支持未來的DX11硬體,還向下兼容當前的DirectX 10和10.1硬體。DirectX 11增加了新的計算shader技術,可以允許GPU從事更多的通用計算工作,而不僅僅是3D運算,這可以鼓勵開發人員更好地將GPU作為並行處理器使用。
特點
DX11新增了計算著色器(Compute Shader)代碼示例,在今年的NVISION大會上,微軟就透漏了這點,並通過SIGGRAPH以及GameFest 2008大會上放出的幻燈片,我們可以進行一些深入的研究。此外,DX11特性的提前放出,對於目前DX10以及DX10.1硬體用戶而言也大有裨益,因為AMD和NVIDIA可以照此提前開發適當的驅動支持。
DirectX 11的諸多特性似乎暗示我們,DirectX 11被迅速採用的時機已經成熟,特別是微軟的Windows 7發布之後,這一趨勢將會勢不可擋。而如今,HLSL(High Level Shading Language,高級渲染語言)已經完全成熟,這勢必會讓DX11在眾遊戲開發者們眼裡變得更加具有吸引力,而且越來越多的人開始認識到DX10其實就是DX11的子集,這對於DirectX 11將來被快速採用也會起到促進作用。另外,DX11可以讓平行編程變得更加容易,其獨有的特性也會促進開發者們大膽的、迅速採納這種API。DirectX 11同時可以兼容Vista作業系統,所以用戶不用擔心不能升級,而Windows 7與生俱來的魅力在很大程度上也會促使Windows XP用戶們做出升級的決定,也就是說,對於開發者們而言,市場上將會有足夠大的可運行DX11的系統群體。
微軟曾許諾DirectX 10可以帶來革命性的視覺體驗以及渲染技術,但結果卻是仁者見仁,不過可以肯定的是,DirectX 11可能最終將會履行這一承諾。雖然我們現在不可能馬上就看到DirectX 11獨有的特性所帶來的效果,但是這一新版API的普及將會對刺激適時3D繪圖技術不斷提升大有裨益。
從DirectX 6到DirectX 9,微軟一直在有條不紊的使他們的編程API從一種固定的功能傳播介質以及動態的數據結構向一種豐滿的、可程式的、可進行繪圖硬體深控的環境演變。從DX9到DX10的演變可以說是一種升華:DX9的可程式性得到了進一步擴展和延伸,並在新一代硬體的作用下變得更具深度和彈性。此外,微軟還通過各種手段提升了DX10的穩定性以及靈活性。但是,DirectX 11的演變過程則有很多不同。
為了最大限度的提升可程式性,DX11寧可丟掉一些原有的結構效度。微軟將DirectX 11構建成DirectX 10/10.1的精確父集,這讓DirectX 11無形中新增了很多奇妙的潛力。特別是,DX10代碼將會變成可以選擇不去執行某些先進特性的DX11代碼,而反過來,DX11又可以在所有同等水平的硬體上運行。當然了,對於DX10而言,並不是所有的DX11特性都是可用的,但是這卻意味著開發者可在採用DX11的情況下同時針對DX10和DX11硬體進行開發,而不用考慮兩者完全分開對待:因為兩者是相同的,只不過,一個是另一個的子集功能而已。但是,如果套用某些DX11獨有特效(比如說tessellator或者compute shader)時,區分代碼路徑是非常必要的,但這完全屬於從DX10向DX11過渡過程中的益處所在。
新技術預覽
1,Direct3D11渲染管線:
看上去,DirectX 11比DirectX 10更酷。DirectX 11的很多提升意味著更高的特性性能,而這些特性很少能在DX10中看到。DirectX 11和DirectX 10兩者最大的不同之處在於管線,可以說DirectX 11的渲染管線標誌著繪圖硬體以及軟體功能革命性一步。DirectX 11加入了對Tessellation(鑲嵌)的支持。Tessellation 由外殼著色器(Hull Shader)、鑲嵌單元(tessellator)以及域著色器(Domain Shader)組成。同時還加入了計算著色器(Compute Shader),計算著色器與DX10中引入的GS不同,它並不是渲染管線的一部分,CS也是DirectX 11的重要改進之一,可以很大程度上協助開發人員彌補現實與虛幻之間的差別。
2,Tessellation鑲嵌技術:
在此之前,關於DirectX 11的報導可謂鋪天蓋地。事實上,自R600發布時,DirectX 11這個字眼才開始越來越多的出現在網路上。儘管R6xx和R7xx硬體都具有tessellator單元,但是由於tessellator屬於專有實現方案(proprietary implementation),所以R6xx和R7xx硬體是不能直接兼容DirectX 11,更何況DirectX 11採用了極其精密老練的設定過程。事實上,DX11 tessellator單元本身不具備可程式性,DX11向tessellator (TS)輸入或者從中輸出的過程是通過兩個傳統的管線階段完成的:Hull Shader (HS,外殼著色器)和Domain Shader (DS,域著色器)。
tessellator可以把一些較大的圖元(primitive)分成很多更小的圖元,並將這些小圖元組合到一起,形成一種有序的幾何圖形,這種幾何圖形更複雜,當然也更接近現實。這個過程也被稱作細分曲面(Subdivision Surfaces)。舉例來說,tessellator可以讓一個立方體,通過處理看起來像是個球形,這樣的話無疑節省了空間。此外,圖形的質量、性能以及可控性也達到了一定的促進。
Hull Shader負責接收一種由全四邊形格線(quad mash)計算得到的圖元數據(稱作patches),並計算控制點(control points)的各種變換以及輸入的圖元各個邊的鑲嵌配置(tessellation factors),從而進行鑲嵌。其中Control points用來定義想要得到的圖形(比如說一個曲面或者其他)的圖形參數。如果您經常用Photoshop繪圖軟體的話,不妨把Control points理解為PS的鋼筆工具:用平面代替線的貝塞爾曲線功能。Hull Shader採用control points來決定如何安排tessellator處理數據,利用Tessellator生成大批量的新的圖元,然後將這些圖元以及控制點傳送給Domain Shader,Domain Shader將這些數據計算轉換成3D處理中的頂點,最後GPU生成曲線以及多邊形。
3,多執行緒的支持:
由於DX11所新增的特性甚至可以套用到DX10硬體中,所以我們對於DX11的快速套用都非常期待和樂觀。DX11特性還包括很重要一點:支持多執行緒(multi-threading)。沒錯,無論是DX10還是DX11,所有的色彩信息最終都將被光柵化並顯示在電腦顯示屏上(無論是通過線性的方式還是同步的),但是DX11新增了對多執行緒技術的支持,得益於此,應用程式可以同步創造有用資源或者管理狀態,並從所有專用執行緒中傳送提取命令,這樣做無疑效率更高。DX11的這種多執行緒技術可能並不能加速繪圖的子系統(特別是當我們的GPU資源受限時),但是這樣卻可以提升執行緒啟動遊戲的效率,並且可以利用台式CPU核心數量不斷提高所帶來的潛力。
對於場景中的人像和三個鏡像,DX11會啟動四個單獨執行緒進行並行處理,效率自然要比現在依次進行的做法高很多。
搭載8顆以及16顆邏輯核心的CPU系統已經離我們越來越近,現在遊戲開發商們也該趕緊行動起來了,是時候解決有些遊戲在雙核心繫統中運行緩慢的問題了。但是開發一款能夠很大程度上促進雙核以上系統普及的遊戲,所能夠獲得的利潤以及需要的付出目前來講還很不樂觀,所以這一進程進展緩慢。對於大多數遊戲而言,充分利用四核心以及超過四核心的多執行緒優勢還非常困難。儘管如此,通過多執行緒技術讓簡單的平行運算資源產生並顯示出來,確實為採用平行運算代碼的遊戲提供了走紅的機會,這些遊戲代碼也可以以單執行緒編碼的方式存在。由於DX11系統中並不是採用一條執行緒處理所有DX state change以及draw call(或者說大量同步執行緒共同負責某一任務)的方式,所以遊戲開發者可以很自然的創造出執行緒處理某個場景的某一類或者某一群的客體對象,並為將來所有客體對象或者實體為各自的執行緒處理打下基礎(如果邏輯核心最終達到數百顆之後,這種執行緒處理方式對於提取硬體性能尤為重要)。
此外,DX10硬體也能夠在運行DX11遊戲時支持多執行緒,微軟的這一計畫相當令人興奮,不過值得一提的是,AMD以及NVIDIA必須為各自的DX10硬體開發出相應的驅動軟體才能達到這一效果(因為如果沒有相應的驅動支持的話,DX10硬體即便可以運行DX11遊戲,對於玩家而言並不會看到真正應有的效果)。當然了,我們希望NVIDIA,特別是AMD(因為他同時也是一家可以生產多核心CPU的廠商)能夠對此感興趣。而且,如果A/N這么做到話,無疑會為遊戲開發商們開發DX11遊戲提供誘因,即便是A/N的DX11硬體還在襁褓之中。
4,計算著色器Compute Shader:
很多遊戲開發者都對DX11新增的Compute Shader(通常簡稱為CS)特性嘖嘖稱讚。CS的這一渲染管線能夠進行更多的通用目的運算。我們既能在某種可以用來被執行數據的操作中看到這種特性,又能在某種可以用來操作的數據中看到這種特性。
在DirectX11以及CS的幫助下,遊戲開發者便可以使用更為複雜的數據結構,並在這些數據結構中運行更多的通用算法。與其他完整的可程式的DX10和DX11管線階段一樣,CS將會共享一套物質資源(也就是著色處理器)。
相應的硬體需要在運行CS代碼時更靈活些,這些CS代碼必須支持隨機讀寫、不規則列陣(而不是簡單的流體或者固定大小的2D列陣)、多重輸出、可根據程式設計師的需要直接調用個別或多執行緒的套用、32k大小的共享暫存空間和執行緒組管理系統、原子數據指令集、同步建構以及可執行無序IO運算的能力。
與此同時,CS也將會隨之失去一些特性。因為單個執行緒已經不再被看成是一個像素,所以執行緒將會喪失幾何集合功能。這就意味著,儘管CS程式依然可以利用紋理取樣功能,但是自動三線LOD過濾計算將會喪失自動功能(LOD必須被指定)。此外,一些並不重要的普通數據的深度剔除(depth culling)、反鋸齒(anti-aliasing)、alpha混合(alpha blending)以及其他運算不能在一個CS程式中被執行。
除了某些特殊套用的渲染,遊戲開發者可能同時也希望做一些諸如IK(inverse kinematics,反向運動學)、物理、人工智慧以及其他在GPU上執行的傳統的CPU任務之類的運算。用CS算法在GPU上執行這些數據意味著這些數據將會更快的被渲染,而且一些算法可能在GPU上的執行速度更快。如果某些總是產生同樣結果的算法既可以出現在CPU上又可以出現在GPU上的話,諸如AI以及物理等運算甚至可以同時在CPU和GPU上運行(這種運算實際上也可以代替頻寬)。
即便是這些運算代碼在相同的硬體(CPU或者GPU)上運行,PS以及CS代碼的執行也是兩個截然不同的過程,這主要取決於被執行的算法。有趣的是,暴露數據以及柱狀數據經常被用作HDR渲染。用PS代碼計算這些數據的話就需要幾條通道和幾種技巧,以便提取所有像素,從而集中或者平分這些數據。儘管共享數據將會或多或少的減緩處理速度,但是共享數據的方式要比在多通道中計算速度更快,而且這樣可以使CS成為這些算法的理想處理階段。
5,Shader Model 5.0:
DirectX 10的Shader Model 4.0(Shader Model以下簡稱“SM”)帶來了整數運算和位運算的功能,DirectX 10.1的SM 4.1加入了對MSAA的直接採樣和控制。而DirectX 11包含的SM 5.0,採用面向對象的概念,並且完全可以支持雙精度數據。隨著SM 5.0的發布,微軟也會將HLSL語言更新至最新版本,其中包含了諸如動態著色、動態分支和更多的對象等。總之,面向專業開發人員的SM 5.0,依舊是以降低編程的難度和複雜為目的。
為了解決Shader靈活性與彈性不足的問題,微軟在HLSL5.0中帶來解決之道。HLSL5.0提出shader子程式的概念,即允許程式設計師將各種小段、簡單或為個別需要而特製的shader程式連結起來,再根據實際需要動態調用,這樣既能夠提高硬體兼容性,同時減少“巨型shader”對暫存器空間的占用,有效提升性能。
6,改進的紋理壓縮:
精細的紋理對視覺效果的增益是顯而易見的。目前的3D遊戲越來越傾向於使用更大、更為精細的紋理,但是過大的紋理嚴重占用顯存和頻寬。由於目前紋理壓縮仍然不支持HDR圖像,因此DirectX 11提出了更為出色的紋理壓縮算法——BC6和BC7。BC6是為HDR圖像設計的壓縮算法,壓縮比為6∶1;而BC7是為低動態範圍紋理設計的壓縮模式,壓縮比為3∶1。兩種壓縮算法在高壓縮比下畫質損失更少,效果更出色。
這是一幅對HDR檔案的壓縮示意圖,BC6的壓縮相對於原圖來說,僅僅損失了極小的畫質,卻獲得了非常出色的效果。
紋理質量對畫面效果起著至關重要的作用。比如我們運行3D遊戲時,畫面內同樣一個物體,觀察距離較遠時,紋理銳利而清晰,但當你拉近視角,近距離細看時,紋理就非常粗糙了。更不用說在某些遊戲中還有類似放大鏡、望遠鏡等道具,啟用這些道具後,只能看到更為粗糙和不真實的紋理。出現這種問題,一方面是紋理壓縮率損失嚴重,細膩的紋理壓縮存放後,損失大量細節;另一方面是大紋理難以保證保證遊戲運行速度和軟體體積,如果在遊戲中大面積採用解析度高達4000dpi的紋理貼圖,那么顯示卡的運算資源和顯存容量很快就會告罄。因此,DirectX 11最快速和最直觀的改變就是再次改進了紋理的壓縮算法,將紋理體積和紋理質量控制在一個相當優秀的範圍之內。
支持的遊戲
遊戲名稱 | 發行日期 | 製作商 | 遊戲類型 | 遊戲引擎 | 備註 |
鍛神記 | 北美:2009年3月23日 歐洲:2009年3月27日 (更新入加支持):2009年9月23日 | EA Phenomic | 大型多人線上即時戰略遊戲 | Unknown | AMD遊戲進化計畫成員 |
潛行者:普里皮亞季的召喚 | 烏克蘭:2009年10月2日 俄羅斯:2009年10月2日 德國:2009年11月 英美:2010年2月23日 | GSC Game World | 第一人稱射擊 | X-Ray Engine(v1.6) | AMD遊戲進化計畫成員 |
科林麥克雷拉力賽:塵埃2 | 北美:2009年12月1日 歐洲:2009年12月3日 英國:2009年月12月4日 | Codemasters | 競速 | EGO Engine v1.0 | AMD遊戲進化計畫成員 |
異形大戰鐵血戰士 | 北美:2010年2月16日 歐洲:2010年2月19日 | Rebellion Developments | 第一人稱射擊 | Asura Engine | AMD遊戲進化計畫成員 |
戰地:叛逆連隊2 | 北美:2010年3月2日 歐洲:2010年3月5日 | EA Digital Illusions CE | 第一人稱射擊 | Frostbite Engine (v1.5) | AMD遊戲進化計畫成員 |
捷運2033 | 北美:2010年3月16日 歐洲:2010年3月19日 澳洲:2010年3月18日 | 4A Games | 第一人稱射擊 | 4A Engine | nVIDIA遊戲之道計畫成員 |
指環王Online | 歐美:2007年4月24日 (Volume 3: Book 2更新入加支持):2010年9月8日 | Turbine | 大型多人線上角色扮演 | Turbine G3 Engine | AMD遊戲進化計畫成員 |
文明V | 北美:2010年9月21日 歐洲:2010年9月24日 | Firaxis Games | 回合制策略、4X概念體系 | Unknown | AMD遊戲進化計畫成員 |
F1 2010 | 北美:2010年9月22日 歐洲:2010年9月23日 英國:2010年9月24日 (v1.01更新入加支持):2010年11月2日 | Codemasters | 競速 | EGO Engine (v1.5) | AMD遊戲進化計畫成員 |
榮譽勳章(2010年遊戲) | 北美:2010年10月12日 歐洲:2010年10月14日 英國:2010年10月15日 | 多人遊戲部分製作:EA Digital Illusions CE 單人遊戲部分製作:EALA | 第一人稱射擊 | (單人遊戲部分製作)Unreal Engine 3 (多人遊戲部分製作)Frostbite Engine (v1.5) | (多人遊戲部分支持DirectX 11) |
失落的星球2 | 北美:2010年10月12日 歐洲:2010年10月15日 | Capcom | 第三人稱射擊 | MT Framework 2.0 Engine | nVIDIA遊戲之道計畫成員 |
龍與地下城Online | 歐美:2006年2月20日 (Update 7更新入加支持):2010年10月20日 | Turbine | 大型多人線上角色扮演 | Turbine G3 | AMD遊戲進化計畫成員 |
鷹擊長空2 | 歐美:2010年11月12日 | Ubisoft Romania | 空戰 | Unknown | nVIDIA遊戲之道計畫成員 |
魔獸世界:大地的裂變 | 歐美:2010年12月7日港澳台:2010年12月9日 大陸:2011年7月12日 (v4.1更新入加支持):2011年4月25日 | Blizzard Entertainment | 大型多人線上角色扮演 | Unknown | |
國土防線 | 北美:2011年3月15日 歐洲:2011年3月18日 | 遊戲主要製作:Kaos Studios PC版本技術 製作:Digital Extremes | 第一人稱射擊 | Unreal Engine 3 (v3.9) | nVIDIA遊戲之道計畫成員 |
龍騰世紀2 | 北美:2011年3月8日 歐洲:2011年3月11日 | BioWare | 角色扮演 | Lycium Engine | AMD遊戲進化計畫成員 |
全面戰爭:幕府將軍2 | 全球:2011年3月15日 (更新入加支持):5月10日 | The Creative Assembly | 回合制策略、即時戰略 | Warscape engine | AMD遊戲進化計畫成員 |
孤島危機2 | 北美:2011年3月22日 歐洲:2011年3月25日 (v1.9更新入加支持):2011年6月27日 | 單人遊戲部分製作:Crytek Frankfurt 多人遊戲部分製作:Crytek UK | 第一人稱射擊 | CryEngine 3 + | nVIDIA遊戲之道計畫成員 |
孤島危機 3 | 全球:2013年2月19日 | 單人遊戲部分製作:Crytek Frankfurt 多人遊戲部分製作:Crytek UK | 第一人稱射擊 | CryEngine 3.4 | nVIDIA遊戲之道計畫成員,僅支持Windows Vista sp2及以上 |
塵埃3 | 歐美:2011年5月24日 | Codemasters | 競速 | EGO Engine (v2.0) | AMD遊戲進化計畫成員 |
漢密爾頓的大冒險 | 全球:2011年6月1日 | Fatshark | 冒險 博弈 | Unknown | 僅支持Windows Vista和Windows 7 |
紅色派系:末日審判 | 北美:2011年6月7日 歐洲:2011年6月10日 | Volition, Inc. | 第三人稱射擊 | Geo-Mod 2.5 Engine | |
極度恐慌3 | 北美:2011年6月21日英國:2011年6月24日 | Day 1 Studios Monolith Productions | 第一人稱射擊 | Heavily modified Despair Engine | |
殺出重圍:人類革命 | 北美:2011年8月23日 英國:2011年8月26日 | Eidos Montreal | 動作角色扮演遊戲 | Crystal Dynamics Engine 改進版 | AMD遊戲進化計畫成員 |
F1 2011 | 2011年9月23日 | Codemasters | 競速 | EGO Engine | |
戰地3 | 2011年10月25日 | EA DICE | 第一人稱射擊 | Frostbite Engine (V2.0) | AMD遊戲進化計畫成員 、nVIDIA遊戲之道計畫成員 |
黑色洛城 (PC) | 2011年11月8日 | Rockstar | 動作冒險 | In-house engin, eHavok | v1.2.2610支持DX11 |
極品飛車:亡命天涯 | 2011年11月15日 | EA Blackbox | 競速 | Frostbite Engine (V2.0) | |
黑道聖徒3 | 2011年11月15日 | THQ | 高自由度、動作、第三人稱射擊 | CTG | AMD遊戲進化計畫成員 |
紀元2070 | 2011年11月17日 | Ubisoft | 即時戰略 | init Engine | |
蝙蝠俠:阿卡姆之城 | 2011年11月22日 | Rocksteady | 動作 | Unreal Engine 3 | nVIDIA遊戲之道計畫成員 |
光榮使命 | 2011年6月26日 | 無錫巨人網路聯合南京軍區 | 國內第一款具有自主智慧財產權的大型區域網路遊戲 | 虛幻3 |