GPU高性能運算之CUDA

GPU高性能運算之CUDA

《GPU高性能運算之CUDA》是2009年10月中國水利水電出版社出版的圖書,作者是張舒、禇艷利等。

編輯推薦

精選典型實用例程,詳解CUDA使用細節,重視理論結合實際,介紹並行程式設計方法,深入分析硬體架構,揭示模型與底層映射關係,精心總結最佳化經驗,解析高性能編程技巧。

內容簡介

本書是全國第一本全面介紹CUDA軟硬體體系架構的書籍。全面介紹使用CUDA進行通用計算所需要的語法、硬體架構、程式最佳化技巧等知識,是進行GPU通用計算程式開發的入門教材和參考書。

本書共分5章:第1章介紹GPU通用計算的發展歷程,介紹並行計算的歷史、現狀以及面臨的問題;第2章介紹CUDA的使用方法,幫助理解CUDA的編程模型、存儲器模型和執行模型,掌握CUDA程式的編寫方法;第3章探討CUDA硬體架構,深入分析Tesla GPU架構與CUDA通用計算的相互作用:第4章總結CUDA的高級最佳化方法,對任務劃分、存儲器訪問、指令流效率等課題進行探討;第5章以豐富的實例展示如何使用CUDA的強大性能解決實際問題。

本書可作為CUDA的學習入門和編程參考書,主要面向從事高性能計算的程式設計師與工程師,使用GPU加速專業領域計算的科研人員,以及對GPU通用計算感興趣的程式設計師。開設相關課程的高等院校與科研機構也可選用本書作為教材。

作者簡介

張舒,電子科技大學信息與通信工程專業碩士,現任NvIDIA深圳有限公司系統設計驗證工程師,CUDA技術顧問。曾實現基於CUDA的神經網路、聚類分析、主分量分析等模式識別算法,以及信號仿真、密碼破解、字元串匹配等套用。

目錄

前言

第1章 GPU通用計算

1.1 多核計算的發展

1.1.1 CPU多核並行

1.1.2 超級計算機、集群與分散式計算

1.1.3 CPU+GPU異構並行

1.2 GPU發展簡介

1.2.1 GPU渲染流水線

1.2.2 著色器模型

1.2.3 NVIDIA GPU發展簡介

1.3 從GPGPU到CUDA

1.3.1 傳統GPGPU開發

1.3.2 CUDA開發

第2章 CUDA基礎

2.1 CUDA編程模型

2.1.1 主機與設備

2.1.2 Kernel函式的定義與調用

2.1.3 執行緒結構

2.1.4 硬體映射

2.1.5 deviceQuery示例

2.1.6 matrixAssign示例

2.2 CUDA軟體體系

2.2.1 CUDA C語言

2.2.2 nvcc編譯器

2.2.3 運行時APl與驅動APl

2.2.4 CUDA函式館

2.3 CUDA存儲器模型

2.3.1 暫存器

2.3.2 局部存儲器

2.3.3 共享存儲器

2.3.4 全局存儲器

2.3 5 主機端記憶體

2.3.6 主機端頁鎖定記憶體

2.3.7 常數存儲器

2.3.8 紋理存儲器

2.4 CUDA通信機制

2.4.1 同步函式

2.4.2 Volatile關鍵字

2.4.3 ATOM操作

2.4.4 VOTE操作

2.5 異步並行執行

2.5.1 流

2.5.2 事件

2.6 CUDA與圖形學APl互操作

2.6.1 CUDA與OpenGL的互操作

2.6.2 CUDA與Direct3D互操作

2.7 多設備與設備集群

2.7.1 CUDA設備控制

2.7.2 CUDA與openMP

2.7.3 CUDA與集群

第3章 CUDA硬體架構

3.1 NVIDIA顯示卡構造簡介

3.1.1 圖形顯示卡概覽

3.1.2 PCI—E匯流排

3.1.3 顯存

3.1.4 GPU晶片

3.2 Tesla圖形與計算架構

3.2.1 SPA—TPC—SM

3.2.2 主流GPU架構

3.3 Tesla通用計算模型

3.3.1 數據與指令的載入

3.3.2 warp指令的發射與執行

3.3.3 紋理、渲染和存儲器流水線

第4章 CUDA程式的最佳化

4.1 CUDA程式最佳化概述

4.2 測量程式運行時間

4.2.1 設備端測時

4.2.2 主機端測時

4.3 任務劃分

第5章 綜合套用

附錄A 安裝、配置、編譯及調試

附錄B 常見問題與解答

附錄C 技術規範

附錄D C擴展

附錄E 數學函式

附錄F 紋理拾取

附錄G 著色器模型

相關詞條

熱門詞條

聯絡我們