作者簡介
奧魯克斯,博士是美國史丹福大學計算機系教授,是當今計算機設計領域著名的學者和開拓者。他領導了第一個片上多處理器系統Hydra的開發,推動了片上多處理器的研究熱潮,同時建立了Afara Websystems公司,該公司最終被Sun公司收購併將其處理器重命-名為Niagara。目前,他擔任史丹福大學普適並行實驗室(Pervasive Parallelism Lab,PPL)領導人,該實驗室的目標是把並行計算推廣到所有的套用領域中。
內容簡介
《片上多處理器體系結構改善吞吐率和延遲的技術》主要內容:片上多處理器(chip multiprocessor),又稱多核微處理器或簡稱CMP,已成為構造現代高性能微處理器的唯一技術途徑。《片上多處理器體系結構改善吞吐率和延遲的技術》在簡單介紹了片上多處理器的基本概念後,著重於從提高吞吐率和縮短回響時延兩方面探討片上多處理器的基本技術與設計方法。同時介紹了多核處理器的編程技巧,包括執行緒級猜測和事務型記憶體等熱點技術。通過閱讀《片上多處理器體系結構改善吞吐率和延遲的技術》,讀者可以在較短時間內熟悉和掌握片上多處理器研究的主流技術和最新的研究成果,為片上多處理器領域的科研和套用帶來新的思路和靈感。
目錄
出版者的話
譯者序
摘要
第1章 CMP簡介
1.1 一個新途徑:片上多處理器
1.2 應用程式的並行性圖景
1.3 一個簡單的例子:超標量與CMP
1.4 本書:超越基本的CMP
參考文獻
第2章 吞吐率最佳化技術
2.1 簡單核心與伺服器套用
2.1.1 處理器內部對多執行緒的需求
2.1.2 最大化單個晶片上的處理器核心數量
2.1.3 提供足夠的快取和主存訪問頻寬
2.2 與吞吐率有關的片上多處理器案例研究
2.2.1 案例1:Piranha伺服器CMP
2.2.2 案例2:Niagara伺服器CMP
2.2.3 案例3:Niagara.2 伺服器CMP
2.2.4 基於簡單核心的CMP系統的局限性
2.3 通用伺服器CMP分析
2.3.1 模擬大規模設計空間
2.3.2 選擇設計要點
2.3.3 實驗結果
2.3.4 討論
參考文獻
第3章 自動的延遲最佳化技術
3.1 偽並行:“幫手”執行緒
3.2 採用執行緒級猜測實現自動並行
3.3 TLs系統的一個實例:Hydra
3.3.1 Hydra基礎設計
3.3.2 在Hydra中加入TLS
3.3.3 使用衝突統計獲得的反饋信息
3.3.4 性能分析
3.3.5 完全自動化的TLS支持:Jrpm系統
3.4 自動並行化的總結思考
參考文獻
第4章 基於手工並行編程的延遲最佳化技術
4.1 使用TLs支持事務型記憶體
4.1.1 一個例子:使用TLs對堆排序進行並行化
4.1.2 使用TLS對SPEC2000進行並行化
4.2 事務型一致性:更普遍的事務型記憶體
4.2.1 TCC硬體
4.2.2 TCC軟體
4.2.3 TCCt陛能
4.3 事務型記憶體與常規共享記憶體的混合方案
參考文獻
第5章 一個多核的世界:CMP的未來
參考文獻
作者介紹