大數據架構師指南

《大數據架構師指南》是一部由朱進雲,陳堅,王德政所編著的書籍, 清華大學出版社出版發行。

出版信息

•出版社:清華大學出版社

•ISBN:9787302435167

•版次:1

•商品編碼:12354111

•包裝:平裝

•開本:16

•出版時間:2016-05-01

•用紙:膠版紙

•頁數:296

•字數:320000

內容簡介

本書的目的就是為了幫助讀者在最短的時間內,系統地把握大數據相關的技術框架,建立系統架構級別的技術思考能力與原則。本書適用於企業的IT與大數據的從業人員,IT與大數據相關的銷售人員,企業的首席技術官(CTO)、首席信息官(CIO),由於本書在大數據知識具備系統性,也可以作為高校大數據方面課程的教材或輔導書。

目錄

第一部分 大數據架構師入門

第1章 大數據概述 3

1.1 什麼是大數據 4

1.2 大數據的本質 6

1.3 大數據技術當前狀態 8

1.4 大數據的技術發展趨勢 11

第2章 大數據項目常見場景 13

2.1 實驗型部署場景 14

2.2 中小型部署場景 16

2.3 大型部署場景 19

第3章 大數據方案關鍵因素 23

3.1 數據存儲規模與數據類型 24

3.2 數據來源與數據質量 25

3.3 業務特徵 26

3.4 經濟可行性 27

3.5 運維管理要求 28

3.6 安全性要求 29

3.7 部署要求 31

3.8 系統邊界 32

3.9 約束條件 34

3.10 要點回顧 34

第二部分 大數據架構師基礎

第4章 Hadoop基礎組件 39

4.1 Hadoop簡介 40

4.2 Hadoop版本演進 41

4.3 Hadoop2.0生態系統簡介 42

4.4 Hadoop分散式檔案系統HDFS 43

4.5 Hadoop統一資源管理框架YARN 48

4.6 Hadoop分散式計算框架MapReduce 52

4.7 Hadoop分散式集群管理系統ZooKeeper 57

第5章 Hadoop其他常用組件 61

5.1 Hadoop數據倉庫工具Hive 62

5.2 Hadoop分散式資料庫 HBase 65

5.3 Hadoop實時流處理引擎 Storm 70

5.4 Hadoop互動式查詢引擎 Impala 74

5.5 其他常用組件 78

第6章 Spark記憶體計算框架 83

6.1 記憶體計算與Spark 84

6.2 Spark的主要概念 86

6.3 Spark核心組件介紹 96

6.4 Spark與Hadoop之間的關係 100

6.5 要點回顧 104

第7章大數據中間件層 105

7.1 中間件層簡介 106

7.2 中間件層產品介紹 107

7.3 中間件層的套用 121

7.4 中間件層的發展 124

7.5 要點回顧 128

第8章大數據分析 129

8.1 數據時代 131

8.2 先進分析 133

8.3 架構與平台 136

8.4 數據分析流程 140

8.5 要點回顧 143

第9章可視化技術 145

9.1 可視化技術引言 146

9.2 什麼是數據可視化 147

9.3 數據可視化設計 151

9.4 數據可視化的發展趨勢 160

9.5 要點回顧 161

第10章大數據安全 163

10.1 安全體系 164

10.2 大數據系統安全 168

10.3 要點回顧 180

第11章大數據管理 181

11.1 數據管理的範圍和定義 182

11.2 開源軟體的管理能力 183

11.3 國內主流管理 187

11.4 大數據管理展望 195

11.5 要點回顧 195

第三部分大數據架構師實踐

第12章大數據項目實踐 199

12.1 大數據項目架構關鍵步驟 201

12.2 架構師實踐思考 213

第13章大數據部署實踐 217

13.2 DAP平台特點 219

13.3 某銀行成功案例 220

第四部分 大數據架構師拓展

第14章分散式系統與大數據的關係 229

14.1 分散式系統概述 230

14.2 分散式系統關鍵協定和算法概述 237

14.3 分散式系統和大數據 241

第 15 章資料庫系統與大數據的關係 245

15.1 資料庫系統的歷史 246

15.2 各類系統求同存異 258

15.3 大數據的發展展望 259

第16章雲計算與大數據的關係 261

16.1 虛擬化概述 262

16.2 OpenStack雲管理架構實現 267

16.3 大數據基於雲計算IAAS部署的探討 274

後記 277

相關詞條

熱門詞條

聯絡我們