實戰Hadoop

概述

《實戰Hadoop》是中國電子學會雲計算專家委員會劉鵬教授主編的國內第一本原著的Hadoop編程技術書籍。它由電子工業出版社於2011年9月出版,並在首屆中國雲計算技術與套用大會上首發。作為谷歌雲計算技術的開源實現,Hadoop是目前最受關注的雲計算技術平台。該書強調動手、強調實戰,以風趣幽默的語言和一系列生動的套用實例,系統地講授了Hadoop的核心技術和擴展技術,包括:MapReduce、HDFS、HBase、Hive、Pig、Cassandra、Chukwa和ZooKeeper等,並給出了3個完整的基於Hadoop的雲計算綜合套用實例,及保障Hadoop平台可靠運行的方法。本書主要作者來自國內少有的擁有豐富經驗的雲計算技術研發團隊。

讀者對象

雲計算研發人員,包括院校、科研機構師生和科研人員,各類雲計算技術企業和套用企業研發人員

圖書目錄

第1章神奇的大象——Hadoop
1.1 初識神象 1.2 Hadoop初體驗 1.3 Hadoop世界的風俗
第2章分久必合——MapReduce
2.1MapReduce基礎
2.2一切從“Hello World”開始——文字計數
2.3MapReduce,你夠了解嗎?
2.5實戰:倒排索引
2.4實戰:用MapReduce進行海量數據排序
第3章HDFS:不怕故障的海量存儲
3.1 開源的GFS——HDFS 3.3 HDFS API之旅 3.4 檔案操作示例
3.5實戰:用HDFS存儲海量視頻數據
第4章HBase:一張無限大的表
4.1HBase數據模型
4.2 HBase的入門儀式
4.3 HBase操作演練
4.4HBase查詢語言HBQL
4.4實戰:用HBase管理通話記錄數據
第5章 MapReduce進階
5.1複合鍵值對的使用
5.1.1用複合鍵讓系統完成排序
5.1.2把小的鍵值對合併成大的鍵值對
5.2用戶定製數據類型
5.2.1 Hadoop內置的數據類型
5.2.2用戶自定義數據類型的實現
5.3用戶定製輸入輸出格式
5.3.1 Hadoop內置的檔案輸入格式和RecordReader
5.3.2用戶自定義InputFormat和RecordReader示例
5.3.3 Hadoop內置的檔案輸出格式和RecordWriter
5.3.4用戶自定義OutputFormat和RecordWriter示例
5.4用戶定製Partitioner和Combiner
5.4.1用戶定製Partitioner
5.4.2用戶定製Combiner
5.5疊代完成MapReduce計算
5.5.1基本問題
5.5.2疊代MapReduce計算任務示例
5.6複合MapReduce計算過程的實現
5.6.1順序化MapReduce任務的執行
5.6.2具有數據依賴關係的MapReduce任務的執行
5.6.3 MapReduce前處理和後處理步驟的鏈式執行
5.7多數據源的連線
5.7.1基本問題
5.7.2用DataJoin類實現Reduce端Join
5.7.3用檔案複製方法實現Map端Join
5.7.4帶Map端過濾的Reduce端Join
5.7.5多數據源連線解決方法的限制
5.8全局參數/數據檔案的傳遞
5.8.1全局作業參數的傳遞
5.8.2全局數據檔案的傳遞
5.9 關係資料庫的連線與訪問
5.9.1從資料庫中輸入數據
5.9.2向資料庫中輸出計算結果
5.10其它處理技術
5.10.1查詢任務相關信息
5.10.2劃分多個輸出檔案集合
第6章 Hive:飛進數據倉庫的小蜜蜂
6.1搭建蜂房——Hive安裝
6.2 Hive的服務
6.3 HiveQL的使用
6.4 Hive示例
6.5實戰:?
第7章 Pig:一頭什麼都能吃的豬
7.1 Pig的安裝
7.2 Pig Shell的使用
7.3 Pig Latin程式語言
7.4 Pig示例
7.5實戰:?
第8章Cassandra:來自Facebook的女神
8.1 讓Canssandra飛起來
8.2 洞察Cassandra的全貌
8.3Cassandra與Hadoop聯姻
8.4Cassandra操作示例
8.5實戰:?
第9章Chukwa:收集數據的大烏龜
9.1 Chukwa安裝與配置
9.2 Chukwa的設計
9.3 Chukwa實踐之路
9.4實戰:?
第10章 動物管理員ZooKeeper
10.1 誰動了ZK的鑰匙
10.2ZK是個謎
10.3 何去何從的ZK
10.4ZooKeeper演練
10.5實戰:?
第11章 綜合實戰:打造一個搜尋引擎
第12章 綜合實戰:生物信息學套用
第13章 綜合實戰:行動網路信令監測
第14章 高枕無憂:Hadoop容錯

相關詞條

相關搜尋

熱門詞條

聯絡我們