Hadoop硬實戰:《Hadoop硬實戰》是2015年1月1日電子工業出 -百科知識中文網

內容簡介

Hadoop是一個開源的MapReduce平台，設計運行在大型分散式集群環境中，提供查詢和分析服務。尤其適用於大數據系統，Hadoop為蘋果、eBay、LinkedIn、雅虎和Facebook等公司提供重要軟體環境。它為開發者進行數據存儲、管理以及分析提供便利的方法。

《Hadoop硬實戰》收集了85個問題場景以及解決方案的實戰演練。在關鍵問題領域對基礎概念和實戰方法做了權衡，例如導入導出、序列化，以及LZO壓縮。你將會學習到每個技術的細節，以及當遇到一個具體問題時能夠給出對應的解決方案。本書提供了結構良好且易於理解的例子，可用於應對你所遇到的問題。

本書包含：

·Hadoop和MapReduce的基本概念

·85個實戰和測試技術

·真實的場景，實用的解決方案

·如何整合MapReduce和R

Hadoop 硬實戰（ 學習 Hadoop 和 Mapreduce 不二之選 85 個 Hadoop 高級技巧實戰案例 ）

[ 美]Alex Holmes（（亞歷克斯.霍姆斯））著

梁李印寧青楊卓犖譯

ISBN 978-7-121-25072-9

2015 年1月出版

定價：99.00元

536 頁

16 開

編輯推薦

本書包含：

·Hadoop和MapReduce的基本概念

·85個實戰和測試技術

·真實的場景，實用的解決方案

·如何整合MapReduce和R

內容提要

Hadoop 是一個開源的MapReduce 平台，設計運行在大型分散式集群環境中，為開發者進行數據存儲、管理以及分析提供便利的方法。《Hadoop硬實戰》詳細講解了Hadoop 和MapReduce 的基本概念，並收集了85 個問題及其解決方案。在關鍵問題領域對基礎概念和實戰方法做了權衡。

《Hadoop硬實戰》適合使用Hadoop 進行數據存儲、管理和分析的技術人員使用。

這是我見過最出色的一本Hadoop書，內容質量高，寫作精良，覆蓋大量有用的實例。其涉及資料的廣度及細節程度，都遠優於其他Hadoop參考書。本書適合那些想跟著非常有實用價值的真實案例學習新工具技術的人群。對於任何一個重度Hadoop用戶、開發者，這本書都非賣不可。

——telescope7

學習Hadoop和Mapreduce絕無僅有的好書！我是一個初學者，沒有任何Hadoop開發經驗。在我開始閱讀本書之前，我在網上看過不少文章。也讀過其他Hadoop書籍。這本書對於我想知道的知識而言，真正做到了包羅萬象，而且對概念的解釋非常細緻詳盡。書中的每部分都組織得很好，寫得也精到。作者的寫作技巧好到令人咋舌，可以用非常質樸和淺顯易懂的方式闡述非常複雜的概念。完全不用有疑慮，書中實例也同樣富於實戰性和有實用價值，涉及Hadoop眾多不用的套用領域。不像很多隻玩湊字遊戲的網路教程，這本書的例子都是真實的，可以直接拿來用。

——Chenghai

前言

我是在2008 年秋天參加VeriSign 的網際網路抓取和分析項目的時候開始接觸Hadoop 的，我的團隊與Doug Cutting 以及Nutch 項目的人就如何有效地存儲和管理TB 級的抓取數據和分析數據得出相似的結論。當時我們已經建立了自己的分散式系統，但是這個系統無法系統地將抓取的數據與新添加的數據合併。

在研究了Hadoop 項目後，我們發現它很適合我們的需求——它支持大數據存儲，並提供數據合併機制。在幾個月的時間內，我們創建並開發了包含多個MapReduce 作業的MapReduce 套用，並將這個套用與我們自己的MapReduce 工作流管理系統部署在一個擁有18 個節點的小集群上。通過這個小集群可以觀察我們的MapReduce 作業是如何在幾分鐘內處理完數據的。當然，我們沒想到的是，在調試和最佳化MapReduce 作業上會花費這么多時間；更沒想到的是，我們擔負起生產管理員這一新職責時，在支持生產的頭幾個月內我們遇到大量的磁碟故障問題。

隨著對Hadoop 熟悉程度的提高，我們運用Hadoop 繼續建立了更多的功能以幫助處理大規模數據集。我們還開始在公司內部宣傳Hadoop 的優點，並發動其他面臨處理大數據的項目使用Hadoop。

在運用Hadoop（尤其是在處理MapReduce 時）的過程中我們遇到的最大挑戰是重新學習如何使用它解決問題。MapReduce 有自己並行處理進程的方法，這種處理方式與我們通常使用的JVM 程式完全不同。最大的障礙就是訓練我們的大腦去熟悉MapReduce 的處理方法，Chuck Lam 在2010 年編寫出版的Hadoop in Action 一書詳細講解了MapReduce 的相關信息。

當你習慣了使用MapReduce 後，接下來就需要學習如何使用Hadoop，如何將數據導入和導出HDFS，如何在Hadoop 中高效處理數據。Hadoop 的這些方面還沒有引起很廣泛的關注，這也是我要撰寫本書的潛在原因——主要介紹Hadoop 的一些高級套用，並涉及Hadoop 的一些難點問題。我相信目前已經有很多讀者有Hadoop 的相關套用經驗，我寫本書的目的只是為了將我的個人經驗轉化為書本知識。我對本書中的實例進行了驗證，這並不是一個愉快的過程，但是編寫本書的過程中所運用到的新方法和工具使我對Hadoop 有了進一步的了解，希望讀者通過本書可以獲取Hadoop 的更多知識。

Hadoop硬實戰

內容簡介

編輯推薦

內容提要

目錄

相關詞條

Hadoop硬實戰

高性能網站構建實戰

Spark大數據分析技術與實戰

程式設計師2013精華本

SAP HANA

大數據時代行銷人的變革：預測行銷

相關搜尋

熱門詞條