內容簡介
在大數據概念如此流行的今天,為什麼要讀這本書?中國大數據領軍人、大數據創新與實踐一線專家、百萬級暢銷書《大數據時代》中文版譯者周濤,耗時三年,將海量真實案例披沙揀金呈現給廣大讀者。在本書中,您將看到大數據在智慧交通系統、個性化醫療、智慧學校以及金融和商業等領域的中國式創新實踐,並為未來大數據的發展提供有可行性的路徑指南。
什麼樣的人才能在下一個時代生存和發展?大數據3.0時代我們究竟要做些什麼?數據交易如何讓數據資源成為匯聚之地?每個企業又該如何成為大數據企業?周濤教授通過真實案例告訴讀者:擁有大數據的理念,能夠掌握數據和運用數據的人和企業,才能在“一切都被記錄,一切都被分析”的數據化時代得以生存。無論現在從事什麼行業,即便不能掌握一項特定的數據技術,了解大數據的理念、培養大數據的思維模式是非常重要的。學會用數據說話,用數據分析的結果來證明“哪個更好,哪個更壞”並指導我們作出正確決策。
這不是堅硬的學術專著,而是一部柔軟的情懷之書!沒有晦澀的文辭,枯燥的說教,字裡行間洋溢著濃濃的數據情懷和拳拳的責任之心。周濤教授講述了很多在大數據領域努力拚搏,希望有所創新的中國人的故事,相信這些故事背後的理念、技術和精神能夠喚起更多年輕的創新者,為我們民族的復興作出自己的貢獻。
領跑大數據3.0時代,大數據創新實踐的扛鼎之作!大數據1.0,是將自身業務上產生的大量數據,利用深入的分析使其不斷最佳化,最佳化之後的業務產生更多數據的正向循環。大數據2.0,是如何把自身業務的數據用來解決業務以外的其它問題,或者如何用業務以外的數據解決自身業務的問題。大數據3.0,是如何在資本和文化的催化作用下,讓數據、技術、需求和人才等大數據創新要素融為一體。三個版本強調的不是時間上的先後順序或邏輯上的依存關係,而是就其與傳統數據套用在理念上的差異程度進行的劃分。
編輯推薦
2015年度十大科技創新人物、百萬級暢銷書《大數據時代》中文版譯者、中國大數據領軍人周濤耗時三年首部個人專著橫空出世!
領跑大數據3.0時代,大數據創新實踐的扛鼎之作!
沒有晦澀的文辭,枯燥的說教,字裡行間洋溢著濃濃的數據情懷與拳拳的責任之心。睿智瀟灑的文風背後是對大數據的一腔樸素濃厚的感情。
這是一部大數據在智慧城市、醫療、教育、金融、商業等領域的實踐筆記;更是一部為未來大數據的發展提供有可行性的路徑指南!
寬頻資本董事長田溯寧、阿里巴巴集團執行副總裁曾鳴、香港科技大學教授楊強重磅推薦!
湛廬文化出品。
作者簡介
周濤 天才神童。1歲說話,1歲半識字,2歲學象棋,3歲打麻將,4歲看武俠小說……26歲獲得教育部自然科學一等獎,27歲獲聘電子科技大學正教授,29歲獲得中國青年科技獎。
學術達人。在《物理報導》(PhysicsReports)、《美國科學院院刊》(PNAS)、《自然通訊》(NatureCommunication)等國際SCI期刊和SIGKDD、ICDM等國際學術會議發表論文300餘篇,引用13000餘次,H指數為55。入選Elsevier全球最具影響力中國學者名單(物理天文類)。
數據少帥。電子科技大學大數據研究中心主任,百萬暢銷書《大數據時代》中文譯者,全國最大的數據挖掘競賽平台DataCastle的創始人,“2015年度十大科技創新人物”獲得者。
商業玩家。白手起家,先後創立了數之聯、數聯銘品、國信優易等知名大數據企業,創立和投資的大數據企業總市值過百億。
目錄
自序:在麻瓜和魔法師之間做出選擇
Part.1大數據時代,用數據說話
01從萬物皆數到萬事皆數/005
主動或被動,我們都是數據貢獻者
一切都被記錄,一切都被分析
四大方面,讓數據指數級增長
02從十數九表到數態萬千/017
結構化數據
非結構化數據
03從隔水相望到阡陌交通/029
地點數據
個人數據
數據與數據,1+1遠大於2
大數據創新實踐:
用購買記錄給用戶畫像
04大數據和雲計算驅動新工業革命/039
計算:第三次工業革命中的新能源
數據:第三次工業革命中的新材料
證析:第三次工業革命中的先進工藝技術
個性化:大數據時代最顯著的商業特徵
大數據創新實踐:
一張失敗的公交卡
個性化醫療,安吉麗娜·朱莉和史蒂夫·賈伯斯
Part.2大數據1.0:分析
05統計呈現洞見/055
抓出非法的MCC套用
打擊“電老鼠”
“抓獲”過度醫療和騙保行為
識別社交網路中的垃圾用戶
新浪微博面臨的三大問題
快遞員的通話記錄蘊藏哪些商機
付費節目點播最多的是什麼
06關聯蘊含價值/075
關聯規則挖掘
協同過濾
關聯分析是尋找因果關係的利器
大數據創新實踐:
誰最關注超音波潔面產品
發現“一月三電號”殭屍用戶
07預測指導決策/089
點擊購買類預測
基於移動軌跡的位置預測
鏈路預測
大數據預測的主流方法是什麼
大數據創新實踐:
一張信用卡逾期不還款的機率有多大
簽到記錄預測用戶的土著化指數
Part.3大數據2.0:外化
08尋求外部數據的幫助/109
從行為數據預測學生考試成績
從食堂打卡記錄中“定位”孤獨人群
從社會計量標牌洞察人力資源管理
預測離職率和升職率
行為數據讓非法集資無所遁行
09自身數據的外部價值/129
45個關鍵字實時預測流感趨勢
阿里巴巴的“淘CPI”指數
10機器學習,數據外化最神奇的利器/139
機器學習三板斧1:特徵
機器學習三板斧2:模型
機器學習三板斧3:融合
Part.4大數據3.0:集成
11交易市場:數據資源的匯聚地/155
科研數據共享
政府數據開放
全國可流通數據的目錄體系
12數據城堡:數據人才的競技場/175
Kaggle,數據科學之家
數據城堡,Kaggle模式的中國嘗試者
13創新工廠:數據技術的嘉年華/185
大數據創業公司困境
大型傳統企業信息化的難題
構建大數據挖掘平台
建設大數據創新工廠
結束語成為大數據企業/201
致謝/211