內容簡介
數據,自古就有,人口普查、農業統計、軍事戰爭、政治計算……數據雖小,卻有助於治國安邦。美國之所以繁榮鼎盛,數據文化根基牢不可破概是主因之一。信息爆炸、互聯互通、智慧城市時代,大數據,更以排山倒海之勢席捲全球,政府施政、企業掘金,大眾要公平與正義,大數據被賦予了新的歷史使命。
在這本書中,從小數據時代到大數據的崛起,作者以宏大的歷史觀、文化觀、大數據觀,給我們描繪了一幅數據科學、智慧文化的全景圖。全書從美國建國之基講起,通過闡述初數時代、內戰時代、鍍金時代、進步時代、抽樣時代、大數據時代的特徵,系統梳理了美國數據文化的形成,闡述了其數據治國之道,論述了中國數據文化的薄弱之處,展望了未來數據世界的遠景。
“尊重事實,用數據說話”,“推崇知識和理性,用數據創新”,作者不僅意在傳承黃仁宇“數目字”管理的薪火,還試圖把數據這個科技符號在中國轉變為文化符號,形成一種文化話語體系。大數據正在撬動中國的制度創新、科技創新。閱讀此書,歷史與現實相互融合,知識與激情相互交織,思想與觀念相互碰撞,未來與前景必定豁然開朗。
作者簡介
塗子沛,江西吉安人,現居美國矽谷。2012年其著作《大數據》在中國社會開大數據之先河,引發了大數據戰略、數據治國和開放數據的討論,歷史學家許倬雲先生盛讚其“為華文世界開創了一個重要話題”。本書為作者第二本著作,全書對大數據追根溯源,提出當前信息技術的發展,已經讓中國獲得了後發優勢,中國要在大數據時代的全球競爭中勝出,必須把大數據從科技符號提升成為文化符號,在全社會倡導數據文化。作者本科畢業於華中科技大學計算機系,研究生畢業於中山大學和卡內基梅隆大學,獲公共管理碩士和信息科學碩士學位。
編輯推介
本書作者開中國大數據之先河,《數據之巔》內容更加豐富,觀點更加震撼,堪稱作者集大成之作。此書將再次掀起全民閱讀大數據的熱潮。作者是中國數據文化的首倡者,提出把科技符號變成文化符號的理念,倡導數據治國的理論。
數據,科學的生機和命脈;數據之巔,進入科學的殿堂,引領未來的思索。記住,我們要用數據來說話,用科學來思考。
史學家許倬雲、招行前行長馬蔚華、中國寬頻資本董事長田溯寧聯袂推薦;神州數碼公司董事局主席郭為、中信銀行行長朱小黃、萬向集團副董事長肖風傾情解讀。
《數據之巔》案例豐富,生動,讀起來趣味盎然,又不失科學的風采和素養: 數據大師蓋洛普,僅僅通過民意調查就能預測出羅斯福會擊敗蘭登當選美國總統、艾德禮會擊敗邱吉爾當選英國首相。更為傳奇的是,通過數據調查預測蓋洛普對《亂世佳人》票房記錄的預測,和最終結果相差不到6%,好萊塢的大佬們個個佩服得五體投地。
二戰之後的日本,為什麼能以謙卑、勤奮甚至決絕的態度奉戴明的質量管理學說為至寶,他們在工業管理中貫徹戴明的理論。他們就在國際競爭中嶄露頭角,最終以優質的產品馳名世界,甚至在市場競爭中擊敗美國,創造了舉世矚目的經濟奇蹟。
在“9·11”事件的悲劇現場,為什麼美國國家統計部門無法在第一時間為最高決策者提供準確的數據?白天上班人口如何統計?類似北京等大型城市早晚通勤人數有什麼規律,這又蘊含著哪些商機?在規劃線路時就要知道,低收入群體集中在哪裡,人數有多少,距離上班地點到底有多遠這些數據巨大的商業和研究價值。
書評
★塗子沛先生開啟了一道大門,我相信,後面會有更多的發展,讓大家進入這一個重要的現代文化園地。
——許倬雲著名歷史學家、美國匹茲堡大學歷史系榮譽講座教授
★在《數據之巔》這本書中,塗先生跳到了哲學思考的層面,以統計學的社會套用為切入點,解構數據文化在美國政治、經濟乃至軍事發展上起到的關鍵作用,一環扣一環,構思精巧,故事生動,邏輯清晰,讀起來實在“解渴”。感謝塗先生的智慧,為時代貢獻了一部傑作!
——郭為神州數碼控股有限公司董事局主席
★塗子沛先生的《數據之巔》通過追溯梳理美國的數據歷史、展望人類的數據未來,給中國社會提出了一個數據時代的新命題——如何構建數據文化?本書引人入勝、發人深思,是不可不讀的好書。
——馬蔚華招商銀行前行長
★數據本無大小,但運用數據的立場卻分出大小,是謂大數據。數據表示的是過去,但表達的是未來,所以觀察數據需要有歷史觀。塗子沛先生的這本新作《數據之巔》以大歷史、大數據、大社會、大進步的格局,通過數據將遙遠拉近,將悠久縮短,將巨大歸聚,將過程簡直。無論你從事何業或研究何題,都值得認真閱讀這部巔峰之作。
——朱小黃中信銀行行長、中信集團監事長
★大數據是網際網路金融的基礎支柱。網際網路金融是雲計算、大數據、社交網路這個移動互聯大時代里的小時代。時代潮流,浩浩蕩蕩!塗子沛先生的大數據系列著作,帶您觀時代大潮!
——肖風通聯數據董事長、萬向信託董事長
★塗子沛先生《數據之巔》一書的歷史高度和現實意義,超出了他的《大數據》。如果說他上部書開啟了中國人對大數據的認識,此書則從歷史的角度來說明,對數據的理解和掌握是人類文明進步的標誌。中國人在“初數時代”是被動的、落後的,黃仁宇在他的名著《萬曆十五年》中也將中國明朝未能走向資本主義歸結為中國人不能在“數目字上管理國家”。在新世紀的大數據時代,我們能否成為參與者甚至領導者?子沛這本書中有諸多可貴的思考和啟示,我向讀者推薦。
——田溯寧中國寬頻資本董事長
★塗先生深思熟慮,用語殷殷,穿行在中美兩國的歷史中,努力發掘各個大數據改變觀念,改造社會,改革制度的故事,無論人與事件,都是栩栩如生,發人深省。這本書讓我們有目標有信心,也給我們創新的無限空間。
——王巍中國金融博物館理事長
★大數據的江湖有兩派,國家治理派和產業升級派。塗子沛先生無疑是國家治理派的宗師,這本書在美國200多年的政界商海、刀光劍影中勾勒出雄渾的數據思維、文化、價值觀和方法論。臨到尾處,我的期待愈來愈強。他的第一本書《大數據》在通篇的歷史視角、西方視角後,煞費苦心附上一篇“挑戰中國”的尾聲,把人拉回當下、令人掩卷憂思;這次果不其然,子沛以整整一章的濃墨重彩,挑戰了“智慧城市”這一兼具進行時和未來時的話題,而當涉及中國元素時,子沛的行文中出現了暖色調,那種欣賞和希冀讓人寬慰之極、意猶未盡!期待《數據之巔》之後,山不窮,峰更高。
——吳甘沙英特爾中國研究院院長
★塗子沛先生已經成為中國大數據和數據分析領域最前沿的思想者和專家,如果您想了解大數據的歷史、現實和未來,這本書將是您的必讀書目。
——托馬斯·H·達文波特巴布森學院教授,麻省理工學院數字商務中心研究員
目錄
推薦序一進入一個重要的現代文化園地/許倬雲//XV
推薦序二一部精彩紛呈的時代傑作/郭為//XIX
推薦序三大數據可以創造未來/王巍//XXIII
第一部分小數據之歷史
第一章初數時代:奠基共和
克服民主的劣勢:用數據分權//004
制度創新:變對抗為合作的魔法棒//010
兩黨之爭:無法精確分割的權力//013
阿拉巴馬悖論:沒有完美的方案//021
有數初成:共和政治反哺數據文化//027
中國往事:第一次現代意義上的人口普查//035
第二章內戰時代:終結奴隸制的燈塔
人口普查:南方最大的敵人//040
用數據辯論:南北戰爭的序幕//046
用數據遠征:向大海進軍//053
政治計算:解放黑奴的真正原因//069
兵家和數據:中國歷史上的吉光片羽//074
第三章爆發:鍍金時代的三重崛起
用數據預測:轉變思維方式//083
總統之死:專業化的悲情序曲//089
世紀巔峰:大數據驅動的創新//102
和政治分家:勞工統計的異軍突起//110
姑娘、棉花和數據:究竟誰在推動歷史//116
塵封的瑰寶:中國的數據可視化先驅//122
第四章量化:進步時代的數據大潮
用數據決策:水利工程中的數據競爭//138
衝擊量化的極限:給生命定價//146
“平托”風波:福特公司的道德危機//151
用數據來審判:理性的必然選擇//159
代理人需要監督:成本收益分析方法的未來//163
思考中國話題:民族復興能否量化?//172
第五章抽樣時代:統計革命的福祉
從選票到電影票:和《亂世佳人》共舞//178
用數據跨界:質量大師是怎樣煉成的//188
旋轉質量的飛輪:日本崛起//193
世紀之問:日本行,為什麼我們不行?//203
第二部分大數據的崛起
第六章開放時代:內開放的歷程
內開放1.0:數據承載知情權//217
內開放2.0:用數據制衡//219
悲劇現場的第一個問題:普查局的數據之痛//224
LEHD項目:開放數據的使用權//229
內開放3.0:用數據推動創新//244
2012年:來自中國的組織創新//250
第七章大數據時代:通往計算型的智慧型社會
世上本沒有數:正解大數據//255
改變世界的三股力量:大數據的成因//259
有數據,還要有計算:計算型社會的興起//270
普適計算:即將到來的超級數據爆炸//278
數據和計算:第三次工業革命的CPU//280
數據之巔:通向智慧型型社會的挑戰//288
第八章智慧城市:正在拍打世界的浪潮
西方和東方:聰明和智慧//303
目標鎖定“城市平台”:神州數碼對話錄//309
眾包、眾智和眾創:讓大眾解決大眾的問題//315
雲、隱私和未來:中國和美國的不同挑戰//325
結語把握後發優勢:把科技符號變成文化符號//335
後記蝴蝶振翅//341
語錄
數據之巔的“顛”有三個維度:一是技術維度,即人類使用數據的巔峰形式是讓機器使用數據,通過機器學習實現智慧型化;二是文化維度,登上數據之巔,俯覽數據文明的興起;三是政策維度,大數據的建設需要站在巔峰之上的頂層設計。(演講)
數據文化是尊重事實、強調精確、推崇理性和邏輯的文化。數據文化的匱乏,是中國之所以落後的一個重要原因;建設這種文化,中華文明的面貌將煥然一新。(題記)
大數據不是礦藏,而是土壤,開放的數據即為土地上的河流,河流流過之處,就會孕育起發達的數據文明。(採訪)
以人口普查為基礎,美國的建國者構建了用數據分權的方法,這不僅調和了民主與共和的矛盾,就人口普查本身而言,也是一項創新。因為國家權力—議席要按人口數量來分配,各州需要向中央政府繳納的稅收也要按人口來分攤,權利和義務得以互相制約:想通過誇大人口基數獲得更多議席的州,也要相應承擔更多的納稅義務;同時,想要通過隱瞞人口增長來避稅的州,將在國家權力的分配中失去應該得到的席位,這種互相約束的關係保障了人口普查的公正性和準確性。(P11)
專制的暴君把會計系統儘可能搞複雜、把人搞糊塗,以操縱稅收和財務工作,但一個共和國的貨幣體系應該簡單,簡單到最普通的人也能方便地使用。”換句話說,共和國的目標就是讓一切計算變得簡單,讓每個人在商業活動中都能成為自己的計算器,而不依賴他人。計算能力不僅僅是自由經濟的需要,也是自由社會、自由人的需要。(P32)
無論是霍爾瑞斯的發明、IBM的崛起,還是第一台商用計算機的出現,都離不開美國人口普查產生的龐大數據……令後人不勝感嘆的是……一個政治決定,歷經百年演變,卻推動美國登上了信息技術的巔峰,引領全世界邁進了一個新的社會形態。歷史之曲折、奇妙和偉大,我們後人應該如何思考、詮釋和借鑑?(P109)
面對錯綜複雜的利益衝突和政治壓力,話不用多說,就讓數據來一決高下!(142)
總統身邊的幕僚、親信、內閣部長當然都從中看出了端倪,他們都意識到,要想獲得項目和撥款,就必須用數據說話。這在美國政府掀起了一股數據浪潮,各個政府部門都開始招聘、雇用一大批統計學家和經濟學家,以確保自己在“數據競爭”中不落於人後。(P143)
在國會的聽證會上,每一個數據如果稍有含糊,每一個邏輯推理的鏈條如果斷裂,都有可能被虎視眈眈的競爭對手揪出來,受到質疑和挑戰。這種嚴謹的、針鋒相對的辯論,最終推動了成本收益評估方法的規範和改進。(P144)
用道德的名義反對生命價值的量化,其實是無知的表現,也是真正漠視人類根本利益的表現。如何完成這種量化,才是理性人類真正的挑戰。(P146)
如果民族復興有明確的定義和目標,那中國的學術界不僅需要對這個進程進行量化,而且還需要百家爭鳴,出現多種量化模型。原因有三個:一是唯有量化,才可能對一個進程進行管理;二是從美國工程兵團和農墾局之間的數據競爭中,我們可以看到,正是競爭使得量化的過程不斷完善;三是每一個數學模型都有其局限性,多個模型可以互為補充。(P172)
中日差距形成的歷史原因,關鍵在於兩個國家的國民對待先進文明的不同態度。日本人認識到自己的不足,坦蕩地面對自己的失敗,真心誠意地向西方學習,因為善於學習,1936年這輪起源於西方國家的統計革命,卻成為了一個亞洲國家崛起的契機;因為善於學習,這個小小的國家爆發出了驚人的能量,僅僅用了15年,就從殘垣斷壁的一敗塗地中崛起,並與全世界最強大的國家並駕齊驅……面對日本的崛起,我們中國人更應該這樣問一問自己:“日本行,為什麼我們不行?!(P210)
一個國家的開放,應該首先指向它的內部……和對外開放相比,內開放更加重要,它決定了一個國家長期的發展和命運。……內開放不僅關係到公民的自由、權利,還是政府管理社會、調控市場、服務經濟發展的有效手段。更重要的是,隨著大數據時代的到來,數據將像傳統的“人、財、物”一樣,成為重要的生產資料和創新資源,內開放的程度,將決定一個國家發展的動力、一個社會創新的活力。(P216)
國與國之間的競爭,表面上是科技競爭、經濟競爭,但歸根結底,還是國民素質和文化的競爭。沒有一個健康、理性、與時俱進的文化,一個國家就難以變得強大,本書的努力,就是試圖在中國,把數據這個科技符號變成一個文化符號,將大數據這個高端精英的話題變成一個大眾話題,使數據文化進入中國人的視野、融入中國人的意識和血液。(P338)
數據就是靜態的歷史,歷史就是動態的數據。歷史的碎片,就是游離的數據;歷史的迷霧,就是模糊的數據;歷史的盲點,就是缺失的數據。用數據構建的歷史,因為精確的細節而永遠鮮活,數據越豐富,後世的歷史學家也就越能經由數據更好地再現當時的社會。(P336)
我們研究美國、學習美國,並不是為了成為另一個美國。學習始於模仿,但好的學習,目的是超越。對中國而言,甚至“超越美國”也不是最終目的,我們的目的,是要為世界進步做出更多、更突出、更前沿的貢獻,就像柴洪峰先生說的,要在人類的文明史中講述自己的故事、重放民族的榮光。(P343)