簡述
百度大數據引擎包括開放雲、數據工廠和百度大腦三個核心組件。百度將通過平台化和接口化的方式,對外開放其大數據存儲、分析和智慧型化處理等核心能力,這也是全球首個開放大數據引擎。據悉,百度的合作機構和傳統企業,將能夠線上使用百度的大數據架構,處理自身積累的大數據,同時融合百度大數據技術進行挖掘處理,改造傳統行業的企業管理、商業模式等環節。
百度大數據引擎將經歷逐步開放的過程,採取邀請制和免費模式,與政府、非政府組織、製造、醫療、金融、零售和教育等傳統領域率先展開合作。
功能
百度大數據引擎包括開放雲、數據工廠、百度大腦三層核心平台。其中,百度開放雲相當於百度“大數據引擎”的基礎設施和硬體能力,依靠能耗小、存儲密度大的ARM伺服器,構建低能耗數據中心和分散式運算架構,解決的是數據存儲和計算瓶頸。
數據工廠可以被看作百度將海量數據組織起來的軟體能力,百度提供了“大數據挖掘機”,可以把數據關聯起來,並從中挖掘出它的價值,數據工廠承載的是TB級甚至更大的數據的查詢和掃描工作。
百度大腦則將百度在深度學習和大規模機器學習的能力開放出來,涉及語音、圖像、文本識別,以及自然語言和語義理解等方面。百度深度神經網路擁有200億個參數,並擁有獨立的深度學習研究院(IDL)和較早的布局。據悉, 百度大腦現在已經可以模擬到兩三歲嬰兒的智力水平。
借用圖靈獎獲得者N.Wirth(沃斯)提出的“程式=數據結構+算法”的理論,那么如果說百度“大數據引擎”是一個程式,它的數據結構就是“開放雲”+“數據工廠”,而算法則對應到“百度大腦”。
此前,百度的這些能力主要開放給第三方開發者,現在則將其開放給擁有海量數據的大型公司。據悉,百度“大數據引擎”的開放是漸進式的,目前採取邀請制和免費模式,與政府、非政府組織、製造、醫療、金融、零售和教育等傳統領域率先展開合作。李彥宏認為,未來會有更多行業被捲入,而且被捲入的速度越來越快,是一個加速發展的過程,將產生一場新的工業革命。