dataguru

2011年11月創建的關於數據倉庫、數據挖掘、商業智慧型等技術和業務討論的數據分析專業社區網站。

簡介

2011年11月創建的關於數據倉庫、數據挖掘、商業智慧型等技術和業務討論的數據分析專業社區網站。

發展歷史

近年來,由於存儲設備的單位成本以驚人的速度下降(1G硬碟空間的成本現在只需要幾美分,這在過去難以想像),我們可以輕而易舉地積累起大量的數據。電信運營商,可以記錄用戶通話、短訊息、無線上網產生的每一條信令,省級運營商一小時寫入存儲設備的數據量可以達到幾百G。電子商務網站,可以記錄用戶的每一次交易,甚至每一次點擊,可以復原用戶的完整訪問路徑找出用戶的興趣點。城市監控體系,在各個重要路口,高速公路上的攝像頭,每秒鐘都在產生海量的視頻數據。在生命科學領域,對人體的DNA分析,一個個體就能產生幾個G數據,可以想像如果一個生物信息資料庫里包含了成千萬的個體數據,信息量將會是怎樣一個規模,如此等等,不勝枚舉。我們毫無疑問,正處於一個信息爆炸的時代。

很不幸的是,我們得到了大量的數據,而這些數據中的絕大部分,在它的生命周期里基本上都被閒置著,從來沒有考慮過產生任何的價值,唯一的用途就是“保存備查”。儘管“啤酒與尿布”的故事,已經寫入教科書有10多年了,幾乎每一個接受過專業教育的同仁都知道數據挖掘能產生的價值,但是直到今天,我們對數據的處理依然停留在按預定指標進行統計這種很低的水平上。造成這種情況的原因有很多。一方面,由於業務人員和IT人員的工作鴻溝,使到即使能提出數據分析的需求都成了一個很大的困難。在各公司里保管數據的大多是IT人員,他們對業務的了解可能並非很深入,而業務人員也鮮有對數據有深入認識者,他們通常都缺乏必要的數學素質和知識基礎去進行建模和深入的分析工作。另一方面,數據分析專家具有深厚的數學處理能力,善於建模和構築算法,但是由於無法得到合適的需求,他們的能力也無從施展。另外數學家、統計學家們很多並不熟悉現代的IT軟硬體設備的特性,對於集群、分散式系統、大規模存儲、雲計算、資料庫等認識幾乎為零,對於算法的實現可能還停留在對著PC寫C語言程式的水平上,對於海量數據,無法利用現代化設備的能力,使到算法是否能真正實現變成生產力存有很大的疑問。

Dataguru網站成立的目標,正是要打破這種鴻溝。用新興的社交網站的形式,把各套用領域的業務專家、數據分析專家、IT專家以及這些領域的從業人員,學習者等等關聯起來,使到他們能高效率的溝通交流知識,使企業和用戶能在他們保存的海量數據中尋找出價值。由於這個目標猶如前人鍊石成金,於是給這個網站起了個也許不是很貼切的中文名字叫“煉數成金”。期待數年之後,“煉數成金”成為中國數據分析行業從業人員的主要集散地,黃埔軍校,成為中國首個具備重要影響力的主流數據分析類網站。

相關詞條

相關搜尋

熱門詞條

聯絡我們