簡述
DataCastle(以下簡稱DC)是中國最大的數據科學競賽平台,致力於通過最優秀的數據科學家的力量解決複雜的大數據問題。
通過來自不同行業、各種規模的公司/組織在平台上發布數據及問題,以眾包的方式,獲得科學的最優的數據結果和解決方案。
DC擁有來自全國各地的高校學子、大數據領域研究學者、企業技術精英, 為不同的行業、各種規模的公司與組織提供科學的最優的數據結果及解決方案。
參賽者除了獲得獎金和經驗外,還可以通過平台相互學習,提升自身能力,在競賽中收穫知識、財富、名譽和樂趣。
主要功能
大數據挖掘比賽——解決企業具體的算法問題
創意比賽——通過開放數據舉辦創意比賽
解決方案——眾籌方式徵集解決方案
DC競賽流程
參賽者的流程:
1)參與競賽
參賽者在平台註冊並登入後,選擇所要參加的競賽。
2) 組建隊伍
由隊長邀請其他參賽者加入自己的隊伍。每支隊伍的人數上限由主辦方確定並告知。
3)提交結果
參賽者用不同的技術,相互競爭來產生最好的算法模型或解決方案。對於大多數競賽,參賽者提交結果後立即可查看最新得分(基於主辦方選定的評分算法及測試集檔案)和排名。
4)獲取獎勵
競賽線上提交結束後,參賽者按照事先制定的競賽流程及規則,提交競賽模型或解決方案,經主辦方綜合評審,獲獎參賽者得到競賽獎勵(如獎金、工作機會等)。
發布方流程:
1)申請創建競賽
主辦方申請創建競賽需提供主辦方的相關信息,然後等待管理員審批。
2)管理員新建競賽
管理員接受申請後,於1到2個工作日內,通過電話或郵件反饋給主辦方競賽編輯連結。 3)主辦方編輯競賽
主辦方會登入競賽連結頁面編輯競賽信息,包括競賽報酬,結束時間,競賽規則,競賽數據等信息。
4)主辦方申請發布競賽
5)管理員審核、發布競賽
管理員在接到競賽發布申請後,將在1到2個工作日內發布競賽。競賽發布後,即處於活躍狀態,參賽者可參加競賽,即可通過DataCastle平台瀏覽競賽信息。 6)競賽管理
主辦方可對發布的競賽項目進行管理
DC平台目前的競賽類型有以下六種:
獎金賽:以獎金作為競賽報酬的競賽
招聘賽:以工作職位作為競賽報酬的競賽
大師賽:以級別達到大師的參賽者為目標群體的競賽
練習賽:為參賽者練習而舉辦的競賽
起步賽:以向參賽者介紹數據挖掘為目標的競賽
研究賽:為研究某一方面內容而舉辦的競賽
獎金、工作職位、知識、其他企業自定義的報酬將作為DC平台的競賽獎勵。
DC發展綜述
DataCastle是由電子科大最年輕正教授,《大數據時代》譯者周濤教授所提出的,隸屬於成都數聯尋英科技有限公司,作為一個大數據競賽平台,周濤教授希望將DC做成“問題”“人才”“解決方案”的聚集地。
2014年9月1日,DataCastle正式上線。上線後第一個競賽來自於第二屆中國大數據技術創新大賽。此次競賽主題是用戶瀏瀏覽新聞的模式分析及個性化 ,同時也是新聞推薦指定競賽平台。
創新大賽的競賽題目來自七大公司:百度、海量、南大、通用、思明、中科雲網、騰訊,共有888支團隊註冊參加比賽,其中有616支隊伍是通過DC平台來競賽的,有效成果提交達到4431份。
2014年12月11日,第二個競賽主題為學生成績排名預測、圖像搜尋競賽,第一天單支競賽註冊隊伍超過100支,第二天註冊隊伍超過200支,現註冊隊伍超過885支。
在這次的競賽活動中,一共有3045位參賽者,共有7550次成果有效提交。
DC平台用戶
DC團隊來自全國各地,有高校的本科生、研究生、博士生,大數據領域研究學者、企業技術精英。
以14年12月11日比賽為例,參賽者的學歷比例為:碩士生占43%、本科生占29%、博士生占17%、大數據從業者占11%,可見參賽者的學歷多以碩士生為主,其次是本科生、博士生,大數據行業從業者。
他們在機器學習、複雜網路分析、推薦系統、分散式計算、關聯分析、缺失信息預測和趨勢預測等方面有較強實力。
DC的slogan
人才、需求和解決方案的匯聚平台
DC平台價值
企業:為企業提供基於眾包模式的最優解決方案,提升僱主品牌,挖掘高素質人才。
人才:大數據人才的匯聚地,以行業問題進行歸類
團隊:配合良好、技術互補的技術團隊,是創業團隊的雛形
需求:通過競賽和項目發布,聚集產業界普適性需求
技術:針對重要問題,聚集全球領先的技術和算法方案
創意:以高價值數據驅動商業模式和產品創新