人物經歷
吳海山博士現就職於百度BDL(Big Data Lab,即百度研究院大數據實驗室,系百度研究院下設的三大實驗室之一。)
研究成果
時空數據研究
吳海山以百度的最新的商業選址Demo為例,對比過去的“調研-屬性-畫像-選址”模式,百度的模式則從分析用戶搜尋記錄出發。“例如為海底撈的分店進行選址時,我們就主要分析在百度和地圖上搜尋過海底撈的用戶的時空分布,這就能夠刻畫出他們的需求分布,再結合最佳化模型就能做出一些候選的地點,如果這裡沒有海底撈的分店,但是需求又很旺盛,我們的系統就會建議在這裡增加一個分店。”吳海山補充道,“相對於傳統的選址方法,百度直接反套用戶的需求,因此更勝一籌。”
BDL的另一個Demo“用戶O2O行為預測”是根據用戶的百度搜尋數據和定位數據來做用戶的出行行為預測,這樣就可以提前為用戶推送目的地路況和出行建議。比如當用戶搜尋了一個飯店的名字,百度就通過行為分析,預測用戶可能會在兩小時內到達,這樣就會替用戶進行預約、排隊、安排停車場等事宜。
中國鬼城量化研究
中國鬼城量化研究的項目負責人是百度大數據實驗室的數據科學家吳海山博士,他帶領其團隊來自北京大學劉瑜教授實驗室的實習生遲光華,首次使用定位數據來進行精細的鬼城檢測。在提出這一算法之前,對於鬼城的判斷多數是基於不可靠的測量,比如在夜間進行住宅建築燈光的簡單計數。這種測量方法忽略了旅遊業的季節性變化。許多城市或區域的人口密度與旅遊息息相關。而此次百度提出的這一算法相比以往的估算更加有效,首先是基於百度地圖的用戶數據分析可以判斷出人流的方向、起點和終點,從而更精確地了解到某個區域內的常住人口。其次,這一算法還可以根據季節和旅遊淡旺季區統計某個區域內的人口變化,從而更科學地判斷特定區域的人口密度。該監測方法將有助於當地政府在未來做出更好的規劃決策,而非盲目的加大投入,造成資源浪費。
該項目被美國權威雜誌《麻省理工科技評論》評為2015年度最佳研究之一。