簡介
阿拉丁計畫是新一代搜尋引擎。阿拉丁是搜尋引擎公司百度推出的一個通用開放平台,它將接口開放給獨特信息數據的擁有者,從而解決現有搜尋引擎無法抓取和檢索的暗網信息。
解讀
該命名寓含著百度的這個平台可以像神燈那樣幫助用戶實現最便捷地獲取信息的願望。“阿拉丁”計畫由百度創建並於2009年年初面世,相關研髮結果也將相繼體現到目前的搜尋體系之中。
阿拉丁計畫旨在超越現有Web內容的限制,對包括眾多未納入搜尋引擎檢索體系的“暗網”在內的所有信息進行更深一步的分析、融合、處理,以使這些信息能最富有效率地被用戶通過搜尋引擎進行檢索,從而逐步實現“只在一個最為簡單的搜尋框裡面,蘊藏了全人類最為豐富多彩的信息世界!
目前能被搜尋引擎檢索到的信息只占所有信息中非常小的一部分,大部分信息存在於hidden web,亦即“暗網”之中。而“暗網”之所以存在,一方面是很多人類信息沒有Web化;另一方面即使一些信息Web化了,也沒有納入搜尋引擎的檢索體系。正是認識到“暗網”信息的存在和巨大價值,百度開始著手啟動“阿拉丁平台”研發計畫,期望能挖掘出更多存在於“暗網”之中的有價值信息,將更多的已知和未知信息分門別類融合,有序納入搜尋體系。
作用
阿拉丁平台會在以下幾個方面解決具體的問題:
海量數據。比目前的信息更廣,更深。即所謂照亮“暗海”。
動態頁面處理。PHP動態頁面早已不是什麼難題,可是電子商務平台的檢索結果呢?
信息精準分類。垂直網站的一個難點在於對於行業知識的深刻了解。淘寶平台也沒有完全解決服務的所有的行業。百度會做得多深?
垂直信息的數據挖掘。奇虎式社區傳播信息分析,百度會不會做?百度會不會藉機解決口碑指數並嫁接在有啊電子商務平台上?
評論
要想了解阿拉丁計畫,首先就要了解什麼是“暗網”,因為這個計畫是宣稱要照亮“暗網”,完全改變搜尋體驗的。
暗網(hidden web)這個概念對於大眾很新鮮,但是這是搜尋圈裡的老話題了。早在2003年就有美國人C·謝爾曼寫成了一本學術專著專門討論這一問題,只不過通常把它翻譯成“看不見”的網站,這本著作已經被譯成中文——《“看不見”的網站:Internet專業信息檢索指南》,成為信息檢索專業的必讀書目。
“看不見”的網站就是被搜尋引擎覆蓋不到的網站,以下就是對這些內容的分類及其原因。
用更加通俗的分類來說,“看不見”的網站只有兩種。
一種是技術的原因,很多網站本身不規範、或者說網際網路本身缺少統一規則,導致了搜尋引擎的爬蟲無法識別這些網站內容並抓取,這不是搜尋引擎自身就能解決的問題,而是有賴整個網路結構的規範化,而谷歌正在嘗試的“雲計算”就是要從根本解決這一問題。從這個意義上說,谷歌更符合所謂“阿拉丁計畫”,只不過谷歌沒有這樣提而已。
另一個原因則是很多網站根本就不願意被搜尋引擎抓取,比如考慮到著作權保護內容、個人隱私內容等等,很多網站都在禁止百度、比如最近最大的視頻分享網站優酷也宣布禁止百度一樣,這更不是搜尋引擎能解決的問題了。如果他們能被百度抓取到,就是百度違法了。
所以說,所謂的“阿拉丁計畫”不過是拿搜尋圈子裡一個古老的話題炒剩飯,它的本質就是擴大搜尋資料庫,這是搜尋引擎的常規工作,“最多就是最佳化過的蜘蛛加上一個新的競價排名表現界面”(著名網際網路部落格笨狸語)。
為什麼要在這個時候推出“阿拉丁計畫”?
既然“阿拉丁計畫”是這樣一個無中生有的東西,為什麼百度要用李彥宏和李一男兩位高管同時出來炒作這個概念呢?
目的只有一個——改變公眾對百度的負面印象。從今年9月的**奶粉公關事件以來,百度一直負面新聞不斷,尤其是最近一個月來央視曝光百度競價排名黑幕以後,百度股價急轉直下,百度急需要扭轉公眾視線,恢復其形象。
既然百度最根本的商業模式——競價排名都已經被公眾否定了,百度只好在人上做文章,現在百度有新聞價值的人物只有兩個,一個是李彥宏,最近李彥宏頻頻約見主流媒體,就是為了向公眾傳遞正面形象,這次李彥宏在宣傳阿拉丁計畫的同時還破天荒的錄製了人物訪談節目《財富人生》,也是希望用個人正面形象給百度加分。
而百度另一個有新聞價值的人物就是剛剛任職百度CTO的李一男,因為李一男與華為老總任正非的是是非非,加上“技術天才”的傳奇經歷,李一男已經成為媒體聚焦熱點。百度安排把李一男的處女秀定為宣傳“阿拉丁計畫”,也是為了最大限度的讓媒體宣傳這一計畫,並與“技術天才”掛鈎,顯示這一技術的高科技含量。
然而這其中還是有明顯破綻,李一男剛到百度不過一個月時間,百度方面宣稱阿拉丁計畫已經操作一年多,即便這一計畫真的存在,其成果也與李一男無關,而且李一男剛從通信領域跨行到網際網路搜尋,現在還只是熟悉業務階段,根本談不上領導什麼具體項目。
李一男在這次傳播中充當的角色不過是傀儡而已,百度之所以選擇這個傀儡是因為他最有新聞價值。
從“阿拉丁計畫”看百度未來
“阿拉丁計畫”想用神秘的技術話題轉移公眾視線,從而給公眾造成一種錯覺——百度正在用開創性的技術解決以往存在的各種問題。
這是百度近一段時間危機公關的定調,百度承認自己犯了錯誤,但把錯誤歸結為過去一年裡百度的CTO\CFO\COO等高管缺位導致的,也就是說百度所暴露出來的問題是李彥宏疏於監察基層,基層員工操作不規範所致。
現在,百度的高管全部到位,所以問題也就解決了。
果真是這樣嗎?
答案是否定的,無論是**奶粉暴露出來的百度新聞保護政策,還是央視曝光的醫藥競價黑幕,還有眾多網站狀告百度為拉業務隨意封站,這些問題的根本是競價排名——這一百度基本商業模式出了問題,也就是說百度不應該販賣自然搜尋結果,這一做法在美國曾經出現過,但現在已經為歐美、曰本等國法律所明文禁止了,所有搜尋引擎都在遵守谷歌所倡導的“不做惡”原則。
從百度近段時間一系列的安排可以看出來,百度不願意放棄競價排名這個搖錢樹,也是網際網路毒瘤,還是希望用各種藉口矇混過關,這才是最可怕的。