簡介
《搜尋引擎技術基礎》由清華大學計算機系劉奕群博士、馬少平教授和百度公司洪濤博士、劉子正先生合作編寫,2010年7月由清華大學出版社出版。系主任孫茂松教授及百度公司董事長兼首席執行執行官李彥宏先生分別為該書作序。
清華大學計算機系歷來高度重視並積極鼓勵教師編寫高水平的教材。歷年編寫的計算機科學與技術領域的一系列教材已形成了品牌效應,在國內產生了非常廣泛的影響。
序言
面對浩瀚的全球資訊網信息海洋,人類並沒有如《莊子·秋水》中的河伯那樣望洋興嘆、徒喚奈何,這實在是拜搜尋引擎之功。搜尋引擎是人們從無遠弗屆、無深不入的全球資訊網中獲取信息不可或缺的手段,是人們遨遊於這個海洋里孜孜以求的“探海金針”。搜尋技術也因此成為當今最熱門的研究熱點之一,為信息檢索、數據挖掘、自然語言處理等眾多領域所共同關注。
與世界上其它國家的發展路徑有所區別,中國搜尋引擎的發展一直堅持本土化的道路,一方面,確保了數以億計的中文網民獲取網際網路信息過程的便利,另一方面,也確立了中文信息處理技術在世界範圍的影響。這是與以百度、搜狗、搜搜等為代表的一系列“國產”搜尋引擎的技術創新和產業發展分不開的。
技術創新和產業發展都需要優秀人才的支撐。培養對搜尋技術具有比較深刻理解的計算機專業高端人才是中文搜尋引擎乃至信息處理產業發展的迫切需求。然而,搜尋引擎屬於比較新的研究方向,其核心技術研發與知識體系演化的速度很快,如何從紛繁複雜的產品及其功能中凝鍊出搜尋引擎人才真正需要的知識與技能,是相關教學工作開展中面臨的重要問題。鑒於搜尋引擎發展過程中融合了研究界與產業界兩方面的創新成果,我們認為,解決這一問題也需要大學與搜尋引擎企業的共同努力。
作為這方面的一個積極探索,清華大學計算機系和百度公司從2009年春季起開始合作開設“搜尋引擎技術基礎”課程,希望為相關人才培養貢獻綿薄之力。課程受到了清華大學同學的歡迎與好評,也激勵了不少同學嘗試開展搜尋引擎方面的研究與創新。清華大學的劉奕群博士、馬少平教授與百度公司的洪濤博士、劉子正博士合作完成的這本書就是該課程的教材。作為為數不多的搜尋引擎技術中文教科書之一,該教材系統評介了搜尋引擎技術與產業發展的概況,對搜尋引擎領域得到廣泛套用的各種核心算法和套用模式進行了闡述與探討。“鴛鴦繡出從君看,更把金針度與人”。相信每一位對搜尋引擎感興趣的學生和學者都能通過學習或參考此書而有所收穫。
最後,祝讀者通過本書儘早成為搜尋引擎領域的“行內人”。全球資訊網上的信息構成了清風與明月交織的虛擬世界,“耳得之而為聲,目遇之而成色,取之無禁,用之不竭”。掌握了搜尋引擎技術,會使我們從一個更高的境界去品味、享受全球資訊網這個“造物者之無盡藏也”所帶來的無盡樂趣。
內容簡介
《搜尋引擎技術基礎》從教學的角度出發,對搜尋引擎的原理及開發技術進行了全面的介紹,內容包括搜尋引擎的基本原理、網頁抓取技術、信息預處理技術、信息索引技術、信息查詢技術和多媒體信息檢索技術。另外,《搜尋引擎技術基礎》還對搜尋引擎開發技術進行了詳細的討論。
《搜尋引擎技術基礎》適合高等院校計算機科學與技術專業及相關專業的高年級學生和研究生閱讀參考,也適合相關領域的工程技術人員參閱。
作者簡介
劉奕群,2003年本科畢業於清華大學計算機系並免試推薦直接攻讀博士學位,2007年獲博士學位後留校任教至今,目前在清華大學計算機系教授“搜尋引擎技術基礎”與“搜尋引擎產品設計與實踐”等課程。主要從事與搜尋引擎技術相關的網際網路套用研究工作,包括網路信息檢索、網路用戶行為分析、網路產品性能評價等。發表相關領域學術論文40餘篇,申請專利7項,並與百度公司、搜狐公司、微軟亞洲研究院等單位開展多項搜尋引擎技術方面的合作研究。
馬少平,1982年本科畢業於清華大學計算機系,1984年獲清華大學計算機系碩士學位後留校任教,1991-1992年在日本學習,1997年獲清華大學計算機系博士學位,1998年晉升為教授,1999年聘為博士生導師。現任清華大學智慧型技術與系統國家重點實驗室主任、中國人工智慧學會常務理事、知識工程專業委員會副主任、中國中文信息學會理事、信息檢索與內容安全專業委員會副主任。主要從事智慧型信息處理方面的研究工作,包括漢字識別、文本信息檢索、圖像信息檢索、中文古籍的數位化與檢索等。洪濤,1986年和1989年先後獲得北京大學計算機學士學位和心理學碩士學位,1995年在紐約州立布法羅大學計算機系取得博士學位。長期從事自然語言處理、搜尋引擎/信息檢索、網際網路廣告技術、數據挖掘、模式識別和金融數據分析建模等方面的研發工作。
計算機與網際網路技術圖書
計算機與網路圖書:力圖從傳播知識與套用層次談計算機與網際網路,從人文角度介紹相關知識與技術,以客觀的態度,獨特的視角,生動的方式,將重要實用的知識、信息、技能、經驗及時奉獻給讀者。 |