部門簡介
自然語言處理是計算機科學、人工智慧以及語言學的交叉學科,旨在解決計算機與人類語言之間的互動問題。這其中包括對自然語言的分析、理解、生成、檢索、變換及翻譯等方面。
自百度誕生之日起,NLP技術就在其中起到了至關重要的作用,從百度為第一個用戶搜尋第一條結果開始,中文分詞這樣的基礎NLP技術便是整個搜尋引擎必不可少的組成部分。而伴隨著百度的快速發展,百度NLP也在同步地、甚至更快地發展。這個發展的加速度始於2010年春,隨著國際頂級自然語言處理專家 王海峰博士加盟百度,百度NLP的工作進行了重新梳理與規劃,除分詞、專名識別、query需求分析、query改寫等傳統方向得到加強外,也拓展了機器翻譯、機器學習、語義搜尋、語義理解、智慧型互動、深度問答、篇章理解等新的技術方向。在他的帶領下,NLP團隊已經由當初僅10餘人發展成為今天超過200人規模的團隊,團隊成員包含算法開發、系統實現、學術研究、語言學、產品設計和架構、前端、客戶端工程開發等多元化人才,全面支持百度各種產品套用。
技術與產品
百度NLP的特點在於“深入、前瞻、套用、創新”,既保持深入和前瞻的學術研究,又注重工業界產品套用的轉化,特別擅長在技術與產品結合方面作出創新。
近年來,NLP部門主導深度學習技術業界率先在搜尋和機器翻譯中上線;機器翻譯成為網際網路企業第一個國家科技進步獎;孵化了人工智慧產品 度秘和 小度機器人,AI技術率先起步、積澱深厚、站在浪尖;業界首次將線上學習技術套用於工業級產品,服務千萬級別用戶;個性化用戶建模技術在百度多條產品線開花結果;深度問答、句法/詞法、文摘生成等傳統NLP技術方向全覆蓋,並在搜尋等產品中上線,提升產品技術壁壘與用戶體驗。
部門願景
ACL歷史上唯一華人主席 王海峰常用“仰望星空,腳踏實地”來與NLP部門的同事們共勉,這使得NLP團隊接近星空的每一步都走得無比踏實安穩。讓計算機理解人類的語言,打造出真正擁有智慧型的產品,改變億萬用戶的生活,最終讓人們的生活更美好、也讓世界更美好。這是百度NLP人共同的理想,這個理想正在他們的堅持不懈的努力中一步步變為現實。