研究所通過承擔國家高技術研究發展計畫(863計畫)課題“中文信息處理套用基礎研究”,積極大膽地探索市場經濟條件下的科學研究模式和項目管理模式,打通語言學與計算機科學的壁壘,培養通識人才,著力從語義入手研究中文信息處理的核心問題。匯集北京大學、清華大學、上海交通大學、北京郵電大學、北京師範大學、中國科學院聲學研究所、教育部語言文字套用研究所、中國電子科技集團54所、北京大正語言知識處理研究院、深圳市桑夏高科技股份有限公司等單位的專家學者,綜合傳統計算語言學、概念層次網路理論(HNC)、基於內涵模型論的語義分析、全信息理論等多種理論,探索語言學與計算機科學的結合和上述各派理論在中文信息處理中的套用,以其套用功效反觀理論,完善理論,促進理論的基礎研究,建設基礎知識庫,開發面向計算機、通訊等行業領域的套用產品。
該課題總體上已達到國內領先的學術水平,在語義檢索、網路安全、語言知識萃取、語音識別對比、知識庫語料庫整合運用等方面都已取得了令人矚目的成果,部分研究成果已經達到國際領先水平。研究成果的轉化已取得較大社會效益,在中文信息處理語料庫和知識庫建設方面形成了一定規範,已有三個語料庫和知識庫成果套用到實際產品中,已有六個子課題推出了產品,並且有三個產品已經進入產業化階段。至2005年上半年,課題組共培養博士後5人,博士生22人,碩士生48人,發表與課題相關的論著共87項,其中863課題項目標註支持的論文64篇,出版專著5本,已登記和正在申請的專利及著作權21項。
通過組織實施“中文信息處理套用基礎研究”這一大型科研課題,研究所形成了一套高效的科學研究模式和項目管理模式,為學術研究和研究生培養提供了良好而又寶貴的環境。之後又承擔了國家“十一五”科技支撐計畫項目“中文信息處理套用研究與系統開發”。
研究所可接收博士後流動人員,每年都招收博士和碩士研究生。對研究生的培養特別注重交叉學科的知識結構,以及理論和套用相結合的研發能力。
研究所正處在蓬勃發展的成長階段,熱誠歡迎您前來學習或工作,加入我們的團隊,共同為我國中文信息處理事業的發展貢獻力量!