然而,當前的自然語言理解技術往往面臨著諸多的挑戰。一方面,自然語言理解技術涉及的語言語義知識過淺,生成的結果往往差強人意,而且可擴展性很差;另外一方面,融入了過多語言專家知識的系統,需要分析的層次過深,則導致計算特別費時費力。
靈玖軟體 依託國際領先的自然語言理解專家團隊,基於十餘年在中文、英文與日文的自然語言計算處理的研究成果,專注於提供自然語言理解的解決方案,已經取得了長足的進步。
靈玖軟體通過幾年的技術積累,結合當前的自然語言理解的需求,推出了LJParser自然語言理解中間件。經過近五年的套用和發展,靈玖LJParser產品已經可以在 不同作業系統、不同套用系統以及各種複雜的網路套用下高效運轉。
如果您遇到以下問題,那么請聯繫我們,我們將為您提供一整套的解決方案。
1. 中日英等語言詞語層面的分析
靈玖軟體基於條件隨機場(Conditional Random Field,簡稱CRF)模型,研製了中文分詞系統,系統切分速度可以達到每分鐘一千萬漢字,切詞準確率高達98%,詞性標註準確率高達98%。日語切分準確率高達99.2%。英文的詞法分析系統正確率幾乎100%。
2. 不同領域專業辭彙的自動抽取
LJParser擁有專業辭彙自動抽取系統,客戶只需要提供各種自然語言文本,LJParser將自動抽取出各類專業辭彙,500MB文本不到10分鐘即可生成近10萬專業詞條,並給出計算依據和語用環境特徵。抽查前1萬條數據,準確率可超過90%。
3. 文本關鍵語義分析
LJParser可以自動抽取一篇文章的關鍵語義,並採用5-10個關鍵字來表達文章的語義;同時計算出文章的摘要。
4. 海量文本集的自動分類聚類
靈玖軟體可以針對TB級別的海量文本集,按照用戶的需要,智慧型地分類聚類。
5. 網路多語言多編碼多格式文檔的正文標準化解析
當前網路文檔編碼格式多樣化,主要包括:Unicode,UTF-8,GBK,BIG5等;語種包括:英語、西班牙語、法語等拉丁語系;日語、藏語、維吾爾語等漢藏多語種;文檔格式包括:txt,html,pdf,doc,exce,ppt等,靈玖LJParser自然語言理解中間件提供標準化套件,實現編碼轉換,多語種處理,並解析各種文檔格式,去除廣告導航等噪音數據,提取正文文本,最終用於進一步的文本計算。
三、 LJParser的核心技術優勢
1. 核心算法全部經過了GB級別的網路真實數據測試,吸收了國內外最新的研究成果,性能高效,健壯性強,適合於實際網路業務套用。
2. 支持Windows,Linux等作業系統,支持C/C++;Java; php等多種語言開發接口;
3. 支持多數據源多格式多編碼處理;
相關詞條
-
NLP[百度自然語言處理部]
百度自然語言處理部(NLP)是百度歷史最悠久的基礎技術部門之一,以“理解語言,擁有智慧型,改變世界”為使命,開展包括自然語言處理、機器學習、數據挖掘在內的...
部門簡介 技術與產品 部門願景 -
程式理解
程式理解是一個從電腦程式中獲取知識信息的過程。這些知識信息可以套用於程式排錯、增強程式、重用程式以及整理文檔等方面的工作上。程式理解是軟體工程領域裡的...
任務 內容 相關技術 基本策略 具體方法 -
王斌[信息檢索、大數據專家]
王斌,小米公司自然語言處理首席科學家 ,原中國科學院信息工程研究所研究員、博導、第二研究室信息檢索課題組組長,研究方向為信息檢索與自然語言處理。《現代信...
人物生平 研究方向 出版著作 個人生活 興趣愛好 -
語言信息處理
Language Processing)或自然語言理解(NLU...,對自然語言的處理還一 直無法突破單句的界限,從而阻礙了複句和語篇的理解和生成...機器更好地識別和處理自然語言。有專家認為,開發第五代計算機的難點不在技術...
定義 發展 研究對象 基本模型 基礎 -
人工智慧(第2版)
圖書簡介工智慧型是研究理解和模擬人類智慧型、智慧型行為及其規律的一門學科...規劃系統、自然語言處理、信息檢索、語言翻譯、語音識別、機器人和網際網路智慧型...理解和感覺,如運動技能、預測環境能力、處理複雜世界的能力、在學校的表現和...
圖書簡介 圖書前言 圖書目錄 -
計算語言學
語言學(Mathematical Linguistics),自然語言理解...的自然語言理解也已奠定了基礎,與此相聯繫的文字自動識別、言語識別和言語合成等項...—語義分析技術的自然語言理解系統脫穎而出,在語言分析的深度和難度方面都比...
簡介 定義別名 產生背景 發展歷史 基本內容 -
計算機思維
克服了人類自然語言上述“三位一體性”的“缺陷”。計算機能夠快速、準確地...也就是將我們人類自然語言中的思想與方法、方法與對象、思想與對象實行了分離...工作,正是因為計算機語言幫助我們克服了人類自然語言“三位一體”的“缺陷...
思維介紹 局限 邏輯分析 -
計算動詞理論
中文學術專著 計算動詞理論是自然語言可測量化的必然的技術發展方向...的手段,是動詞推理的基礎。動詞規則庫是利用自然語言來建模工業系統的最為有效...不符合自然語言推理的實際情況。因而本章討論的定性特徵不變的形容詞推理較模糊...
動詞理論 提出背景 發展歷程 計算動詞理論的優越性 計算動詞理論的套用 -
黃昌寧
人工智慧和自然語言理解的教學科研工作。 1955年,年僅十八歲...。1983年黃昌寧遠赴美國耶魯大學進修,主攻人工智慧和自然語言理解方面...學會的主席,從事自然語言理解的研究已有十多年歷史,是80年代初美國這一...
人物生平 挑戰權威 獻身科研 受聘微軟 躊躇滿志