自然語言理解專家

因此,關於計算機對自然語言的理解一般是從實用的角度進行評判的。 然而,當前的自然語言理解技術往往面臨著諸多的挑戰。 靈玖軟體通過幾年的技術積累,結合當前的自然語言理解的需求,推出了LJParser自然語言理解中間件。

基本信息

隨著社會的日益信息化,人們越來越強烈地希望用自然語言同計算機交流。自然語言理解是計算機科學中的一個引人入勝的、富有挑戰性的課題。從計算機科學特別是從人工智慧的觀點看,自然語言理解的任務是建立一種計算機模型,這種計算機模型能夠給出象人那樣理解、分析並回答自然語言(即人們日常使用的各種通俗語言)的結果。現在的計算機的智慧型還遠遠沒有達到能夠象人一樣理解自然語言的水平,而且在可預見的將來也達不到這樣的水平。因此,關於計算機對自然語言的理解一般是從實用的角度進行評判的。自然語言理解系統可以用作專家系統、知識工程、情報檢索、辦公室自動化的自然語言人機接口,有很大的實用價值。
然而,當前的自然語言理解技術往往面臨著諸多的挑戰。一方面,自然語言理解技術涉及的語言語義知識過淺,生成的結果往往差強人意,而且可擴展性很差;另外一方面,融入了過多語言專家知識的系統,需要分析的層次過深,則導致計算特別費時費力。
靈玖軟體 依託國際領先的自然語言理解專家團隊,基於十餘年在中文、英文與日文的自然語言計算處理的研究成果,專注於提供自然語言理解的解決方案,已經取得了長足的進步。
靈玖軟體通過幾年的技術積累,結合當前的自然語言理解的需求,推出了LJParser自然語言理解中間件。經過近五年的套用和發展,靈玖LJParser產品已經可以在 不同作業系統、不同套用系統以及各種複雜的網路套用下高效運轉。
如果您遇到以下問題,那么請聯繫我們,我們將為您提供一整套的解決方案。
1. 中日英等語言詞語層面的分析
靈玖軟體基於條件隨機場(Conditional Random Field,簡稱CRF)模型,研製了中文分詞系統,系統切分速度可以達到每分鐘一千萬漢字,切詞準確率高達98%,詞性標註準確率高達98%。日語切分準確率高達99.2%。英文的詞法分析系統正確率幾乎100%。
2. 不同領域專業辭彙的自動抽取
LJParser擁有專業辭彙自動抽取系統,客戶只需要提供各種自然語言文本,LJParser將自動抽取出各類專業辭彙,500MB文本不到10分鐘即可生成近10萬專業詞條,並給出計算依據和語用環境特徵。抽查前1萬條數據,準確率可超過90%。
3. 文本關鍵語義分析
LJParser可以自動抽取一篇文章的關鍵語義,並採用5-10個關鍵字來表達文章的語義;同時計算出文章的摘要。
4. 海量文本集的自動分類聚類
靈玖軟體可以針對TB級別的海量文本集,按照用戶的需要,智慧型地分類聚類。
5. 網路多語言多編碼多格式文檔的正文標準化解析
當前網路文檔編碼格式多樣化,主要包括:Unicode,UTF-8,GBK,BIG5等;語種包括:英語、西班牙語、法語等拉丁語系;日語、藏語、維吾爾語等漢藏多語種;文檔格式包括:txt,html,pdf,doc,exce,ppt等,靈玖LJParser自然語言理解中間件提供標準化套件,實現編碼轉換,多語種處理,並解析各種文檔格式,去除廣告導航等噪音數據,提取正文文本,最終用於進一步的文本計算。
三、 LJParser的核心技術優勢
1. 核心算法全部經過了GB級別的網路真實數據測試,吸收了國內外最新的研究成果,性能高效,健壯性強,適合於實際網路業務套用。
2. 支持Windows,Linux等作業系統,支持C/C++;Java; php等多種語言開發接口;
3. 支持多數據源多格式多編碼處理;

相關詞條

相關搜尋

熱門詞條

聯絡我們