hnc

HNC自然語言處理技術(國家“973”計畫項目G1998030506)是一種具有原始創新特點的自然語言理解處理技術。

主要特點

1.HNC自然語言理解處理技術 2.Hierarchical Network coding策略

開發背景

HNC自然語言處理技術(國家“973”計畫項目G1998030506)是一種具有原始創新特點的自然語言理解處理技術。該技術以中科院聲學所黃曾陽研究員創立的概念層次網路(簡稱HNC)理論為指導。HNC理論認為:自然語言理解的本質是概念聯想脈絡激活、擴展、濃縮、轉換與存儲的全過程運作。激活運作的要點是語句的理解;擴展與濃縮運作的要點是段落與篇章的理解,轉換與存儲的要點是記憶與學習。語句的理解必須定位於概念聯想脈絡運作全過程的激活。並且建立了自然語言的概念空間。語句及自然語言的理解,就是從語言空間向語言概念空間的映射過程。這一處理方案,使計算機能夠進入自然語言的語義深層,在“懂”的基礎上完成對自然語言的各種處理。該技術在漢語語句理解處理方面居國際領先水平。

套用前景

漢字具有表意的特點,漢語是意合型語言,不使用形態變化,因此對它的處理,不同於有形態變化的語言,必須結合漢語的特點探索漢語自己的理解處理道路。HNC理論正是誕生於漢語的特點――“字義基元化,詞義組合化”,它是進入語言深層對自然語言進行處理的理論。HNC自然語言處理技術,對於方塊字的漢語,具有特殊重要的意義,具有巨大的市場和廣闊的套用前景。該技術可以形成下述系統,或大大提高下述系統的處理能力:書面語雙向翻譯系統、漢語文字文本孤群發現及孤魂消除處理系統、基於文本內容的網路信息搜尋服務系統、文本分類系統、人機互動學習系統、漢語套用文語言助理小系統、常規口語處理的輔助理解系統、特定領域或要求的情報發掘系統、漢語語言研究服務系統。

HNC自然語言處理技術的建立與發展,標誌著我國在自然語言理解處理及語言信息-知識轉換方面占據了有利位置,有望在資訊時代的高級階段占領技術制高點,取得領先地位。

軟體策略

Hierarchical Network coding策略,這種方法根據信息的重要性將信息分為A,B,C三類,然後將A分為a1和a2,B分為b1和b2,C分為c1和c2。編碼數據包有三類,分別為N1,N2,N3。N1為a1,a2的隨機線性組合,N2為a1,a2,b1,b2的隨機線性組合,N3為將a1,a2,b1,b2,c1,c2的隨機線性組合。在client端,先接收N1,解碼出A,再接收N2,解碼出B,最後接收N3,解碼出C。

優點

(1)可以降低解碼的延遲,在接收到A時就將A播放,比RNC要優越。

(2)在多server的P2P網路中,與傳統的P2P傳輸方式比,server的要求的存儲量減少了

(3)可以使用TCP流

缺點

在server可以保證其到client鏈路速率相同時,該方法不如Coordinated 技術

相關詞條

相關搜尋

熱門詞條

聯絡我們