通用語法分析程式

通用語法分析程式

正文

綜合不同語法分析技術的形式特徵並建立統一的數據結構,以模擬各種自然語言處理技術的實驗性軟體支援系統,又稱通用語法處理程式,英文縮寫 GSP,它是1973年R.卡普蘭為了研究語法分析和回響生成的需要提出的。
圖表(chart)是通用語法處理程式的核心部分,用來表示語法和輸入語句的一種單一的數據結構。圖表實質上是語法樹的一種修正形式。在語法樹中每一條有向弧都代表弧線射出節點和弧線進入節點之間的“父子”關係。如果從一個節點射出若干條弧線分別通向不同的子節點,那么這些子節點自左至右地形成一種“兄弟”關係。但是在語法樹中,節點之間的父子關係是用有向弧顯式表出的,而兄弟關係只是一種隱含關係,並沒有用弧線連線。從每一語法樹構造其對應的圖表須遵循兩條規則:①將所有表示父子關係的弧線刪除,但保留父節點到其長子節點的弧線,同時將所有兄弟節點用有向弧從兄到弟地(即從左到右方向)連線起來;②節點與弧線標號互換,原來的節點標號變成了弧線標號,原來弧線沒有標號,現在則是節點沒有標號。圖1是名詞短語的語法樹及其對應的分析圖表。

通用語法分析程式通用語法分析程式
通用語法分析程式通用語法分析程式
通用語法分析程式通用語法分析程式
用圖表還可以有效地表示“森林”──由若干棵不連的樹組成的有序集合。圖2表示由名詞短語和動詞的語法樹形成的森林及其對應的圖表。圖3表明用圖表還可以簡明有效地表示詞或短語的多義現象(稱為歧義性)。通用語法處理程式除了建立圖表分析技術外,還在遞歸、回溯和指針移動等方面有較完善的控制策略。系統還有程式協同功能,各程式(過程)能掛起暫停或繼續運行。圖表是表示自然語言句法的適用數據結構,運用圖表技術有利於將語法中較小組成部分集結為較大組成部分以便分析,因而在自然語言處理系統的研製中受到重視。
參考書目
 R.Rustin,ed.,Natural Language Processing,Algorithmics Press, New York,1973.

配圖

相關連線

相關詞條

相關搜尋

熱門詞條

聯絡我們