通用語法分析程式
正文
綜合不同語法分析技術的形式特徵並建立統一的數據結構,以模擬各種自然語言處理技術的實驗性軟體支援系統,又稱通用語法處理程式,英文縮寫 GSP,它是1973年R.卡普蘭為了研究語法分析和回響生成的需要提出的。圖表(chart)是通用語法處理程式的核心部分,用來表示語法和輸入語句的一種單一的數據結構。圖表實質上是語法樹的一種修正形式。在語法樹中每一條有向弧都代表弧線射出節點和弧線進入節點之間的“父子”關係。如果從一個節點射出若干條弧線分別通向不同的子節點,那么這些子節點自左至右地形成一種“兄弟”關係。但是在語法樹中,節點之間的父子關係是用有向弧顯式表出的,而兄弟關係只是一種隱含關係,並沒有用弧線連線。從每一語法樹構造其對應的圖表須遵循兩條規則:①將所有表示父子關係的弧線刪除,但保留父節點到其長子節點的弧線,同時將所有兄弟節點用有向弧從兄到弟地(即從左到右方向)連線起來;②節點與弧線標號互換,原來的節點標號變成了弧線標號,原來弧線沒有標號,現在則是節點沒有標號。圖1是名詞短語的語法樹及其對應的分析圖表。



參考書目
R.Rustin,ed.,Natural Language Processing,Algorithmics Press, New York,1973.