定義
所謂句法分析(Parsing)就是指對句子中的詞語語法功能進行分析,比如“我來晚了”,這裡“我”是主語,“來”是謂語,“晚了”是補語。
性質
無
套用
句法分析現在主要的套用在於中文信息處理中,如機器翻譯等。它是語塊分析(chunking)思想的一個直接實現,語塊分析通過識別出高層次的結構單元來簡化句子的描述。從不同的句子中找到語塊規律的一條途徑是學習一種語法,這種語法能夠解釋我們所找到的分塊結構。這屬於語法歸納的範疇。
迄今為止,在句法分析領域中存在很多爭議,也許你會發現恰巧有人提出了與你正在努力研究的語法歸納程式偶然產生的相似的句法結構,而且這些也可能已經被當成了句法結構模型的證據。但是,這些找到的結構依賴於學習程式中隱含的歸納偏置。這也指明了另外一個方向,我們需要事先知道模型能夠找到什麼樣的結構,同時應該首先確定我們對句子進行句法分析的目的。這裡有各種可能的目的:使用句法結構作為語義解釋的第一步;識別短語語塊,為信息檢索系統的索引服務;構建一個機率句法分析器作為一個優於n元語法的語言模型。這些問題的共同目標是構建這樣的一個系統:對於任意的句子都能夠主產生證明有用的結構,也就是要構建一個句法分析器。
句法分析的三種不同的途徑可以利用機率:
1、利用機率來確定句子:一種可能的做法是將句法分析器看成是一個詞語網路上的語言模型,用來確定什麼樣的詞序列經過網路的時候會獲得最大機率。
2、利用機率來加速語法分析: 第二個目標是利用機率對句法分析器的搜尋空間進行排序或剪枝。這使得句法分析器能夠在不影響結果質量的情況下儘快找到最優的分析途徑。
3、利用機率選擇句法分析結果: 句法分析器可以從輸入句子的眾多分析結果中選擇可能性最大的。