“機率上下文無關文法”的英文縮寫
PCFG(Probabilistic Context Free Grammar),機率上下文無關文法,或為PSGF(Stochastic Context Free Grammar),隨機上下文無關文法。
定義一個機率上下文無關文法(PCFG)是一個五元組(N,∑,S,R,P):
(1)一個非終結符集N
(2)一個終結符集∑
(3)一個開始非終結符S∈N
(4)一個產生式集R
(5)對於任意產生式r∈R,其機率為P(r)
PCFG是CFG的擴展,PCFG的規則表示形式為:A→α p,其中A為非終結符,p為A推導出α的機率,即p=P(A→α),該機率分布必須滿足如下條件:
∑P(A→α)=1
也就是說,相同左部的產生式機率分布滿足歸一化條件。
分析樹的機率等於所有使用規則機率之積。
(1)位置不變性(place invariance):子樹的機率不依賴於該子樹所管轄的單詞在句子中的位置;
(2)上下文無關性(context-free):子樹的機率不依賴於子樹控制範圍以外的單詞;
(3)祖先無關性(ancestor-free):子樹的機率不依賴於推導出子樹的祖先節點。
(1)給定一個句子,估計產生句子的機率;
(2)在語句句法結構有歧義的情況下,如何快速選擇最佳的句法分析;
(3)如何從語料庫中訓練文法的參數。