剪枝策略

常用的剪枝策略有以下幾種:
1. 基於機率值的剪枝策略[41]。將每一個基元的發音變化,根據機率從大到小排序,若其機率值大於一個預先設定的閾值,則保留,否則丟棄;
2. 基於固定數目的剪枝策略。依據機率值將每一個基元發音變化按降序排列,前n 個保留,大於n 的丟棄;
3. 累積機率策略[42]。每一個音素的發音變化根據機率從大到小排序後,按大到小的順序依次累加,當其和超過某一個閾值的時候就停止,其和在閾值範圍內的發音變化則保留,其餘的丟棄;
4. 基於uigram 的剪枝策略[43]。根據音素在訓練數據中出現的頻率決定是否擁有多個發音變化。換句話說,常用詞在最終的發音字典中更有可能包含多個發音變化。
5. 相對最大機率策略(relative-to-maximum)。取每一個基元的發音變化機率的最大值Pmax 作為參考值,其它發音變化的機率值大於參考值時則保留,否則丟棄。這個策略就是保留機率值相對於最大機率值的一定區間範圍內的發音變化。

相關詞條

熱門詞條

聯絡我們