樹分類器
正文
![樹分類器](/img/d/dae/nBnauM3X0cjMzcjNyQzMxgDM5ETMwADMwADMwADMwADMxAzLzEzL0czLt92YucmbvRWdo5Cd0FmL0E2LvoDc0RHa.jpg)
每個終止節點對應一個類別,為了提高樹分類器的正確識別率,允許有幾個葉對應同一個類別。非終止節點對應的類別是它的子節點所對應的類別的總和。
樹分類器的設計需要解決以下幾個問題:
① 確定樹的結構。樹結構影響正確識別率和平均判別次數,一般根據所研究問題的性質確定某種與正確識別率有聯繫的目標函式代替正確識別率,作為判斷結構是否合理的標準,從樹根出發在每個非終止節點尋找使目標函式達到最小(或最大)的子節點和對應的類別配置。
② 對每個非終止節點選擇用於判別的特徵子集,分枝限界算法能提供選擇最佳特徵子集的有效方法。
③ 為每個非終止節點確定判別函式,最常用的判別函式是線性判別函式。
由於在每個非終止節點需要判別的類別比較少,在多數情況下,可以用較少的特徵和較簡單的判別函式(因而較少的計算機時間)以達到總體上比較好的分類效果。