規則抽取

規則抽取是數據挖掘中的最重要和最關鍵的一步,它是指從經過處理的決策表中抽取出以規則形式表式的知識。IF...THEN....
目前,用於分類問題的方法可以分為兩類:符號方法和連線主義方法。符號方法基於決策樹、粗集理論等技術,得到的分類知識以分類規則的形式出現;而連線主義方法則以神經網路為代表,其知識蘊含在其結構中,不易為人所理解,因而一度被認為不適合於進行數據挖掘。然而由於神經網路在分類問題中具有分類精度高、魯棒性好等優點,很多的研究者致力於從神經網路中抽取分類規則。其基本思路都是基於搜尋的算法,對於任一給定的隱結點或輸出結點,先提取符號規則,然後對生成的規則按網路的傳導途徑進行連線和整理。有文獻提出了一種從訓練後的三層前饋網路中抽取分類規則的方法。首先對每個隱層結點的輸出值進行離散化;然後分別導出隱層結點與輸出層結點之間的規則(規則集1)和輸入層結點與隱層結點之間的規則(規則集2);最後將兩部分規則進行合併得到最終的分類規則。總的說來,從神經網路中抽取規則是一個複雜的過程,這其中隱結點的離散化過程不僅繁瑣,而且會丟失信息。另外,當數據量增多,網路規模變大時,網路訓練和規則抽取的時間代價將會非常大。

相關詞條

熱門詞條

聯絡我們