簡介
類比學習就是通過類比,即通過對相似事物進行比較所進行的一種學習 。
原理
類比學習的基礎是類比推理。所謂類比推理,就是指由新情況與記憶中的已知情況在某些方面類似,從而推出它們在其他方面也相似。顯然類比推理就是在兩個相似域之間進行的:
已經認識的域。它包括過去曾經解決過且與當前問題類似的問題及相關知識,稱為源域或者基(類比源),記為S。
當前尚未完全認識的域。它是遇到的新問題,稱為目標域,記為T。類比推理的目的就是從S中選出與當前問題最近似的問題以及求解方法來求解當前的問題,或者建立目標域中已有命題間的聯繫,形成新知識。
1.已經認識的域。它包括過去曾經解決過且與當前問題類似的問題及相關知識,稱為源域或者基(類比源),記為S。
2.當前尚未完全認識的域。它是遇到的新問題,稱為目標域,記為T。類比推理的目的就是從S中選出與當前問題最近似的問題以及求解方法來求解當前的問題,或者建立目標域中已有命題間的聯繫,形成新知識。
類比學習方法
類比學習方法通常有屬性類比學習和轉換類比學習兩種。
派生類比學習
於1986年,J.G.Carbonell提出了派生類比學習(DerivationalAnalogy)系統,它解決多步任務,在傳統類比方法中,不記錄解法的生成過程,只記錄最後生成的算法。而在派生類比系統中,不僅記錄最後的解法,而且記錄與解法有關的信息,這樣系統遇到困難時,可以對某個解法的生成過程進行深層分析,查明原因,根據新的條件,改造新解法。所以,派生類比方法比傳統方法具有更強的智慧型,這種技術也為在專家系統中進行基於事件推理(Case-Based Reasoning)提供了一個有利機制。
但是派生類比方法需要對問題解法生成過程進行分析,因此必然要降低解體效率。同時,這種分析涉及領域知識,增加了問題的複雜性。所以需要在進一步實現中對這種方法進行檢驗、修改和完善。
當前類比學習模擬的主要困難是基(類比源)的聯想,即給定一個目標域,再從無數個錯綜複雜的結構中找出一個或數個候選的基。在當前實際套用中,基都是由用戶給出的,這實際上決定了機器只能重複人們已知的類比,而不能幫助人們學到什麼。
舉例
最典型的類比學習方法是K-最近鄰方法(k-Nearest Neighbor,KNN),它屬於懶散學習法,相比決策樹 等急切學習法,具有訓練時間短,但分類時間長的特點。K-最近鄰算法可以用於分類和聚類中 。
基於案例的學習方法可以套用到數據挖掘的分類中。基於案例學習的分類計數的基本思想是:當對一個新案例進行分類時,通過檢查已有的訓練案例找出相同或者相近的案例,然後根據這些案例提出這個新案例的可能解。利用案例學習來進行數據挖掘的分類必須要解決案例的相似度度量,訓練案例的選取以及利用案例生成新案例的組合解等相關問題,並且它們也是當前研究的主要問題。
這種思路非常簡單,當預測未來情況或進行正確分類時,系統尋找與現有情況類似的事例,並選擇最佳的相同的解決方案,這種方法能用於很多問題的求解,並獲得好的結果,其缺點是系統不能生成匯總過去經驗的模組或規則。