版本空間

版本空間

版本空間(version space)是概念學習中與已知數據集一致的所有假設(hypothesis)的子集集合。 版本空間學習是機器學習的邏輯方法,特別是二進制分類。版本空間學習算法搜尋預定空間的假設,被視為一組邏輯語句。 對於二維空間中的“矩形”假設(右圖),綠色加號代表正類樣本,紅色小圈代表負類樣本。 GB 是最大泛化正假設邊界(maximally General positive hypothesis Boundary), SB 是最大精確正假設邊界(maximally Specific positive hypothesis Boundary). GB與SB所圍成的區域中的矩形即為版本空間中的假設,也即GB與SB圍成的區域就是版本空間。 在一些需要對假設的泛化能力排序的情形下,就可以通過GB與SB這兩個上下界來表示版本空間。在學習的過程中,學習算法就可以只在GB、SB這兩個代表集合上操作。

來源

版本空間的概念最初由 Mitchell 作為在解搜尋方法下,理解監督學習基礎問題的框架提出。

套用

雖然與版本空間相關的基本的“候選者剔除”搜尋方法並不是一種流行的學習算法,但是還是有許多實際套用被開發出來。例如Sverdlik, W.; Reynolds, R.G. (1992)

版本空間的概念在主動學習(active learning)中也有提到。在基於池的樣例選擇算法中有一種“基於版本空間縮減的方法”,這類方法選擇那些訓練後能夠最大程度縮減版本空間的樣例進行標註。

相關詞條

熱門詞條

聯絡我們