基本概念
ART是Adaptive Resonance Theory的英文縮寫,譯為自適應共振理論。ART網路是自適應共振理論網路。
ART網路的思路是當網路接收新的輸入時,按照預設定的參考門限檢查該輸入模式與所有存儲模式類典型向量之間的匹配程度以確定相似度,對相似度超過門限的所有模式類,選擇最相似的作為該模式的代表類,並調整與該類別相關的權值,以使後續與該模式相似的輸入再與該模式匹配時能夠得到更大的相似度。若相似度都不超過門限,就在網路中新建一個模式類,同時建立與該模式類相連的權值,用於代表和存儲該模式以及後來輸入的所有同類模式。
發源與現狀
1976年, 美國 Boston 大學學者 G. A.Carpenter 提出自適應共振理論(Adaptive Resonance Theory , ART ), 他多年來一直試圖為人類的心理和認知活動建立統一的數學理論, ART 就是這一理論的核心部分。隨後 G. A.Carpenter 又與 S.Grossberg 提出了ATR 網路。 經過了多年的研究和不斷發展,ART 網已有 3 種形式:ARTⅠ 型 處理雙極型或二進制信號; ART Ⅱ 型是 ART Ⅰ的擴展形式, 用於 處理連續型模擬信號;ART Ⅲ 型是分級搜尋模型,兼容前兩種結構的功能並將兩層神經元網路擴大為任意多層神經元網路 。由於 ART Ⅲ 型在神經元的運行模型中納入了生物神經元的生物電化學反應機制, 因而具備了很強的功能和可擴展能力。
遺忘舊樣本、舊知識的問題
對於有導師信號的學習網路,通過反覆輸入樣本模式達到穩定記憶,如果再加入新的樣本繼續訓練,前面的訓練結果就會逐漸受到影響,表現為對舊數據、舊知識的遺忘。無導師學習網路的權值調整式中都包含了對數據的學習項和對舊數據的忘卻項,通過控制其中學習係數和忘卻係數的大小達到某種折中。但這個係數的確定卻沒有一般的方法進行指導。所以,這兩類神經網路的學習都會出現忘卻舊樣本的情況,導致網路分類性能受到影響。通過無限擴大網路規模解決樣本遺忘是不現實的。
保證在適當增加網路規模的同時,在過去記憶的模式和新輸入的訓練模式之間作出某種折中,最大限度地接收新知識(靈活性)的同時保證較少的影響過去的模式樣本(穩定性),ART網路較好地解決了這一問題。
ART網路的辦法
ART網路及算法在適應新輸入模式方面具有較大的靈活性,同時能夠避免對先前所學模式的修改。
ART網路的思路是當網路接收新的輸入時,按照預設定的參考門限檢查該輸入模式與所有存儲模式類典型向量之間的匹配程度以確定相似度,對相似度超過門限的所有模式類,選擇最相似的作為該模式的代表類,並調整與該類別相關的權值,以使後續與該模式相似的輸入再與該模式匹配時能夠得到更大的相似度。若相似度都不超過門限,就在網路中新建一個模式類,同時建立與該模式類相連的權值,用於代表和存儲該模式以及後來輸入的所有同類模式。
網路類型
網路系統結構
ARTI網路結構由兩層神經元構成兩個子系統,分別為比較層C和識別層R,包含3種控制信號:復位信號R、邏輯控制信號G1和G2。
圖1 ARTI網路結構
C層結構
該層有n個神經元,每個接收來自3個方面的信號:外界輸入信號,R層獲勝神經元的外星權向量的返回信號和控制信號G1。C層神經元的輸出是根據2/3的多數表決原則產生,輸出值與三個信號中的多數信號值相同。
網路開始運行時,G1 = 1,識別層尚未產生競爭獲勝神經元,因此反饋信號為0。由2/3規則,C層輸出應取決於輸入信號,有C=X。當網路識別層出現反饋回送信號時,G1=0,由2/3規則,C層輸出取決於輸入信號與反饋信號的比較結果,如果xi = tij,則,ci = xi,否則ci=0。可以看出控制信號G1的作用是使得比較層能夠區分網路運行的不同階段,網路開始運行階段G1的作用是使得C層對輸入信號直接輸出,之後G1的作用是使C層行使比較功能,此時ci為xi和tij的比較信號,兩者同時為1,則ci為1,否則為0。可以看出R層反饋信號對C層輸出有調節作用。
圖2 C層結構
R層結構
功能相當於前饋競爭網,R層有m個神經元,代表m個輸入模式類,m可以動態增長,以設立新的模式類。C層的輸出向量C沿著R層神經元的內星權向量到達R層神經元,經過競爭在產生獲勝神經元處指示本次輸入模式的所屬類別。獲勝神經元輸出為1,其餘為0。R層每個神經元都對應著兩個權向量,一個是將C層前饋信號匯聚到R層的內星權向量,另一個是將R層反饋信號散發到C層的外星權向量。
圖3 R層結構
控制信號
信號G2檢測輸入模式X是否為0,它等於X各分量的邏輯或,如果xi全為0,則G2=0,否則G2=1。R層輸出向量各分量的邏輯或為R0,則信號G1=G2與(R0的非)。當R層輸出向量的各分量全為0而輸入向量X不是0向量時,G1為1,否則G1為0。G1的作用就是使得比較層能夠區分網路運行的不同階段,網路開始運行階段G1的作用是使得C層對輸入信號直接輸出,之後G1的作用是使C層行使比較功能,此時ci為xi和tij的比較信號,兩者同時為1,則ci為1,否則為0。Reset信號的作用是使得R層競爭獲勝神經元無效,如果根據某種事先設定的測量標準,Tj與X未達到設定的相似度,表明兩者未充分接近,於是系統發出Reset信號,使得競爭獲勝神經元無效。
網路運行原理
網路運行時接受來自環境的輸入模式,檢查輸入模式與R層所有已存儲模式類之間的匹配程度。R層所存儲的模式類是通過對應R層神經元的外星權向量體現出來的,對於匹配程度最高的獲勝神經元,網路要繼續考察其存儲模式類與當前輸入模式的相似程度。相似程度按照預先設計的參考門限來考察,可能出現如下的情況:
(1)如果相似度超過參考門限,將當前輸入模式歸為該類,全職調整規則是相似度超過參考門限的神經元調整其相應的內外星權向量,以使得以後遇到與當前輸入模式接近的樣本時能夠得到更大的相似度;其他權向量則不做改動。
(2)如果相似度不超過門限值,則對R層匹配程度次高的神經元代表的模式類進行相似度的考察,若超過門限,網路的運行回到情況A,否則仍然回到情況B。如果最終存儲的所有模式類與當前輸入模式的相似度都沒有超過門限,此時需在網路輸出端設立一個代表新模式類的神經元,用以代表及存儲該模式,以便參加以後的匹配過程。網路對所接受的每個新輸入樣本,都進行上面的運行過程。對於每個輸入模式,網路運行過程可歸納為4個階段。
匹配階段
網路在沒有輸入模式之前處於等待狀態,此時輸入端X=0。當輸入不全為0的模式X時, 允許輸入模式直接從C層通過,並前向傳至R層,與R層神經元對應的所用內星權向量 進行匹配計算:
選擇具有最大匹配度(具有最大點積)的競爭獲勝神經元
比較階段
使得R層獲勝神經元所連線的外星權向量 激活,從神經元j發出的n個權值信號返回到C層的n個神經元。此時,R層輸出不全為零,則C層最新的輸出狀態取決於R層返回的外星權向量與網路輸入模式X的比較結果。由於外星權向量是R層模式類的典型向量,該比較結果反映了在匹配階段R層競爭排名第一的模式類的典型向量與當前輸入模式X的相似度。相似度的大小可用相似度N0反應,定義為:
因為輸入xi為二進制數,N0實際上表示獲勝神經元的類別模式典型向量與輸入模式樣本相同分量同時為1的次數。輸入模式樣本中的非零分量數位N1
用於比較警戒門限為 ,在0~1之間取值,檢查輸入模式與模式類典型向量之間的相似度是否低於警戒門限,如果有:
則X與 的相似程度不滿足要求,網路發出Reset信號,使得第一階段的匹配失敗,競爭獲勝神經元無效,網路進入搜尋階段。如果有
表明X與獲勝神經元對應的類別模式非常接近,,稱X與 發生共振,第一階段匹配結果有效,網路進入學習階段。
搜尋階段
網路發出Reset重置信號後即進入搜尋階段,重置信號的作用是使前面通過競爭獲勝的神經元受到抑制,並且在後續過程中受到持續的抑制,直到輸入一個新的模式為止。由於R層中競爭獲勝的神經元被抑制,從而再度出現,因此網路又重新回到起始的匹配狀態。由於上次獲勝的神經元持續受到抑制,此次獲勝的必然是上次匹配程度排第二的神經元。然後進入比較階段,將該神經元對應的外星權向量與輸入模式進行相似度計算。如果所有R層的模式類,在比較階段相似度檢查中相似度都不能滿足要求,說明當前輸入模式無類可歸,需要在網路輸出層增加一個神經元來代表並存儲該模式類,為此將其內星權向量設計為當前輸入模式向量,外星權向量各分量全設定為1。
學習階段
在學習階段要對發生共振的獲勝神經元對應的模式類加強學習,使以後出現與該模式相似的輸入樣本時能獲得更大的共振。