在諸多聚類算法中,蟻群算法是一種較新且較高效率的算法。蟻群算法在數據挖掘聚類中的套用所採用的生物原型為蟻群的蟻穴清理行為和蟻群覓食行為。這裡主要闡述兩種行為與聚類的結合點。在蟻群蟻穴清理行為中,蟻群會將蟻穴中分布分散的螞蟻屍體堆積成相對集中的幾個大堆。在聚類分析中,將這些分散分布的螞蟻屍體視為待分析的數據集合,而最終堆積而成的大堆則對應於最終的聚類結果。在蟻群的覓食行為中,螞蟻依據一定的機率選擇覓食路徑,使得螞蟻所尋找的路徑呈現多樣化狀態。在基於蟻群覓食行為的聚類分析中,將數據視為具有不同屬性的螞蟻,而將聚類結果視為食物源,所不同的是,此時認為存在多個食物源。這樣各個螞蟻通過一定的機率實現移動,並聚集在不同的食物源而實現聚類。
對於基於蟻穴清理行為的蟻群聚類算法,以死螞蟻堆積為例,基本機制是蟻堆對工蟻搬運死螞蟻具有吸引。蟻堆規模的大小決定著對工蟻的吸引大小,即蟻堆越大,越吸引工蟻將死螞蟻堆積到該堆,使得蟻堆的規模越來越大,由此而形成了一個正反饋。由以上機制可知,數據的空間分布狀態直接影響著聚類的結果。
這種聚類方法是J.L.Deneubourg於1991年最早提出的,而後E.Lumer和B.Faieta將該模型套用到了數據分析領域。