工具分類
數據挖掘工具根據其適用的範圍分為兩類:專用挖掘工具和通用挖掘工具。
專用工具
專用數據挖掘工具是針對某個特定領域的問題提供解決方案,在涉及算法的時候充分考慮了數據、需求的特殊性,並作了最佳化。對任何領域,都可以開發特定的數據挖掘工具。例如,IBM公司的AdvancedScout系統針對NBA的數據,幫助教練最佳化戰術組合。特定領域的數據挖掘工具針對性比較強,只能用於一種套用;也正因為針對性強,往往採用特殊的算法,可以處理特殊的數據,實現特殊的目的,發現的知識可靠度也比較高。
通用工具
通用數據挖掘工具不區分具體數據的含義,採用通用的挖掘算法,處理常見的數據類型。例如,IBM公司Almaden研究中心開發的QUEST系統,SGI公司開發的MineSet系統,加拿大SimonFraser大學開發的DBMiner系統。通用的數據挖掘工具可以做多種模式的挖掘,挖掘什麼、用什麼來挖掘都由用戶根據自己的套用來選擇。
主要因素
數據挖掘是一個過程,只有將數據挖掘工具提供的技術和實施經驗與企業的業務邏輯和需求緊密結合,並在實施的過程中不斷的磨合,才能取得成功,因此我們在選擇數據挖掘工具的時候,要全面考慮多方面的因素,主要包括以下幾點:
(1) 可產生的模式種類的數量:分類,聚類,關聯等
(2) 解決複雜問題的能力
(3) 操作性能
(4) 數據存取能力
(5) 和其他產品的接口