網路化數據挖掘的基本思想是採用複雜網路的方法來建模,通過將大規模實際數據對象及對象間的關係映射為網路拓撲的形式,採用複雜網路的理論和方法,按照需要的粒度對網路拓撲結構進行分析和挖掘,最終發現蘊涵在其中的、反映事物間聯繫規律的信息和知識。 網路化數據挖掘(Networked Data Mining),就是將網路拓撲作為一種知識表示方式,採用複雜網路的方法來建模人類從數據到知識的不確定性認知過程。
複雜網路的研究方法在分析和建模真實複雜系統的網路結構和拓撲性質時取得了巨大成功,但很少有人考慮到用複雜網路方法研究數據挖掘中大規模數據對象間的相互關係,從而增強數據挖掘結果的準確性和有效性。李德毅院士提出了網路化數據挖掘理論及方法,在這方面進行了卓有成效的研究。
網路化數據挖掘不同於傳統的數據挖掘,傳統的數據挖掘方法不涉及數據源樣本的拓撲結構,難以從系統整體結構和動態演化的角度,發現多視圖、多粒度的整體結構知識。一般而言,粒度越細,網路越微觀,個性化程度就越多;反之,粒度越粗,網路越巨觀,共性就越明顯。
網路化數據挖掘可套用於大眾互動的網際網路環境下群體智慧型及其湧現機理研究。