聚類分析按照樣本點之間的親疏遠近程度進行分類。為了使類分得合理,必須描述樣本之間的親疏遠近程度。刻畫聚類樣本點之間的親疏遠近程度主要有以下兩類函式:
(1)相似係數函式:兩個樣本點愈相似,則相似係數值愈接近1;樣本點愈不相似,則相似係數值愈 接近0。這樣就可以使用相似係數值來刻畫樣本點性質的相似性。
(2)距離函式:可以把每個樣本點看作高維空間中的一個點,進而使用某種距離來表示樣本點之間的相似性,距離較近的樣本點性質較相似,距離較遠的樣本點則差異較大。
需要由領域專家確定採用哪些指標特徵變數來精確刻畫樣本的性質,以及如何定義樣本之間的相似性測度。
相關詞條
-
相似性[數學概念]
數學上,相似性指兩個圖形的形狀完全相似。若存在兩個點的集,其中一個能透過放大縮小、平移或旋轉等方式變成另一個,就說它們具有相似性。 相似性所屬現代詞,指...
自相似性 分類 結構相似性 餘弦相似性 化學相似性 -
文檔相似性檢測工具
文檔相似性檢測工具是通過比對源文檔和目標文檔相似性給出相似度結果的一種信息處理系統。由武漢大學信息管理學院出版科學系教師瀋陽副教授研發的ROST文檔相似...
目前的工作基礎 系統 優點 缺點 相關研究 -
線上社交網路節點間相似性
線上社交網路中,節點與節點之間通常具有一定的相似性。根據不同的指標,可以度量節點不同方面的相似程度。
一、定義 二、基於網路半結構信息定義節點相似性 三、基於網路結構信息定義節點相似性 -
軟體過程能力度量
軟體過程能力度量(the measurement of the software procedure capability)SEI CMM等級4描述了兩...
-
粒計算及其不確定信息度量的理論與方法
本書從理論上探討知識粒的公理化定義,研究知識粒與不確定信息度量方法之間相互融合的表示形式,建立基於粗糙集的粒計算度量和處理不確定信息的理論體系。對粗糙集...
-
圖像匹配
以確定同名點。灰度匹配通過利用某種相似性度量,如相關函式、協方差函式、差...視窗的灰度矩陣,與參考圖像的所有可能的視窗灰度陣列,按某種相似性度量方法...。另外,基於特徵的匹配方法的相似性度量也比較複雜,往往要以特徵屬性、啟發式...
名詞定義 詞語釋義 概述 匹配分類 匹配關鍵要素 -
高維數據挖掘技術研究
1.3.1高維空間中的距離函式或相似性度量函式1.3.2高效的高維數據相似性...高維索引結構在性能上的局限2.6本章小結3一種新的高維數據相似性度量函式...的規範化3.5.3對高維數據中空值的處理3.6Hsim()與其他相似性度量...
內容提要 編輯推薦 目錄 -
餘弦相似度
簡介餘弦相似性通過測量兩個向量的夾角的餘弦值來度量它們之間的相似性。0...距離度量,而對於第一種意義的“餘弦相似性”則不然。然而,對於大多數的用途...餘弦相似性最常用於高維正空間。例如在信息檢索中,每個詞項被賦予不同的維度...
簡介 定義 性質 套用 另見 -
多維尺度法
七點標尺或其它度量進行配對品牌評估,這些數據被稱為相似性判別數據。也可以採用其它方法,比如要求調查對象將所有的品牌配對按相似性強弱由大到小排序。再...數據之分,直接數據源於相似性判斷,而推斷數據則源於對相關屬性的評估...
定義 套用範圍 實施步驟 實例分析 假設