數據標準

數據標準化(data standardization),指研究、制定和推廣套用統一的數據分類分級、記錄格式及轉換、編碼等技術標準的過程。

數據標準化是統計學上常用的方法,是為了消除不同屬性或樣方間的不齊性,使同一樣方內的不同屬性間或同一屬性在不同樣方內的方差減小;有時是為了限制數據的取值範圍,如[0,1]閉區間等。有些數量分析方法要求特殊的標準化過程,並將標準化作為其分析方法的一部分。比如,主分量分析(PCA)一般要求中心化,對應分析(CA)則要求對排序坐標進行標準化等。這些方法在套用前不必考慮標準化。現在說的標準化是指一般不特殊要求標準化的方法,即要不要進行標準化是由使用者自己決定。這樣的標準化必須在數量分析前完成。標準化過程也是通過某一計算將原始數據變成新的值,但它與原始數據集合中的其他值有關而不同於數據轉換。

相關詞條

相關搜尋

熱門詞條

聯絡我們