主元分析法

主元分析法(PCA)是目前基於多元統計過程控制的故障診斷技術的核心,是基於原始數據空間,通過構造一組新的潛隱變數來降低原始數據空間的維數,再從新的映射空間抽取主要變化信息,提取統計特徵,從而構成對原始數據空間特性的理解。

簡介

新的映射空間的變數由原始數據變數的線性組合構成,從而大大降低了投影空間的維數。由於投影空間統計特徵向量彼此正交,則消除了變數間的關聯性,簡化了原始過程特性分析的複雜程度。

基本思路

主元分析法的基本思路是:尋找一組新變數來代替原變數,新變數是原變數的線性組合。從最佳化的角度看,新變數的個數要比原變數少,並且最大限度地攜帶原變數的有用信息,且新變數之間互不相關。其內容包括主元的定義和獲取,以及通過主元的數據重構。

定義

假設一個要研究的系統僅包含兩個變數 x1 , x2 。將兩個變數的樣本點表示在一個平面圖上,可以看出所有的樣本點集中在一個扁型的橢圓區域內。因為樣本點之間的差異顯然是由於 x1 , x2 的變化而引起的。我們可以看出在沿著橢圓橫軸的方向上( y1 )的變動較大,而縱軸方向上( y2 )的變動較小。這說明了樣本點的主要變動都體現在橫軸方向上,比如 85%以上,那么這時就可以將 y 2忽略而只考慮y1 。這樣兩個變數就可以簡化為一個變數了。我們稱 y1 , y 2分別為 x1 , x2 的第一主元和第二主元。一般情況下,如果樣本有 p 個變數,若樣本之間的差異能由 p 個變數的 K 個(K<p)個主元成分來概括,那么就能用 K 個主元來代替 p 個變數。

主元的分向量

主元分析中數據總體的協方差陣往往是未知的,這需要利用過程的正常運行數據進行估計。假設採集得到過程數據樣本為 X ∈ R n ×p,其中 n是樣本的數量,p 為過程變數的個數。為了避免變數的不同量綱的影響,需首先對數據進行標準化處理,即將各個變數轉化為均值為 0,方差為 1 的數據。

確定方法

目前在主元個數的選擇上,有兩種比較普遍的方法,一種是主元回歸檢驗法,一種是主元貢獻率累積和百分比法(CPV)。

檢測統計量

檢測統計

從統計的角度講,要檢測數據中是否包含過程的故障信息,可以通過建立統計量進行假設檢驗,判斷過程數據是否背離了主元模型。通常的方法是主元子空間建立 Hotelling T2 統計量進行統計檢驗;在殘差子空間中建立 Q 統計量進行統計檢測。

相關詞條

熱門詞條

聯絡我們