基礎理論
N 維非零向量 v 是 N×N 的矩陣 A 的特徵向量,若且唯若下式成立:![\mathbf{A} \mathbf{v} = \lambda \mathbf{v}](/img/8/7df/nBnauADNlZGOzgjM4AzNwYmMjlDM1EjYygjYmJGOxEWMwcDOjFzMiRDZhhzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauU2LvoDc0RHa.jpg)
其中 λ 為一標量,稱為 v 對應的特徵值。也稱 v 為特徵值 λ 對應的特徵向量。也即特徵向量被施以線性變換 A 只會使向量伸長或縮短而其方向不被改變。
由上式可得
![p\left(\lambda\right) := \det\left(\mathbf{A} - \lambda \mathbf{I}\right)= 0. \!\](/img/8/97d/nBnaukTNlJ2MkZzMlNWNxEWZiNWY5Q2Y2UjZiJWO0MDNzgjMhJDNkRmM0IzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauU2LvoDc0RHa.jpg)
稱多項式 p(λ) 為矩陣的特徵多項式。上式亦稱為矩陣的特徵方程。特徵多項式是關於未知數 λ 的 N 次多項式。由代數基本定理,特徵方程有 N 個解。這些解的解集也就是特徵值的集合,有時也稱為“譜”(Spectrum)。
我們可以對多項式 p 進行因式分解,而得到
![p\left(\lambda\right)= (\lambda-\lambda_1)^{n_1}(\lambda-\lambda_2)^{n_2}\cdots(\lambda-\lambda_k)^{n_k} = 0 \!\](/img/0/db3/nBnauEjM1YGOwIDMidTYwUTOmFTOygjZkJWOjFDM5EWO5gjY0ITOlBzMlFzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauY2LvoDc0RHa.jpg)
其中
![\sum\limits_{i=1}^{k}{n_i} =N.](/img/c/da1/nBnauYmM4YmZyUWOmdzNyYDZ1gDNhdzMhJGZmNWMzIGNkJGOzcTZyQWZiRzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauM2LvoDc0RHa.jpg)
對每一個特徵值 λi ,我們都有下式成立:
![\left(\mathbf{A} - \lambda_i \mathbf{I}\right)\mathbf{v} = 0. \!\](/img/9/0de/nBnaucjY5cTOyE2MmFDMmVWZ2kjY3EWMjNGZ0UGZzYWM1YWYhZGZmZTMjlzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauI2LvoDc0RHa.jpg)
對每一個特徵方程,都會有
![m_i](/img/4/517/nBnaugzMjJDZmNzYlN2MjNmZhNGZzYmMkRWO2IGOycTMxQ2YxEWYiBDMwQ2LtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauc2LvoDc0RHa.jpg)
![1\le m_i \le n_i](/img/8/c1a/nBnauQjYidTZlRTO0UzY4YGO2IWMmRjNxETO1EmZkZmNxQWOiFTZjZWZ2E2LtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauc2LvoDc0RHa.jpg)
分解方法
矩陣的特徵分解
令 A 是一個 N×N 的方陣,且有 N 個線性無關的特徵向量![q_i \,\, (i = 1, \dots, N)](/img/7/d1f/nBnauQDNkJTZjNzYjZGOjJTMiJmZzADZhRWZ1ETMkNWMhFmYwATMkNGZ5Y2LtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauU2LvoDc0RHa.jpg)
![\mathbf{A}=\mathbf{Q}\mathbf{\Lambda}\mathbf{Q}^{-1}](/img/2/467/nBnaucTO1EjM4EGO3ETZxMmZkNWOwUTMkhzNyUDN3IGNjJWZ5EzMiVTNiBzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauU2LvoDc0RHa.jpg)
其中 Q 是N×N方陣,且其第 i列為 A 的特徵向量 。 Λ 是對角矩陣,其對角線上的元素為對應的特徵值,也即
![\Lambda_{ii}=\lambda_i](/img/9/9f5/nBnauYGZyUTOwYjNlNjZ3cTMiNWOhFzM0ITMmF2Y1kjZxUjMlRDMzEGM2kzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauE2LvoDc0RHa.jpg)
![\begin{bmatrix}1 1 \\0 1 \\\end{bmatrix}](/img/a/bf6/nBnauMWN0kDOzkjYlJjZyEDZ0MDOjNzY0gTZ5UGM4ImZzEjMxATOzkTZwAzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauY2LvoDc0RHa.jpg)
一般來說,特徵向量
![q_i \,\, (i = 1, \dots, N)](/img/5/8c1/nBnaukTNhRTOwEDZ4UjM5UGN0UjY3EGNkRTZwQTN5QzMxI2YxIGZ4YGZmVzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGaug2LvoDc0RHa.jpg)
![v_i \,\, (i = 1, \dots, N),](/img/c/459/nBnaucTYlVmYxMjYyETOzczNiFmMhRTZwMDZ5ATOhRTMwkjYygTY4cTMmFzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauQ2LvoDc0RHa.jpg)
![Q^{-1}](/img/e/d77/nBnaucjM4M2YycTNzQmMmlDZwYTZmRWO3QjMmhDMyAjY3EGM1kDZxYDMmZzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauI2LvoDc0RHa.jpg)
- 通過特徵分解求矩陣的逆
若矩陣 A 可被特徵分解並特徵值中不含零,則矩陣 A 為非奇異矩陣,且其逆矩陣可以由下式給出:
![\mathbf{A}^{-1}=\mathbf{Q}\mathbf{\Lambda}^{-1}\mathbf{Q}^{-1}](/img/0/43f/nBnauYmMhFjZ0MDM0YjYhRWZ5YGNkNGZzI2MmZWYhVjMwIDOwY2M3MTMwQ2LtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGaug2LvoDc0RHa.jpg)
因為 Λ 為對角矩陣,其逆矩陣容易計算出:
![\left[\Lambda^{-1}\right]_{ii}=\frac{1}{\lambda_i}](/img/3/0ec/nBnauMDNzMGMkJjN3IzM2MTM4gzMjFzM4gzY5MmM3UzMkJjZ5QmM2EDZiBzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauY2LvoDc0RHa.jpg)
對特殊矩陣的特徵分解
- 對稱矩陣
任意的 N×N 實對稱矩陣都有 N 個線性無關的特徵向量。並且這些特徵向量都可以正交單位化而得到一組正交且模為 1 的向量。故實對稱矩陣 A 可被分解成
![\mathbf{A}=\mathbf{Q}\mathbf{\Lambda}\mathbf{Q}^{T}](/img/5/eb0/nBnauMzMkN2MxEGOjVWOhZGZzEzMwY2Y0ETO3kDZyYTMkFGM0YmY3gDMzAzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauQ2LvoDc0RHa.jpg)
其中 Q 為 正交矩陣, Λ 為實對角矩陣。
- 正規矩陣
類似地,一個復正規矩陣具有一組正交特徵向量基,故正規矩陣可以被分解成
![\mathbf{A}=\mathbf{U}\mathbf{\Lambda}\mathbf{U}^{H}](/img/8/a9e/nBnauIjYygDNzQWY0QTMhRGZ1kzYwkDMxkjMjhzM1YDM4E2YldDMiNTMykzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuM3b09GawlGauc2LvoDc0RHa.jpg)
其中 U 為一個酉矩陣。進一步地,若 A 是埃爾米特矩陣,那么對角矩陣 Λ 的對角元全是實數。若 A 還是酉矩陣,則 Λ 的所有對角元在複平面的單位圓上取得。