歷史
矩陣的研究歷史悠久,拉丁方陣和幻方在史前年代已有人研究。
在數學中,矩陣(Matrix)是一個按照長方陣列排列的複數或實數集合 ,最早來自於方程組的係數及常數所構成的方陣。這一概念由19世紀英國數學家凱利首先提出。作為解決線性方程的工具,矩陣也有不短的歷史。成書最遲在東漢前期的《九章算術》中,用分離係數法表示線性方程組,得到了其增廣矩陣。在消元過程中,使用的把某行乘以某一非零實數、從某行中減去另一行等運算技巧,相當於矩陣的初等變換。但那時並沒有現今理解的矩陣概念,雖然它與現有的矩陣形式上相同,但在當時只是作為線性方程組的標準表示與處理方式。
矩陣正式作為數學中的研究對象出現,則是在行列式的研究發展起來後。邏輯上,矩陣的概念先於行列式,但在實際的歷史上則恰好相反。日本數學家關孝和(1683年)與微積分的發現者之一戈特弗里德·威廉·萊布尼茨(1693年)近乎同時地獨立建立了行列式論。其後行列式作為解線性方程組的工具逐步發展。1750年,加布里爾·克拉默發現了克萊姆法則 。
矩陣的現代概念在19世紀逐漸形成。1800年代,高斯和威廉·若爾當建立了高斯—若爾當消去法。1844年,德國數學家費迪南·艾森斯坦(F.Eisenstein)討論了“變換”(矩陣)及其乘積。1850年,英國數學家詹姆斯·約瑟夫·西爾維斯特(James Joseph Sylvester)首先使用矩陣一詞 。
英國數學家阿瑟·凱利被公認為矩陣論的奠基人。他開始將矩陣作為獨立的數學對象研究時,許多與矩陣有關的性質已經在行列式的研究中被發現了,這也使得凱利認為矩陣的引進是十分自然的。他說:“我決然不是通過四元數而獲得矩陣概念的;它或是直接從行列式的概念而來,或是作為一個表達線性方程組的方便方法而來的。”他從1858年開始,發表了《矩陣論的研究報告》等一系列關於矩陣的專門論文,研究了矩陣的運算律、矩陣的逆以及轉置和特徵多項式方程。凱利還提出了凱萊-哈密爾頓定理,並驗證了3×3矩陣的情況,又說進一步的證明是不必要的。哈密爾頓證明了4×4矩陣的情況,而一般情況下的證明是德國數學家弗羅貝尼烏斯(F.G.Frohenius)於1898年給出的 。
1854年時法國數學家埃爾米特(C.Hermite)使用了“正交矩陣”這一術語,但他的正式定義直到1878年才由費羅貝尼烏斯發表。1879年,費羅貝尼烏斯引入矩陣秩的概念。至此,矩陣的體系基本上建立起來了。
無限維矩陣的研究始於1884年。龐加萊在兩篇不嚴謹地使用了無限維矩陣和行列式理論的文章後開始了對這一方面的專門研究。1906年,希爾伯特引入無限二次型(相當於無限維矩陣)對積分方程進行研究,極大地促進了無限維矩陣的研究。在此基礎上,施密茨、赫林格和特普利茨發展出運算元理論,而無限維矩陣成為了研究函式空間運算元的有力工具 。
矩陣的概念最早在1922年見於中文。1922年,程廷熙在一篇介紹文章中將矩陣譯為“縱橫陣”。1925年,科學名詞審查會算學名詞審查組在《科學》第十卷第四期刊登的審定名詞表中,矩陣被翻譯為“矩陣式”,方塊矩陣翻譯為“方陣式”,而各類矩陣如“正交矩陣”、“伴隨矩陣”中的“矩陣”則被翻譯為“方陣”。1935年,中國數學會審查後,中華民國教育部審定的《數學名詞》(並“通令全國各院校一律遵用,以昭劃一”)中,“矩陣”作為譯名首次出現。1938年,曹惠群在接受科學名詞審查會委託就數學名詞加以校訂的《算學名辭彙編》中,認為應當的譯名是“長方陣”。中華人民共和國成立後編訂的《數學名詞》中,則將譯名定為“(矩)陣”。1993年,中國自然科學名詞審定委員會公布的《數學名詞》中,“矩陣”被定為正式譯名,並沿用至今。
定義
由 m × n 個數a排成的m行n列的數表稱為m行n列的矩陣,簡稱m × n矩陣。記作:
這m×n 個數稱為矩陣 A的元素,簡稱為元,數a位於矩陣 A的第i行第j列,稱為矩陣 A的(i,j)元,以數 a為(i,j)元的矩陣可記為(a)或(a),m×n矩陣 A也記作 A。
元素是實數的矩陣稱為實矩陣,元素是複數的矩陣稱為復矩陣。而行數與列數都等於n的矩陣稱為n階矩陣或n階方陣 。
基本運算
矩陣運算在科學計算中非常重要 ,而矩陣的基本運算包括矩陣的加法,減法,數乘,轉置,共軛和共軛轉置 。
加法
矩陣的加法滿足下列運算律( A, B, C都是同型矩陣):
應該注意的是只有同型矩陣之間才可以進行加法 。
減法
數乘
矩陣的數乘滿足以下運算律:
矩陣的加減法和矩陣的數乘合稱矩陣的線性運算 。
轉置
把矩陣A的行和列互相交換所產生的矩陣稱為A的轉置矩陣 ,這一過程稱為矩陣的轉置
矩陣的轉置滿足以下運算律:
共軛
矩陣的共軛定義為: .一個2×2複數矩陣的共軛如下所示 :
則
共軛轉置
矩陣的共軛轉置定義為:
,也可以寫為: 。一個2×2複數矩陣的共軛如下所示:則
乘法
主條目: 矩陣乘法
兩個矩陣的乘法僅當第一個矩陣 A的列數和另一個矩陣 B的行數相等時才能定義。如 A是 m× n矩陣和 B是 n× p矩陣,它們的乘積 C是一個 m× p矩陣 ,它的一個元素:
並將此乘積記為: .
例如:
矩陣的乘法滿足以下運算律:
結合律:
左分配律:
右分配律:
矩陣乘法不滿足交換律。
行列式
主條目: 行列式
一個 n× n的正方矩陣 A的行列式記為 或者 ,一個2×2矩陣的行列式可表示如下 :
一個 n× n矩陣的行列式等於其任意行(或列)的元素與對應的代數餘子式乘積之和,即:
特徵值與特徵向量
主條目: 特徵值, 特徵向量
n× n的方塊矩陣 A的一個特徵值和對應特徵向量是滿足 的標量以及非零向量 。其中 v為特徵向量 , 為特徵值。
A的所有特徵值的全體,叫做A的譜 ,記為 。矩陣的特徵值和特徵向量可以揭示線性變換的深層特性 。
矩陣的跡
主條目: 矩陣的跡
矩陣A的對角元素之和稱為矩陣A的跡(trace),記作 , 即
正定性
n× n的實對稱矩陣 A如果滿足對所有非零向量 ,對應的二次型
若,就稱 A為正定矩陣。若則 A是一個負定矩陣,若,則 A為半正定矩陣,若 A既非半正定,也非半負定,則 A為不定矩陣 。對稱矩陣的正定性與其特徵值密切相關。矩陣是正定的若且唯若其特徵值都是正數 。
矩陣的分解
主條目: 矩陣分解
矩陣分解是將一個矩陣分解為比較簡單的或具有某種特性的若干矩陣的和或乘積 ,矩陣的分解法一般有三角分解、譜分解、奇異值分解、滿秩分解等。
三角分解
設 ,則A可以唯一地分解為 A= U R ,其中 U是酉矩陣 ,R是正線上三角復矩陣 ,或 A可以唯一地分解為其中 L是正線上三角復矩陣 ,是酉矩陣
譜分解
譜分解(Spectral decomposition)是將矩陣分解為由其特徵值和特徵向量表示的矩陣之積的方法。需要注意只有對可對角化矩陣才可以施以特徵分解 。
奇異值分解
假設 M是一個 m×n階矩陣,其中的元素全部屬於域 K,也就是實數域或複數域。如此則存在一個分解使得
其中 U是 m×m階酉矩陣;Σ是 m×n階實數對角矩陣;而 V*,即 V的共軛轉置,是 n×n階酉矩陣。這樣的分解就稱作 M的奇異值分解 。Σ對角線上的元素Σ即為 M的奇異值。常見的做法是將奇異值由大而小排列。如此Σ便能由 M唯一確定了。
滿秩分解
設 ,若存在矩陣 及 ,使得 A= FG ,則稱其為的 A一個滿秩分解 。
LUP分解
LUP分解的思想就是找出三個 n×n矩陣 L ,U,P,滿足. 其中L是一個單位下三角矩陣,U是一個單位上三角矩陣,P是一個置換矩陣。 而滿足分解條件的矩陣 L, U, P稱為矩陣A的一個 LUP分解 。
特殊類別
對稱矩陣
線上性代數中,對稱矩陣是一個方形矩陣,其轉置矩陣和自身相等 。即 .例如:.
Hermitian矩陣
一個正方的復值矩陣 稱為Hermitian矩陣,若 A= A 即其元素 ,換言之Hermitian矩陣是一種復共軛對稱矩陣 。
對一個實值矩陣,Hermitian矩陣與對稱矩陣等價。
正交矩陣
一個實的正方矩陣 稱為正交矩陣,若 .
酉矩陣
一個復值正方矩陣 稱為正交矩陣,若 .
帶型矩陣
矩陣 ,若矩陣滿足條件a=0,|i-j|>k,則矩陣 A可以稱為帶型矩陣(banded matrix) 。
三角矩陣
線上性代數中,三角矩陣是方形矩陣的一種,因其非零係數的排列呈三角形狀而得名。三角矩陣分上三角矩陣和下三角矩陣兩種。若,則的矩陣稱為上三角矩陣 ,若,則的矩陣稱為下三角矩陣 。三角矩陣可以看做是一般方陣的一種簡化情形。
相似矩陣
線上性代數中,相似矩陣是指存在相似關係的矩陣。相似關係是兩個矩陣之間的一種等價關係。兩個 n× n矩陣 A與 B為相似矩陣若且唯若存在一個 n× n的可逆矩陣 P,使得: 或 。
相合矩陣
令 ,並且 C非奇異,則矩陣 稱為 A的相合矩陣。其中線性變換 稱為相合變換 。
Vandermonde矩陣
Vandermonde矩陣(范德蒙矩陣)的命名來自Alexandre-Théophile Vandermonde的名字,范德蒙矩陣是一個各列呈現出幾何級數關係的矩陣 。
例如:
或以第 i行第 j列的關係寫作:
Hadamard矩陣
Hadamard矩陣(阿達馬矩陣)是一個方陣,每個元素都是 +1 或 −1,每行都是互相正交的 。
n階的阿達馬矩陣 H滿足: 。這裡 I是 n× n的單位矩陣。
對角矩陣
對於 m×m的矩陣,當時,有,此時所有非對角線上的元素均為0 ,此時的矩陣稱為對角矩陣。
分塊矩陣
一個分塊矩陣是將矩陣分割出較小的矩陣,這些較小的矩陣就稱為子塊 。例如:
該矩陣可以分為四個 2×2的矩陣:
分塊後的矩陣可以寫為如下形式:
Jacobian矩陣
Jacobian矩陣是函式的一階偏導數以一定方式排列成的矩陣。
可表示為如下形式:
鏇轉矩陣(Rotation matrix)
鏇轉矩陣(Rotation matrix)是在乘以一個向量的時候有改變向量的方向但不改變大小的效果的矩陣。鏇轉矩陣不包括反演,它可以把右手坐標系改變成左手坐標系或反之。所有鏇轉加上反演形成了正交矩陣的集合。
鏇轉矩陣是世界上著名的彩票專家、澳大利亞數學家底特羅夫研究的,它可以幫助您鎖定喜愛的號碼,提高中獎的機會。首先您要先選一些號碼,然後,運用某一種鏇轉矩陣,將你挑選的數字填入相應位置。如果您選擇的數字中有一些與開獎號碼一樣,您將一定會中一定獎級的獎。當然運用這種鏇轉矩陣,可以最小的成本獲得最大的收益,且遠遠小於複式投注的成本。
鏇轉矩陣的原理在數學上涉及到的是一種組合設計:覆蓋設計。而覆蓋設計,填裝設計,斯坦納系,t-設計都是離散數學中的組合最佳化問題。它們解決的是如何組合集合中的元素以達到某種特定的要求。
範數
主條目: 範數
矩陣的範數主要包括三種主要類型:誘導範數,元素形式範數和Schatten範數 。
若映射 滿足以下要求:
則稱該映射為 上的矩陣範數。
誘導範數
誘導範數又稱 矩陣空間上的運算元範數(operator norm),定義為:
常用的誘導範數為p-範數:
p範數也稱為明克夫斯基 p範數或者 範數。特別的,當 時,對應的誘導範數分別為
元素形式範數
將 矩陣按照列的形式,排成一個 的向量,然後採用向量範數的定義,即得到矩陣的元素形式範數 ,表式如下:
Schatten範數
Schatten範數是用矩陣的奇異值定義的範數,定義為:
其中 為對應矩陣的奇異值 。
套用
圖像處理
在圖像處理中圖像的仿射變換一般可以表示為一個仿射矩陣和一張原始圖像相乘的形式 ,例如,
這裡表示的是一次線性變換再街上一個平移。
線性變換及對稱
線性變換及其所對應的對稱,在現代物理學中有著重要的角色。例如,在量子場論中,基本粒子是由狹義相對論的洛倫茲群所表示,具體來說,即它們在鏇量群下的表現。內含泡利矩陣及更通用的狄拉克矩陣的具體表示,在費米子的物理描述中,是一項不可或缺的構成部分,而費米子的表現可以用鏇量來表述。描述最輕的三種夸克時,需要用到一種內含特殊酉群SU(3)的群論表示;物理學家在計算時會用一種更簡便的矩陣表示,叫蓋爾曼矩陣,這種矩陣也被用作SU(3)規範群,而強核力的現代描述──量子色動力學的基礎正是SU(3)。還有卡比博-小林-益川矩陣(CKM矩陣):在弱相互作用中重要的基本夸克態,與指定粒子間不同質量的夸克態不一樣,但兩者卻是成線性關係,而CKM矩陣所表達的就是這一點。
量子態的線性組合
1925年海森堡提出第一個量子力學模型時,使用了無限維矩陣來表示理論中作用在量子態上的運算元。這種做法在矩陣力學中也能見到。例如密度矩陣就是用來刻畫量子系統中“純”量子態的線性組合表示的“混合”量子態 。
另一種矩陣是用來描述構成實驗粒子物理基石的散射實驗的重要工具。當粒子在加速器中發生碰撞,原本沒有相互作用的粒子在高速運動中進入其它粒子的作用區,動量改變,形成一系列新的粒子。這種碰撞可以解釋為結果粒子狀態和入射粒子狀態線性組合的標量積。其中的線性組合可以表達為一個矩陣,稱為S矩陣,其中記錄了所有可能的粒子間相互作用 。
簡正模式
矩陣在物理學中的另一類泛套用是描述線性耦合調和系統。這類系統的運動方程可以用矩陣的形式來表示,即用一個質量矩陣乘以一個廣義速度來給出運動項,用力矩陣乘以位移向量來刻畫相互作用。求系統的解的最優方法是將矩陣的特徵向量求出(通過對角化等方式),稱為系統的簡正模式。這種求解方式在研究分子內部動力學模式時十分重要:系統內部由化學鍵結合的原子的振動可以表示成簡正振動模式的疊加 。描述力學振動或電路振盪時,也需要使用簡正模式求解 。
幾何光學
在幾何光學裡,可以找到很多需要用到矩陣的地方。幾何光學是一種忽略了光波波動性的近似理論,這理論的模型將光線視為幾何射線。採用近軸近似(英語:paraxial approximation),假若光線與光軸之間的夾角很小,則透鏡或反射元件對於光線的作用,可以表達為2×2矩陣與向量的乘積。這向量的兩個分量是光線的幾何性質(光線的斜率、光線跟光軸之間在主平面(英語:principal plane)的垂直距離)。這矩陣稱為光線傳輸矩陣(英語:ray transfer matrix),內中元素編碼了光學元件的性質。對於折射,這矩陣又細分為兩種:“折射矩陣”與“平移矩陣”。折射矩陣描述光線遇到透鏡的折射行為。平移矩陣描述光線從一個主平面傳播到另一個主平面的平移行為。
由一系列透鏡或反射元件組成的光學系統,可以很簡單地以對應的矩陣組合來描述其光線傳播路徑 。
電子學
在電子學裡,傳統的網目分析(英語:mesh analysis)或節點分析會獲得一個線性方程組,這可以以矩陣來表示與計算。