簡介
用連續曲線近似地刻畫或比擬平面上離散點組所表示的坐標之間的函式關係的一種數據處理方法。用解析表達式逼近離散數據的一種方法。在科學實驗或社會活動中,通過實驗或觀測得到量x與y的一組數據對(xi,yi)(i=1,2,…m),其中各xi是彼此不同的 。人們希望用一類與數據的背景材料規律相適應的解析表達式,y=f(x,c)來反映量x與y之間的依賴關係,即在一定意義下"最佳"地逼近或擬合已知數據。f(x,c)常稱作擬合模型 ,式中c=(c1,c2,…cn)是一些待定參數。當c在f中線性出現時,稱為線性模型,否則稱為非線性模型。有許多衡量擬合優度的標準,最常用的一種做法是選擇參數c使得擬合模型與實際觀測值在 各點的殘差(或離差)ek=yk-f(xk,c)的加權平方和達到最小,此時所求曲線稱作在加權最小二乘意義下對數據的擬合曲線。有許多求解擬合曲線的成功方法,對於線性模型一般通 過建立和求解方程組來確定參數,從而求得擬合曲線。至於非線性模型,則要藉助求解非線性方程組或用最最佳化方法求得所需參數才能得到擬合曲線,有時稱之為非線性最小二乘擬合。
曲線擬合:貝塞爾曲線與路徑轉化時的誤差。值越大,誤差越大;值越小,越精確。
常用函式
指數函式
指數函式(exponential function)的標準式形式為
Y=aebX
(12.29)
對式(12.29)兩邊取對數,得
lnY=lna+bX
(12.30)
b>0時,Y隨X增大而增大;b<0時,Y隨X增大而減少。見圖12.4(a)、(b)。當以lnY和X繪製的散點圖呈直線趨勢時,可考慮採用指數函式來描述Y與X間的非線性關係,lna和b分別為截距和斜率。
更一般的指數函式
Y=aebX+k
(12.31)
式中k為一常量,往往未知, 套用時可試用不同的值。
對數函式
對數函式(lograrithmic function)的標準式形式為
Y=a+blnX
(X>0)
(12.32)
b>0時,Y隨X增大而增大,先快後慢;b<0時,Y隨X增大而減少,先快後慢,見圖12.4(c)、(d)。當以Y和lnX繪製的散點圖呈直線趨勢時,可考慮採用對數函式描述Y與X之間的非線性關係,式中的b和a分別為斜率和截距。
更一般的對數函式
Y=a+bln(X+k) (12.33)
式中k為一常量,往往未知。
(a)lnY=lna+bX(b)lnY=lna-bX(c)Y=a+blnX(d)Y=a-blnX
冪函式
冪函式(power function)的標準式形式為
Y=aXb(a>0,X>0)
(12.34)
式中b>0時,Y隨X增大而增大;b<0時,Y隨X增大而減少。
對式(12.34)兩邊取對數,得
lnY=lna+blnX(12.35)
所以,當以lnY和lnX繪製的散點圖呈直線趨勢時,可考慮採用冪函式來描述Y和X間的非線性關係,lna和b分別是截距和斜率。
更一般的冪函式
Y=aXb+k
(12.36)
式中k為一常量,往往未知。
步驟
(一)繪製散點圖,選擇合適的曲線類型
一般根據資料性質結合專業知識便可確定資料的曲線類型,不能確
定時,可在方格坐標紙上繪製散點圖,根據散點的分布,選擇接近的、合適的曲線類型。
(二)進行變數變換
Y’=f(Y),X’=g(X)(12.37)
使變換後的兩個變數呈直線關係。
(三)按最小二乘法原理求線性方程和方差分析
(四)將直線化方程轉換為關於原變數X、Y的函式表達式