正文
極大值原理和動態規劃從理論方面研究了最優控制所應遵循的方程和條件,而最優控制算法則是從計算方面來確定最優控制形式的具體方法和步驟(見最最佳化方法)。從總體上看,最優控制算法可分為間接法和直接法兩大類。對於給定的一類控制問題可由最優控制理論導出用以決定最優控制的條件和方程,可用有關的計算方法求出其解,這類方法稱為間接法。對難以定出有關最優控制的條件和方程的一類問題,須用數值方法直接求其近似解,這類方法稱為直接法。不管是間接法還是直接法,在大多數情況下,都要藉助數值求解算法。隨著電子計算機技術的發展,用數值方法求解最優控制問題變得越來越有效和廣泛,原來不可行的一些算法已逐漸成為可行。評價最優控制算法的兩個主要問題是:①算法的收斂性或數值穩定性,它是保證計算過程能達到正確結果的前提。②算法的計算複雜性,這對實時控制具有特別重要的意義。一個好的算法應使計算量和存儲量儘可能小,以便能由儘可能簡單的計算機來實現計算。此外,好的算法還應具有較好的數值穩定性,即計算的結果對初始數據和運算過程的誤差不過於敏感,以及處理“病態“問題的能力。典型的最優控制算法有:求解由極大值原理導出的微分或差分方程的兩點邊值問題的各種算法,對動態規劃中的貝爾曼方程進行數值求解的算法,求解線性二次型最優控制問題的黎卡提方程的各種算法,處理控制或狀態受約束問題的罰函式法,在控制策略的函式空間中利用搜尋尋優或梯度尋優技術和牛頓-拉夫森方法等直接求解非線性系統最優控制問題的算法等。其中,非線性系統的開環最優控制問題和線性二次型最優控制問題的算法套用尤多。
非線性系統的開環最優控制算法 這類控制問題的提法是,在非線性系統的狀態方程
夶=f(x,u,t), x(t0)=x0, t0≤t≤tf(1)
的約束下,尋找一個控制u(t)使性能指標泛函 (2)
對x和u的變化範圍不加限制的情形,可把非線性規劃中的共軛梯度法、變尺度法等推廣來求解上面給出的問題。其關鍵在於計算泛函J(u)對於u的梯度墷J(u):
(3)
H(x,u,λ,t)=L(x,u,t)+ λTf(x,u,t) (4)
是哈密頓函式。這裡上標T表示轉置,而λ是n維伴隨向量,它滿足方程 (5)
① 任選一個初始控制u0,且令i=0。
② 用ui從t0到tf求積狀態方程(1),得到xi(t),後再用ui和 xi從 tf 到t0 反向求積伴隨方程(5)以得到λi(t)。再利用ui、xi和λi計算
![最優控制算法](/img/2/eb8/ml2ZuM3X4IjNzgTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzL4IzLt92YucmbvRWdo5Cd0FmLxE2LvoDc0RHa.jpg)
③ 令 gi=H
![最優控制算法](/img/6/5bb/ml2ZuM3X5kzN0gTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzL5kzLt92YucmbvRWdo5Cd0FmL0E2LvoDc0RHa.jpg)
hi=gi+βi-1hi-1
其中βi-1=<gi-gi-1,gi>/<gi-1,gi-1>,h0=g0,而符號<·,·>表示<x,y>=
![最優控制算法](/img/4/d81/ml2ZuM3X3QTOwYTMxcTMxgDM5ETMwADMwADMwADMwADMxAzLxEzL3QzLt92YucmbvRWdo5Cd0FmLwE2LvoDc0RHa.jpg)
④ 若gi=0,停止;否則進行⑤。
⑤ 用一維搜尋法求出μi>0使
J(ui+μihi)=【J(ui+μhi)|μ>0】
線性二次型問題的閉環最優控制算法 這類控制問題的數學提法是,線上性狀態方程
x=Ax+Bu
的約束下,求控制u(t)使二次型性能指標泛函J(u)=(xTQx+uTRu)dt
u*=-R-1BTPx
其中對稱正定矩陣P滿足黎卡提代數矩陣方程ATP+PA-PBR-1BTP+Q=0
在這類最優控制問題的算法中,關鍵是求解矩陣P,常用的算法有四種。① 微分方程法。反向解矩陣黎卡提微分方程
妛+ATP+PA-PBR-1BTP+Q =0, P(tf)=0
其中![最優控制算法](/img/5/57e/ml2ZuM3XwcTM4gTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzLwczLt92YucmbvRWdo5Cd0FmLyE2LvoDc0RHa.jpg)
② 哈密頓矩陣方法。構造哈密頓矩陣
![最優控制算法](/img/4/c97/ml2ZuM3X5ATMwkTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzL5AzLt92YucmbvRWdo5Cd0FmLzE2LvoDc0RHa.jpg)
![最優控制算法](/img/b/c3a/ml2ZuM3X0QzMykTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzL0QzLt92YucmbvRWdo5Cd0FmLyE2LvoDc0RHa.jpg)
![最優控制算法](/img/4/150/ml2ZuM3XxIzMzkTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzLxIzLt92YucmbvRWdo5Cd0FmL0E2LvoDc0RHa.jpg)
![最優控制算法](/img/2/453/ml2ZuM3X0EDN0kTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzL0EzLt92YucmbvRWdo5Cd0FmL0E2LvoDc0RHa.jpg)
![最優控制算法](/img/2/453/ml2ZuM3X0EDN0kTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzL0EzLt92YucmbvRWdo5Cd0FmL0E2LvoDc0RHa.jpg)
這種算法的另一種形式是先定出哈密頓矩陣 H的特徵值,並以具有負實部的所有特徵值為零點來組成多項式F(s)。將用H 代替s後得到的矩陣多項式F(H)寫成分塊形
![最優控制算法](/img/a/e65/ml2ZuM3XwIDN2kTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzLwIzLt92YucmbvRWdo5Cd0FmLyE2LvoDc0RHa.jpg)
![最優控制算法](/img/2/453/ml2ZuM3X0EDN0kTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzL0EzLt92YucmbvRWdo5Cd0FmL0E2LvoDc0RHa.jpg)
這種算法的又一種形式是找到一個正交矩陣
![最優控制算法](/img/c/b9d/ml2ZuM3XwcTN3kTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzLwczLt92YucmbvRWdo5Cd0FmLxE2LvoDc0RHa.jpg)
![最優控制算法](/img/f/b68/ml2ZuM3XwEjN4kTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzLwEzLt92YucmbvRWdo5Cd0FmLyE2LvoDc0RHa.jpg)
![最優控制算法](/img/2/453/ml2ZuM3X0EDN0kTMxUzMxgDM5ETMwADMwADMwADMwADMxAzLzEzL0EzLt92YucmbvRWdo5Cd0FmL0E2LvoDc0RHa.jpg)
③ 疊代解法。將黎卡提代數方程改寫為疊代形式
(A-sPi)TPi+1+Pi+1(A-sPi)=-Q-PisPi
其中s=BR-1BT,i=0,1,…。當選擇 P0使矩陣A0=A-sP0的特徵值均具負實部時,此疊代方程所確定的矩陣序列P0、P1、…是單調收斂的其極限矩陣即是黎卡提代數矩陣方程的對稱正定解。④ 符號函式方法。哈密頓矩陣H的符號函式規定為
宮錫芳著:《最優控制問題的計算方法》,科學出版社,北京,1979。