非線性最優預測控制

非線性最優預測控制(Nonlinear optimal Predictive Control)實質是採用多步測試、滾動最佳化和反饋校正等來找出允許的控制作用(規律),使得動態系統(受控對象)從初始狀態轉移到某種要求的終端狀態,並且保證某種要求的性能指標達到最小(大)。

預測控制是近年來發展起來的一類新型的計算機控制算法。由於它採用多步測試、滾動最佳化和反饋校正等控制策略,因而控制效果好,適用於控制不易建立精確數字模型且比較複雜的工業生產過程,所以它一出現就受到國內外工程界的重視,並已在石油、化工、電力、冶金、機械等工業部門的控制系統得到了成功的套用。

研究背景

20世紀60年代初,由於空間技術的迅猛發展和計算機的廣泛套用,使得動態系統的最佳化理論得到了迅速發展,形成了最優控制這一重要的學科分支。最優控制是現代控制理論的一個重要組成部分。最優控制問題大都是從具體工程實踐中歸納和提煉出來的,隨著最優控制理論的不斷完善,其在航空、航天、工業過程控制、經濟管理與決策以及人口控制等領域得到了成功的套用,並取得了顯著的成就。

最優控制是使被控系統的性能指標實現最最佳化的一種綜合策略,可概括為,對一個受控的動力學系統或運動過程,從一類允許的控制方案中找出一個最優的控制策略,使系統的運動在由某個初始狀態轉移到指定的目標狀態的同時,其性能指標值為最優。最優控制問題廣泛存在實際的生產中,可以說最優控制問題無處不在。例如,對於吊車系統的吊運控制問題,希望在吊運過程中,擺角越小越好,同時吊運時間越短越好;對於機械臂系統的控制問題,期望機械臂系統的跟蹤誤差越小越好;對於行星著陸器的動力下降段的控制問題,期望對參考軌跡的跟蹤效果好以及燃料消耗最少。

簡介

為了解決最優控制問題,必須建立描述受控運動過程的運動方程,給出控制變數的允許取值範圍,指定運動過程的初始狀態和目標狀態,並且規定一個評價運動過程品質優劣的性能指標。通常,性能指標的好壞取決於所選擇的控制函式和相應的運動狀態。系統的運動狀態受到運動方程的約束,而控制函式只能在允許的範圍內選取。因此,從數學上看,確定最優控制問題可以表述為:在運動方程和允許控制範圍的約束下,對以控制函式和運動狀態為變數的性能指標函式(稱為泛函)求取極值(極大值或極小值)。解決最優控制問題的主要方法有古典變分法、極大值原理和動態規劃。

對於非線性系統,其最優控制的解一般是不存在的再加上非線性系統的複雜性和多樣性,這方面的研究成果還很少,尚待解決的問題還很多,本文對非線性最優控制理論現有研究成果對比進行了詳細的闡述,並對其優缺點進行了客觀的對比,為非線性最優控制理論的進一步研究提供參考。

近年來,最優控制理論的研究,無論在深度和廣度上,都有了很大的發展,已成為系統與控制領域最熱門的研究課題之一,取得了許多研究成果同時,也在與其他控制理論相互滲透,出現了許多新的最優控制方式,形成了更為實用的學科分支例如魯棒最優控制、隨機最優控制、分布參數系統的最優控制、大系統的次優控制網、離散系統的最優控制及最優滑模變結構控制等。而對於非線性系統,其最優控制求解相當困難,需要求解非線性HJB方程或非線性兩點邊值問題,除簡單情祝外,這兩個問題都無法得到解析。因此,許多學者都致力於尋求近似的求解方法,通過近似解得到近似的最優控,即次優控制。

最優控制方法

簡介

解決最優控制問題最大的難點在於HJB方程的求解,只有當系統模型是低階線性模型時,才有可能給出具有顯式表達式的最優控制解。在實際系統里,乃至自然界中,幾乎絕大多數系統都是非線性的系統,想得到具有顯式表達式的控制量幾乎不可能,這就需要藉助計算機,以及選擇合適的最優的數值解法,以得到最優解。一般的,最優控制問題的求解方法為數值算法。極大值原理和動態規劃從理論方面研究了最優控制所應遵循的方程和條件,而最優控制的數值算法則是從計算方面來確定最優控制量的具體方法和步驟。

評價最優控制數值算法優劣的三個主要方面是算法的收斂性、計算複雜性以及數值穩定性。算法的收斂性是保證計算過程能達到正確結果的前提。算法的計算複雜性也尤其重要,這對實時控制具有特別重要的意義。一個好的算法應使計算量和存儲量儘可能小,以便能由儘可能簡單的計算機來實現計算。好的算法還應具有較好的數值穩定性,即計算的結果對初始數據和運算過程的誤差不能過於敏感,同時具有處理病態問題的能力。典型的最優控制數值算法包括:求解由極大值原理導出的微分或差分方程的兩點邊值問題的各種算法,對動態規劃中的貝爾曼方程進行數值求解_的算法,求解線性二次型最優控制問題的黎卡提方程的各種算法,處理控制或狀態受約束問題的懲罰函式法,在控制策略的函式空間中利用搜尋尋優或梯度尋優技術和牛頓一拉夫森方法等直接求解非線性系統最優控制問題的算法等。其中,針對非線性系統的開環最優控制問題和線性二次型最優控制問題展開的數值算法研究尤多。

最優問題間接求解法

在間接法中,我們依靠最小值原理和其它一些必要條件得到一個兩點邊值問題,然後通過數值求解該問題得到相應的最優軌跡。在幾種基於打靶法求解兩點邊值問題的方法中,多重打靶法是最引人矚目的。而其它的一些間接數值求解法,比如伴隨方程的向前一向後積分法、函式空間梯度法等,在過去的幾年中套用並不十分廣泛。間接法的主要優點是解的精度高,同時方法保證了求解滿足最優條件。然而間接法常常會遇到比較嚴重的解的收斂性問題。如果在求解中,沒有關於系統初始值的一個好的選取,或是沒有關於約束和非約束下系統運動軌跡的先驗知識,收斂過程可能需要花費很長的計算時間,甚至可能根本無法找到最優解。

最優問題直接求解法

在直接法中,連續性的最優控制問題通過參數化的過程被轉化為了一個有限維的最佳化問題。轉化後的問題可以通過一些已有的比較成熟的約束最佳化算法進行數值求解。相對於間接法而言,直接法無需考慮最最佳化條件,而是直接求解問題本身。直接法不易受到收斂問題的影響,但估計的精度不如間接法。最優的必要條件不是直接滿足的,而且伴隨量的估計精度有時也會很差。

現在比較常用的幾種直接求解方法包括最優參數控制法,有限差分方法,配點法,微分包含方法和偽譜方法。在最優參數控制法中,控制量被單獨參數化,同時數值積分方法被用來求解微分方程:在有限差分方法中,原微分方程和邊界條件被近似為有限差分方程組:在配點法中,狀態量和控制量同時被參數化,在各個節點處,局部分段多項式被用來近似微分方程;微分包含方法只是將狀態量參數化,並使用由速端曲線定義的狀態變化率;在偽譜方法中,通過全局多項式將狀態量和控制量同時參數化,積分方程和微分方程通過求積法被近似。配點法和偽譜方法的一個重要的特點就是伴隨量的相合估計。

非線性預測控制算法的研究

分層控制方法

通過利用遞階算法,將非線性最佳化轉化為協調與線性最佳化兩級計算,或通過非線性反饋實現輸入輸出線性化後,再用線性預測控制算法,以此獲得良好的魯棒性和跟蹤性能。

預測控制原理與先進控制策略相結合

如模糊非線性預測控制、支持向量機非線性預測控制、神經網路非線性預測控制等模糊

非線性預測控制

Hadjili M L(1990)把TS模型作為預測模型,給出了一種非線性預測控制方法CRoubos J A(1990)利用TS模型對多輸入多輸出約束非線性系統建模,然後滾動最佳化獲得控制輸入,並套用於多變數液位系統。Abonyi J(2001)將非線性系統轉換成線性時變系統,後對模糊模型進行工作點線性化,並得到一種模糊非線性預測控制。王寅(2002)提出了一種新的基於TS模糊模型的非線性預測控制策略。他將T-S模型用於描述被控對象的非線性特性,把模糊預測器中的非線性最佳化問題進一步轉化為線性二次最佳化問題,並且證明了這種非線性預測控制策略在無模型失配、閉環穩定、穩態值滿足幅值約束條件等條件下,閉環系統不存在穩態跟蹤誤差。Mahfoufa M(2002)利用TS模型對精餾工業過程進行建模,然後利用帶前饋的長時域預測控制,其獲得的效果明顯好於基於線性模型的預測控制。Sarimveis H(2003)利用TS模型建模,然後利用遺傳算法最佳化求取非線性預測控制律,進行仿真,表明其控制性能良好。Liu B(2 003)提出了一種基於離散最佳化和線上模糊建模的非線性預測控制策略:首先採用線性辨識方法和模糊聚類構建被控對象的TS模糊預測模型;然後利用分支定界法對控制量進行離散尋優,從而實現對被控對象的非線性預測控制。刑宗義(2005)分別用遞推最小二乘法和模糊聚類辨識TS模糊模型的前件參數以及後件參數,將預測時域內的一組線性模型序列作為預測模型,進而把約束非線性最佳化問題轉換為線性二次規劃問題,最終得出多步線性化的非線性預測控制策略。

支持向量機非線性預測控制

由於支持向量機改變了傳統統計模式識別方法,採用結構風險最小化原則,有效解決了有限樣本數目等問題,實現了學習能力與推廣能力的統一。目前在機率密度函式估計、回歸估計、模式識別等都有套用。將支持向量機套用於預測控制目前也得到了重視,並得出大量研究成果。這些研究集中於利用支持向量機對非線性系統進行建模,再利用非線性最佳化等方法求取控制律。這些研究為支持向量機非線性預測控制分析、綜合問題提供一個基本方法與思路。

神經網路非線性預測控制

由於神經網路能夠充分逼近複雜的非線性映射關係[[}l,有較強的容錯性和魯棒性,並且它的並行分布處理方法使快速大量運算成為可能,因此將神經網路和非線性預測控制相結合得到了廣泛的研究。Donat J S(1991)等提出一種基於二次規劃求解的神經網路多步預測控制算法。Mills P M(1994)等利用一種遞推式網路建模進行多步預測,用非線性規劃求解並得出一種非線性預測控制器。Zhang J(1995)利用遞推神經網路提出了一種預測控制算法。李少遠(1996)等基於多輸出的前饋網路對多步預測的偏差進行修正。Najim K(1997)等利用兩個神經網路,基於系統的多步預測目標函式和各種約束條件,線上訓練控制網路求取系統控制律。Huang D P(1998)等利用神經網路模型對過程進行多步遞推預測,並補償產生的累加誤差,得到一種控制大滯後的非線性系統的預測控制。李翔(1999)等將線性化模型套用於廣義預測控制算法,並與非線性前饋增益補償相結合,得到了一種非線性系統預測控制。劉軍(2000)利用多個工作點作階躍回響給出了一種控制算法。林劉賀平((2001)等提出偏差補償與模型修正相結合的反饋校正策略,對性能指標中的偏差項進行負指數加權,不僅提高了實時性,更有效地克服了系統中不確定性因素的影響。

非線性預測控制穩定性的研究

為了實現預測控制和提高其實時性,預測時域往往是有限的。因此,預測控制的最優性並不代表閉環系統的穩定性。預測控制雖然在工業中獲得了廣泛套用,但對於具有輸入輸出約束的、非線性預測控制算法的穩定性研究還不是很多,另外對於不同的對象,如開環不穩定、非最小相位、時滯對象等的穩定性預測控制研究也是熱點。有限時域MPC最優性並不能保證閉環系統的穩定性,MPC穩定性問題研究比較困難,主要原因在於很難得到MPC系統的閉環描述。儘管這樣,仍有一些令人可喜的研究成果出現。這些研究主要集中在標準MPC問題(無模型失配)的基礎上,增加各種條件、約束。

研究成果主要集中在以下幾個方面:

無限時域預測控制

保證閉環穩定最直接的方法是將有限預測時域延長至無限,這樣,最佳化問題有解便意味著穩定性。但是這樣的約束非線性最佳化問題很難有解析解,而採用無限時域又使數值最佳化幾乎不可實現,從工程意義上說,無限即足夠大時域即使套用於緩慢的過程,也會使預測控制算法缺乏實時性而套用受到限制。Rawlings J B C 1993)針對穩定的和不穩定系統將上述無限時域預測控制進一步發展,提出了一種無限預測時域有限控制時域的滾動時域控制策略,標稱系統的閉環穩定性由約束的可行性來保證,而不是通過控制器參數的選取來保證。

終端等式約束預測控制

另外一種方法是在開環最佳化問題中加入一等式約束強制終端狀態回到平衡點。Keerthi S S(1985)首先在MPC的數學表達中加入終端等式約束,為以後的MPC穩定性分析提供了理論基礎。這種思想也可推廣到輸入輸出模型的預測控制,但獲得的僅是輸入輸出穩定性。Mosca E(1990)通過設定零終端約束證明了基於線性輸入/輸出模型非線性系統的穩定性。Mayne D Q(1990)基於LyaPunov理論建立了非線性終端等式約束MPC的穩定性理論。Kouvaritakis B(1992)在將控制系統結構做巧妙變換的基礎上,通過對參考信號設定等式約束,建立了一個穩定的類廣義預鋇(控制系統。GencehH(1995)證明了基於不同表達形式的非線性MPC的穩定性。

雙模變時域預測控制

用數值方法求解非線性最佳化問題時,終端等式約束只能近似滿足。顯然,在此近似範圍內系統將失去穩定性。為此,又出現了用終端不等式約束代替終端等式約束,而在該鄰域之內則用狀態反饋控制的方法。這樣,只要約束最佳化問題有解(不一定是最優解),系統就能到達約束域,閉環穩定性可由線性控制器保證。由於不等式約束容易處理,因此最佳化問題有可行解的範圍也較大,這在工程上是不希望的。

Michalska H(1993)在MPC表達中用終端不等式約束(即要求在預測時域內將系統預測行為驅動至一個區域,而不是一個點)代替終端等式約束,提出了系統在平衡點的一個鄰域之外由MPC控制,在該鄰域之內則由狀態反饋控制的雙模變時域MPC方法。該方法先假設系統在平衡點附近的近似線性化系統是可鎮定的,然後適當選擇終端區域,並要求在可變預測時域內保證初始狀態空間內的任意點可被驅動至終端區域的邊緣。

相關詞條

熱門詞條

聯絡我們