多步預測控制

多步預測控制

預測控制是一類新型的計算機控制算法。多步預測控制,是用於數值算法採用多步測試,滾動最佳化和反饋校正等控制策略,因而控制效果好,適用於控制不宜建立精確數字模型且比較複雜的工業生產過程。

多步模型預測控制的模組化多電平控制策略

首先利用環流電流離散狀態方程進行單步環流預測,再選取滿足單步預測效果的投入模組數進行多步環流預測,最終求解出橋臂投入模組數的最佳化解,實現環流電流的多步最佳化控制,從而有效地抑制環流中的諧波電流。所提多步預測控制利用單步預測得到的最佳化解構建多步預測的有限控制集,可以大幅減少多步預測所需要的循環預測次數,有效地降低控制器的計算量。最後在PSCAD /EMTDC中搭建了201電平MMC時域仿真控制系統,仿真結果驗證了所提方法的正確性與有效性。

常規模型預測控制

單步模型預測控制通常是在一個控制周期內利用有限開關組合來進行滾動最佳化,選出最優的開關狀態組合作用於變換器,其算法基本原理中紅色點劃線表示換流器被控量 x的參考曲線 x* ,綠色虛線表示被控量在最優開關組合下的輸出值,藍色實線表示被控量在所有開關組合下的預測值。以被控量 x在 t時刻的採樣值 x( k)為基礎,利用離散數學模型,通過對變換器所有可能的開關狀態進行預測,最終獲得多目標函式最優解對應的開關狀態並將其作用於變換器。這種算法本質上僅考慮換流器被控量在一個控制周期內最優狀態,即能夠實現短期最優控制效果,而對於建立在上述最優開關狀態下的被控量能否在接下來一段時間保持最優控制效果無法得知,其原因是忽視了其他開關狀態可能包含的最優信息,由此可能對控制產生不利影響,例如發散或者振盪。

為了克服單步模型預測控制可能存在的不利影響,提出了一種多步模型預測控制算法,算法基本原理中紫色實線表示被控量在單步預測基礎上利用變換器所有可能的開關狀態來對 t時刻值進行預測。通過對被控量 x進行多個控制周期預測,使其在所選開關狀態作用下能保持長期的最優狀態,即實現長期最優控制效果。

顯然這種多步預測的預測次數隨著預測周期增多呈幾何級數增加,給處理器造成較大的運算負擔,文獻提出的多步預測方法使預測次數隨著預測周期增多呈代數級數增長,另外考慮誤差累積因素,預測控制周期數不能取太多。

最佳化多步模型預測控制

為了克服上述多步預測方法存在的不足,提出了一種最佳化多步模型預測控制方法。

提出的最佳化多步模型預測控制算法原理保留了常規多步預測的優點,能夠保證被控量的多步最優控制效果。與傳統多步預測控制的第1步預測類似,被控量在 t時刻預測均是建立在其 t時刻的採樣值,不同之處在後續的多步預測。所提多步預測在 t時刻的預測值是建立在 t時刻採樣值,預測步長為2 T ,而傳統多步預測控制後續每一步預測值都是基於前一步的預測值,預測步長為 T 。如果預測時間較長,則在相同的滾動最佳化計算量條件下,前者相比後者的多步預測控制將具有更好的控制性能。

預測次數對比列出了幾種多步預測控制方法所需的預測次數。假定變換器每一時刻存在的有效開關組合數為 N,多步預測步數設為兩步預測,則針對傳統多步模型預測方法,首先利用被控量在 t時刻採樣值進行 N次預測,得到其在 t時刻可能出現的 N種狀態,然後對每一種狀態再進行 N次預測得到被控量在 t時刻可能出現的 N 種狀態,並最終選取 N 種最優的狀態所對應的開關組合,總的滾動最佳化計算量為 N+ N 。文獻所提的多步預測控制方法與傳統方法不同之處在於它是選取 t預測狀態中最優的兩種狀態來分別進行第2步預測,得到被控量在 t時刻可能存在的2 N種狀態,故總的滾動最佳化計算量為 N+2 N=3 N。文獻中提到的多步預測控制方法首先通過預測得到 t時刻 N種狀態,然後再保持各自第1步的開關組合繼續作用得到 t時刻 N種狀態,總的最佳化計算量為 N+ N=2 N。而提出的最佳化的多步預測控制首先進行第1步預測得到 t時刻 N種預測狀態,隨後選取其中最好的兩種狀態所對應的開關組合繼續作用得到 t時刻的兩種預測狀態,並將最好狀態所對應的開關組合作用於 t時刻,其最佳化計算量為 N+2。

pH值的神經網路多步預測控制算法

pH值控制過程是一個具有較強非線性、純滯後的過程。針對pH值控制系統提出了一種基於神經網路的多步預測控制算法(NMPC)。神經網路用於辨識對象的預測模型,控制算法利用了神經網路的梯度信息。控制效果表明該控制系統具有較好的動態性能和較強的魯棒性。

控制算法的實現

利用辨識出的神經網路模型就可以對過程進行多步預測控制。在每個時刻可以預測出未來 P個時刻的輸出變數,這裡定義 P個預測輸出值和設定值的誤差平方和為最優控制指標。

由於在 k時刻, y( k+ d)是未來的輸出值,無法測得,所以使用已求得的 u( k-1)來預測出未來的輸出值 y ( k+ d),由 y ( k+ d)來近似代替 y( k+ d)。為求得最優控制量,這裡採用的是與BP算法相類似的誤差反向傳播方法。與BP算法不同的是,在計算過程中修正的是神經網的部分輸入,而神經網的權值始終保持不變。

神經網的部分輸入經過反覆修正,當控制指標 E達到設定要求後,就可以將控制量 u( k)加到過程中。對於控制量的幅值約束,容易在網路修正中解決:當任一個 u( k+ i)達到約束的上下限值時,則 u( k+i)不再繼續修正,而被指定為該上下限的值。為了減小由於時變、擾動等原因造成的模型失配對控制的影響,可以在預測輸出時通過引入實時輸出信息進行校正。

控制實例

pH值控制系統流程中,鹼性廢水流入反應池中,同時加入濃硫酸HSO進行中和,反應後的廢水不斷地流出反應池。鹼性廢水的流速恆定不變,但濃度可能發生變化,即pH可作為擾動 ; HSO的濃度恆定,流速 F可通過改變閥門開度調節,閥門開度作為控制量。控制的目標是使流出廢水的pH值pH達到設定值。由於廢水的流速和反應池容積都是恆定的,故從廢水和酸液的加入到廢水流出的時延 d也是恆定的。

選用三層前傳網作為一步預測模型,其結構為N (3,8,1),其中隱含層的非線性激勵函式採用sin、cos,實踐表明,採用這種函式的網路收斂速度快且不易陷入局部最小點。在預測模型中,取硫酸閥門開度為 u,流入廢水的pH1為 l,流出廢水的pH為 y。多步預測的預測時域 P取5,控制時域 M取3,過程純遲延 d為30s,採樣時間取5s。從過程現場採得閉環數據,離線對神經網路模型進行辨識。可見,神經網路模型經過充分訓練後,能夠很好地近似過程的動態特性。將訓練好的神經網路模型用於過程的多步預測控制,對它和變增益PID控制的控制效果作了對比。對於pH發生突變等擾動的控制效果中,由於神經網路模型可以預測出以後 P步的輸出,並可據此直接求出最優控制量,而PID控制則要通過反覆校正才能逐步減小靜差,獲得令人滿意的控制量。因此多步預測控制能大大提高控制速度。可以看出,基於神經網路的多步預測控制的回響速度和抗干擾性均明顯優於變增益的PID控制。

相關詞條

熱門詞條

聯絡我們