概念
開關曲面(switching surface)亦稱轉換曲面。是一種曲面,指最優策略(u,v)的值發生跳變的曲面,例如,在某一具體問題中(快慢路徑問題),當最優軌線經過開關曲面時,v的值由-1跳變為+1,見下圖。也有這樣的例子,某一開關曲面處,u發生跳變,在另一開關曲面上,v發生跳變等。
最優策略
亦稱“平衡策略”、“穩定策略”。在對策中,能夠形成平衡局勢的局中人的策略。最優策略構成對策的解。它根據局中人選取策略的形式是有目的地選取,還是根據一定的機率值隨機地選取,分成最優純策略和最優混合策略兩類。在有鞍點的矩陣對策中,參與對策的局中人根據鞍點選取並構成平衡局勢的策略為最優純策略。在沒有鞍點的矩陣決策中,參與對策的局中人的最優策略為最優混合決策。
動態規劃的基本概念之一。是從允許策略集合中找出達到最優效果的策略。在實際問題中,可供選擇的策略有一定的範圍,稱此範圍為允許策略集合。初始狀態為x的後部子過程所有子策略中最優的策略稱為最優子策略。
動態規劃
動態規劃是最佳化理論和運籌學的一個重要分支,它是解決多階段決策過程的一種最佳化方法。它的理論根據是L.R.Bellman等人提出的 “最最佳化原理”。動態規劃問題沒有標準的數學構成,只有求解問題的一般性六個步驟:
(1)將問題恰當地劃分若干階段;
(2)正確地確定每一階段有若干個可能狀態;
(3)每一階段上的決策效益是從一種狀態轉移到下一階段某個狀態時對目標函式所作的貢獻;
(4) 寫出狀態轉移方程;
(5)確定各階段各種決策的直接指標: 列出計算各階段最優策略指標的遞推方法;
(6)求解過程從尋求最後階段的每種狀態下的最優決策開始,按與實際過程相反的方向,向最初階段推移。
近年來,動態規劃在工程技術、經濟、工業生產及軍事等部門都有廣泛套用,並獲得顯著成就。
動態規劃問題可根據決策過程是有限階段或是無限階段而分類;還可根據狀態變數劃分為連續狀態變數問題或離散狀態變數問題;以及是否含有隨機性參量劃分為隨機性和確定性兩類等等。