順推歸納法的分析
順推歸納法是現實中的博弈方對相關問題可能有的其他理解和處理方法中最重要的一種。我們用右圖van Damme(1989)提出的博弈例子說明順推歸納法的思想。這個博弈第一階段是博弈方1的選擇階段,博弈方1首先必須在D和R之間選擇,如果他選擇D,那么結束博弈,雙方各得2;如果他選擇R,則雙方進行第二階段的靜態博弈。這個靜態博弈有三個納什均衡,即純策略納什均衡(S,w)和(w,S),以及雙方都以3/4和1/4的機率分布隨機選擇S和w的混合策略納什均衡。注意如果進行第二階段的靜態博弈,那么上述三個納什均衡給雙方的平均得益明顯小於2。這個博弈的納什均衡路徑之一,是搏弈方1在第一階段就選擇D,而如果達到第二階段的靜態博弈(博弈方1自己在第一階段實際選擇了R),雙方再採用第二階段靜態博弈的納什均衡(w,S)。容易驗證,(Dw,S)是該博弈的子博弈完美納什均衡,並且也是顫抖手均衡。
但對於(Dw,s)是否確實是這個博弈的具有穩定性的均衡是有疑問的。因為如果在這個博弈中博弈方1在第一階段確實選擇了R,那么顯然有比博弈方1的選擇是出了差錯更有說服力的解釋,那就是博弈方1是有意識這么選擇的。如果把這個博弈表示成右圖中的得益矩陣(或稱策略形)形式就很容易理解這一點。根據該策略形不難明白一個理性的博弈方本身就是不會選擇Rw的,因為它是嚴格下策,博弈方1在第一階段選擇R而不選擇D,就是準備在第二階段選擇S。在這樣的判斷下,博弈方2在第二階段的最佳選擇就只有w。如果博弈方1相信博弈方2有分析能力,就可以預計到博弈方2的推理,知道自己第一階段選擇R,有把握在第二階段實現對自己比較有利的均衡(S,w),這當然比第一階段直接選擇D更有利。因此既是子博弈完美納什均衡,又是顫抖手均衡的(Dw,S),實際上是不穩定的。在這個博弈中真正具有穩定性,比較可能出現的均衡,是另一個子博弈完美納什均衡和顫抖手均衡(Rs,w)。
上述分析說明了顫抖手均衡的思想方法確實並不能完全解決動態博弈中均衡的精煉問題。上述根據博弈方前面階段的行為,包括偏離特定均衡路徑的行為,推斷他們的思路並為後面階段博弈提供依據的分析方法,就是“順推歸納法”。順推歸納法考慮的是博弈方有意識偏離子博弈完美納什均衡和顫抖手均衡路徑的可能性,而不是偶然性的錯誤。順推歸納法是精練納什均衡的另一種重要的方法。