顫抖手精煉均衡:顫抖手精煉均衡是澤爾騰提出的對納什均衡的一個改進，是在博 -百科知識中文網

顫抖手精煉均衡（trembling hand perfect equilibrium）

概念

“顫抖手精煉均衡”概念是澤爾騰提出的對納什均衡的一個改進。顫抖手精煉均衡的基本思想是:在任何一個博弈中,

每個局中人都有一定的犯錯誤的可能性(類似一個人用手抓東西時,手一顫抖,他就抓不住他想抓的東西)。一個策略對是一個顫抖手精煉均衡時,它必須具有如下性質:各局中人ｉ要採用的策略,不僅在其他局中人不犯錯誤時是最優的,而且在其他局中人偶爾犯錯誤(機率很小,但大於0)時還是最優的。可以看出,顫抖手精煉均衡是一種較穩定的均衡。

從博弈論中我們知道，澤爾騰的這種“顫抖手均衡(trembling hand equilibrium)”也是一種精煉納什均衡。大致說來，澤爾騰(1975)假定，在博弈中存在一種數值極小但又不為0的機率，即在每個博弈者選擇對他來說所有可行的一項策略時，可能會偶爾出錯，這就是所謂的“顫抖之手”。因之，一個博弈者的均衡策略是在考慮到其對手可能“顫抖”(偶爾出錯)的情況下對其對手策略選擇所作的最好的策略回應。單從這一點來看，在演進博弈論中，最初的演進穩定性的出現，並不完全來自博弈雙方的理性計算，而實際上可能是隨機形成的(往往取決於博弈雙方“察言觀色”的一念之差)。按照這一分析思路，我們也可以認為，人們對一種習俗(演進穩定性)的偏離，也可能出自澤爾騰所說的那種人們社會博弈中的“顫抖”。

價值

為了說明顫抖手精煉均衡的價值,我們考慮一個具有兩個“委託人—代理人”對和兩種自然狀態的對稱支付模型。設代理人1的策略有:α1(積極工作)和α2(偷懶);代理人2的策略同樣有β1(積極工作)和β2(偷懶)。相應於兩個代理人的策略,在自然狀態ｓ1和ｓ2下,每個委託人的收益如下:

狀態ｓ1(壞)狀態ｓ2(好)　

β1　β2 β1β2　

α1(ｃ1,ｃ2)　(ｄ1,ａ2) α1(ｄ1,ｄ2)　(ｅ1,ｂ2)　

α2(ａ1,ｄ2)　(ｂ1,ｂ2) α2(ｂ1,ｅ2)　(ｃ1,ｃ2)

其中,00單位的額外收益。因此,代理人的收益,可用如下標準形的二人非零和博弈給出:

狀態ｓ1(壞)　

α1β1　( U1, U2)β2　( U1-M)

α2　 (-M, U2) (-M,-M)　

狀態ｓ2(好)

α1β1　( U1, U2)β2　( U1,-M)

α2　 (-M, U2) ( U1+ｌ1, U2+ｌ2)

這樣,在好的環境ｓ2中,代理人之間的博弈有2個納什均衡:(α1,β1)對應收益對( U1, U2)和(α2,β2)對應收益對( U1,+ｌ1, U2+ｌ2);而在壞的狀態ｓ1中,代理人間的博弈只有一個非合作均衡(α1,β1)對應收益對( U1, U2)。觀察上述博弈,我們發現在狀態ｓ2中,(α1,β1)更加有效率(使每個委託人的收益都較大),然而兩個代理人卻更喜歡均衡(α2,β2),因為這個均衡使他們的效用從( U1, U2)升至( U1,+ｌ1, U2+ｌ2)。但是,如果這兩個納什均衡中只有(α1,β1)是顫抖手精煉均衡,代理人就可能不再偏愛均衡(α2,β2)。

顫抖手精煉均衡

概念

價值

相關詞條

博弈理論

博弈論簡明教程

順推歸納法

博弈論

博弈論[經濟學學科分支]

萊因哈德·澤爾騰

萊因哈德·塞爾騰

女神聯盟

相關搜尋

熱門詞條