由來
“蜈蚣博弈”(centipede game)是由羅森塞爾(Rosenthal)在1981年提出的一個動態博弈問題。由於這個博弈的擴展形很像一條蜈蚣,因此被稱為“蜈蚣博弈”。
解釋
“蜈蚣博弈”是指這樣一個博弈:兩個博弈方A、B輪流進行策略選擇,可供選擇的策略有“合作”和“不合作”兩種。他們的博弈展開式如下:
A —— B —— A ——…… A —— B —— A —— B —— (10,10)
| * * * * | * * * | * * * * * * | * * * *| * * * * | * * * |
(1,1) * (0,3) * (2,2) * * * (8,8) * (7,10) * (9,9) * (8,11)
在圖中,博弈從左到右進行,橫向連桿代表合作策略,向下的連桿代表不合作策略。每個人下面對應的括弧代表相應的人採取不合作策略,博弈結束後,各自的收益,括弧內左邊的數字代表A的收益,右邊代表B的收益。如果一開始A就選擇了不合作,則兩人各得1的收益,而A如果選擇合作,則輪到B選擇,B如果選擇不合作,則A收益為0,B的收益為3,如果B選擇合作,則博弈繼續進行下去。
可以看到每次合作後總收益在不斷增加,合作每繼續一次總收益增加1,如第一個括弧中總收益為1+1=2,第二個括弧為0+3=3,第二個括弧則為2+2=4。這樣一直下去,直到最後兩人都得到10的收益,總體效益最大。遺憾的是這個圓滿結局很難達到!
大家注意,在上圖中最後一步由B選擇時,B選擇合作的收益為10,選擇不合作的收益為11。根據理性人假設,B將選擇不合作,而這時A的收益僅為8。A考慮到B在最後一步將選擇不合作,因此他在前一步將選擇不合作,因為這樣他的收益為9,比8高。B也考慮到了這一點,所以他也要搶先A一步採取不合作策略……如此推論下去,最後的結論是:在第一步A將選擇不合作,此時各自的收益為1!這個結論是令人悲傷的。
不難看出,在該博弈的推理過程中,運用的是逆推法。從邏輯推理來看,逆推法是嚴密的,但結論是不合理的。因為一開始就停止的策略A、B均只能獲取1,而採取合作性策略有可能均獲取10,當然A一開始採取合作性策略有可能獲得0,但1或者0與10相比實在是很小。直覺告訴我們採取“合作”策略是好的。而從邏輯的角度看,A一開始應選擇“不合作”的策略。人們在博弈中的真實行動“偏離”了運用逆推法關於博弈的理論預測,造成二者間的矛盾和不一致,這就是蜈蚣博弈的悖論。
同類比較
囚徒困境(prisoner's dilemma )是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。在該博弈中的納什均衡,顯然不是顧及團體利益的帕累托最優解決方案。