概述
。
該博弈是1994年由考希克·巴蘇教授(Kaushik Basu)提出,博弈情形如下:
航空公司丟失了兩位互相不認識乘客的旅行包。兩個旅行包正好都是一樣的,並且裡面有相同價值的古董,兩位乘客都向航空公司索賠100美元。為了評估出古董的真實價值,公司經理將兩位乘客分開以避免兩人合謀,分別讓他們寫下古董的價值,其金額要不低於2美元,並且不高於100美元。同時還告訴兩人:如果兩個數字是一樣的,那么會被認為是其真實價值,他們能獲得相應金額的賠償。如果數字不一樣,較小的會被認為是真實價值,而兩人在獲得這個金額的同時有相應的獎賞/懲罰:寫下較小金額的會獲得2美元額外的獎勵,較大的會有2美元的懲罰。現在問題在於:兩位旅行者應該用什麼策略來決定他們應該寫下的金額?
如果兩位旅行者的收益變成兩個整數的選擇,比如2美元和3美元,那么旅行者困境在數學上就等同囚徒困境,所以可以被看作是囚徒困境的延伸。該困境還和猜均值的2/3博弈相似,為了得到納什均衡,兩個博弈都涉及到了疊代去除占優策略,並且實驗結果與博弈論的預測都嚴重不相符合。
博弈論認為,如果兩個人是理性人,那么他們會都寫2美元,這個結果是該博弈的納什均衡。然而,實驗中,大多數測試者都會選擇100美元,或者接近100美元。他們也清楚自己並沒有認真思考這個情況,選擇了非理性的結果。並且,旅行者們會因為在博弈中嚴重偏離納什均衡而獲得比理性行為高很多的收益。該實驗及沒有證明大多數人都是完全理性人,也沒有證明他們如果理性行為就能獲得更多收益。這個困境讓人們對博弈論產生了懷疑,與此同時,由人建議需要有一種新的解釋,來幫助理解如何來完全理性的來作出非理性選擇。
收益矩陣
一個典型的收益矩陣如下(僅考慮整數):
典型的旅行者困境收益矩陣 | |||||||
100 | 99 | 98 | 97 | 3 | 2 | ||
100 | 100, 100 | 98, 101 | 98, 100 | 98, 99 | 98, 5 | 98, 4 | |
99 | 101, 98 | 99, 99 | 97, 100 | 97, 99 | 97, 5 | 97, 4 | |
98 | 100, 98 | 100, 97 | 98, 98 | 96, 99 | 96, 5 | 96, 4 | |
97 | 99, 98 | 99, 97 | 99, 96 | 97, 97 | 95, 5 | 95, 4 | |
3 | 5,98 | 5, 97 | 5,96 | 5,95 | 3,3 | 5, 4 | |
2 | 4,98 | 4, 97 | 4,96 | 4,95 | 4,5 | 2, 2 |