《圖說博弈論:生存競爭中的策略遊戲》

《圖說博弈論:生存競爭中的策略遊戲》

人的一生只做兩件事情,等待和決策。面對生存,你的選擇決定著行動方向;面對競爭。你的策略影響著成敗勝負。在這永不停息的選擇、決策和行動過程中,你需要理性的思維和智慧的方法。

基本信息

編輯推薦

著名經濟學家保羅·薩繆爾森說:“要想在現代社會做一個有文化的人,你必須對博弈論有一個大致了解。”在這個充滿著利益衝突。甚至少不了一些爾虞我詐色彩的世界上,博弈論有助於我們認識問題的實質和作出更理性、更符合自身利益的選擇。

內容簡介

《圖說博弈論(生存競爭中的策略遊戲活學版)》介紹了我們的一生,可以看做是永不停息的博弈決策過程。無疑,在這個總是充滿著利益衝突、甚至少不了一些爾虞我詐色彩的世界上,博弈論有助於我們認識問題的實質和找到更理性、也更符合自身利益的選擇。為了自己,也為了與他人更好地合作,你需要學習一點博弈論的策略思維。正因如此,著名經濟學家保羅·薩繆爾森說:“要想在現代社會做一個有文化的人,你必須對博弈論有一個大致了解。”

目錄

導言 人人的博弈論
誰應該學習博弈論
關於策略的選擇智慧
思維樂趣與邏輯制勝
一、囚徒困境:理性決策與不理想的結局
囚徒的選擇
兩個聰明人的麻煩
改變收益值:菸草商的意外救贖
“囚徒困境”的正效用
自私與利他
二、“重複囚徒困境”:合作為什麼是可能的
未來預期與策略選擇
“重複囚徒困境”競賽
“一報還一報”的偉大勝利
總想著贏,結果便會是輸
背叛的潛在風險
報怨,也要報德
過分聰明可能事與願違
以眼還眼,以牙還牙
如何避免陷入“冤冤相報”的循環
三、囚徒·智豬·納什均衡:博弈中必然存在的“理性解”
博弈中的“極小極大原理”
尋找自己的優勢策略
“智豬博弈”:當對手有優勢策略時
小豬的優勢策略
“當家不鬧事”
追求最佳,避免最差
博弈的均衡——納什均衡
“警察與小偷”:混合策略均衡
四、“膽小鬼”博弈:所謂“危機”——理性和不理性的悖論
不良少年的危險遊戲
“理性人”的瘋狂之舉
“亡命徒”策略
古巴飛彈危機
臨界點在哪裡
玩火者策略”:怎樣讓威脅變得可信
比策略更重要的因素
世界為什麼沒有變成瘋人院
贏得“膽小鬼”博弈
五、上校賽局:兵法與博弈原理
上校賽局
戰爭兵法與藍徹斯特定律
分散敵軍,各個擊破
防守還是進攻
攻城博弈
公平還是不公平
六、“拍賣陷阱”:博弈的支付問題
成本是什麼
神秘的沉沒成本
“每個人都有自己的價錢”
成本決定成敗
美元拍賣博弈
“走向深淵”
嚴格限定條件下的推理法則
騎虎難下的核威懾
七、“檸檬市場”與信息博弈
“虛張聲勢”
知己知彼與出其不意
上當的古董商和所羅門王斷案
破解“檸檬市場”
“信用印章”
八、“交換錢包”博弈:策略選擇中的邏輯悖論
選擇的悖論
別人的錢包總是更誘人
信息與理性
換還是不換
邏輯中隱藏的陷阱
“獎懲分明”
“不虞現象”
九、“酒吧問題”與觀眾選美:混沌現象中的決策
“長線”與“短線”
酒吧問題
無法預測的“蝴蝶效應”
選股與選美
股市裡的混沌
十、分蛋糕博弈:如何通過制度安排促進公平與合作
從“孔融讓梨”說起
當道德遭遇自私
“看不見的手”如何增進社會福利
“分蛋糕博弈”
公平是博弈的結果
蛋糕和木桶
十一、“一人一票”:阿羅“不可能”定理與選舉陷阱
阿羅“不可能”定理
民主是一種自相矛盾
各種投票制度的利弊
複選制的悖論
效能與民意
既然如此,為什麼民主仍然是好的
十二、帕累托效率與邊際效用
獵人博弈”的帕累托優勢
“大家好,才是真好”
為什麼“重農抑商”
公平vs效率
有道理的不平等
十三、“搭便車”博弈:公共品的供給難局
志願者困境”與“圍捕牡鹿”
“搭便車”帶來的大問題
協調者和管理者
“好人好報”:如何促進道德建設
十四、“聰明”還是“自作聰明”——博弈論的三個缺陷
博弈論:“經典”還是“時髦”
“核戰爭的優勢策略”
“科學”還是“偽科學”
偏好問題:麥琪的禮物
理性的困境
非理性還是理性
博弈論的功能和限制
結語 誰是聰明人

精彩書摘

一、囚徒困境:理性決策與不理想的結局
個體的理性選擇卻導致了雙方很不理想的結果,這就是“困境”所在。“囚徒困境”是指把一些非常普遍而有趣的情形簡單化、抽象化,為我們探討人們合作的形成及合作中的問題,提供了極為形象的解說方式。
囚徒的選擇
在博弈論的所有案例和模型中,“囚徒困境”無疑是最著名的,甚至可以說,不談“囚徒困境”,我們就無法談博弈論,所以讓我們就從兩個囚徒的故事開始吧。
1950年,數學家塔克在擔任史丹福大學客座教授期間,給一些心理學家作講演時,他用兩個囚徒的故事將當時專家們正研究的一類博弈問題,作了形象化的解釋。從此以後,類似的博弈問題便有了一個專門名稱——“囚徒困境”。現在,“囚徒困境”已經廣為人知,在經濟學、倫理學、社會學、政治學、哲學乃至生物學等學科中,獲得了極為廣泛的套用。
“囚徒困境”的版本很多,現在被普遍使用的版本大致是下面這樣:
兩個作惡多端的歹徒在攜槍準備作案時,被警察發現抓了起來。因為沒有其他犯罪證據,警方只能以非法攜帶槍枝的輕罪處罰他們。但是警方懷疑這兩個人可能還犯有其他重罪,於是分別進行審訊。為了分化瓦解,警方告訴他們中的每一個:如果主動坦白,可以減輕處罰;頑抗到底,一旦同夥招供,你就要受到嚴懲。當然,如果兩人都坦白,那么所謂“主動交代”也就不那么值錢了,在這種情況下,兩人還是要受到嚴懲,只不過會因為認罪態度較好,而比拒不交代要輕一些。
簡單總結一下,兩個囚徒面臨的選擇不外以下幾種結果(為了更清楚地說明問題,我們給每種情況設定具體刑期):
如果兩人都不坦白,警察便抓不到證據,只能以非法攜帶槍枝罪而將二人各判刑1年;
如果其中一人招供而另一人不招,坦白者將被作為污點證人免於起訴,另一人將會被重判15年;
如果兩人都招供,則兩人都會因搶劫罪各判10年。“囚徒博弈”示意圖如下所示:
在這種情形下,兩個囚徒都可以作出自己的選擇:或者背叛他的同夥,換取自己的從寬處理;或者與他的同夥合作,對警察的威逼利誘保持沉默。
兩個聰明人的麻煩
這兩個囚徒該怎么辦呢?是選擇互相合作還是互相背叛?從表面上看,他們應該互相合作,保持沉默,因為這樣他們倆得到的是對雙方來說最好的結果——只判刑1年。但他們不得不仔細考慮對方可能採取什麼選擇,於是問題就這樣開始了。我們假定兩個人都十分精明,而且都只關心減少自己刑期,並不在乎對方被判多少年——這符合經濟學中“理性人”的假定:人都是考慮個人利益最大化的。
徒甲會這樣推理:
假如乙不招,我只要招供,馬上可以獲得自由,而不招卻要坐牢1年,顯然招比不招好;假如乙招了,我若不招,則要坐牢15年,招了只坐10年,顯然也是招供為好。可見:無論乙招與不招,我的最佳選擇都是招供,所以還是招了吧。
也就是說,如果你認為對方將選擇與自己合作,你背叛能得到更多;如果你認為對方將背叛,你背叛也能得到更多。你背叛總是好的,無論對方如何行動。
但是,相同的邏輯對另一個人也同樣適用。因此,另一個人也將背叛而不管你如何做。
於是兩人都作出招供的選擇,這對他們個人來說都是最佳的,即最符合他們個人利益的選擇。照博弈論的說法,這是他們雙方的“優勢策略”,也是本問題的唯一平衡點(即“納什均衡”,關於這一點以後還要詳細討論)。
可是問題出現了:這樣一來,兩個囚徒將是雙方背叛,只能一起坐上長達10年的牢,這比雙方合作所能得到的“獎勵”(只需短期服刑1年)差很多。也就是說,從個體的角度來說,背叛是最好的選擇,但雙方背叛會導致很不理想的結果,這就是“困境”。
為什麼聰明的囚徒,卻無法得到最好的結果?產生不良結局的原因是因為囚徒二人都基於自私(用經濟學的術語,是“個體理性”)的角度開始考慮問題的,站在這個立場上看,“合作”就成了“非理性”的選擇。
“囚徒困境”是把一些非常普遍而有趣的情形簡單化、抽象化,可以說是理性的人類社會活動最具形象的比喻。為我們探討人們合作的形成及合作中的問題,提供了極為形象的解說方式。因此它被廣泛套用於經濟學研究,特別是在分析寡頭市場(指一個被少數人控制的市場)合作與競爭的選擇研究中。
需要特別指出的是:囚徒博弈是完全信息下的靜態博弈。所謂完全信息,指的是兩個罪犯都知道雙方各自策略下的支付;而靜態博弈指的是一方的策略不受另一方策略的影響。這一點並不因為他們被分隔審問而有所改變。也就是說,即使一個罪犯已經知道了他的同伴咬牙不招,他的最佳策略仍然是招供。從這個意義上說,兩個囚徒相互出賣的命運是“冤家命定、在劫難逃”的。換言之,只要給定雙方選擇的條件,那么即使允許“共謀”,“囚徒困境”還是會出現。
20世紀80年代,美國曾發生過一個幾乎可以說是“囚徒困境”的翻版案例。兩位主人公是兩家航空公司的總裁,他們的公司正在為了爭奪市場份額而激烈競爭。一位總裁給他的對手打了電話,希望結束“我們愚蠢地拼個你死我活,卻一分錢也沒賺到”的價格戰,要求雙方同時提價20%。這是違反《反托拉斯法》的共謀行為。結果另一位總裁卻把對話錄了音,並把錄音帶交給了法務部(他這樣做,是擔心自己也因此惹上官司),於是這位一心“合作”的總裁立即遭到了起訴。
改變收益值:菸草商的意外救贖
從上面的例子來看,一旦陷入“囚徒困境”,其中任何一方都無法獨善其身,即使雙方都有合作意願,也很難達成合作。那么,有什麼辦法可以使我們逃脫“囚徒困境”呢?
那些碰到“囚徒困境”的人有一個共同的反應,即“應該有一個東西(法律或別的什麼權威)來阻止這類事情的發生”。例如,在“囚徒困境”的故事中,如果兩個同案犯同屬一個幫派組織,而這個幫派對背叛者有嚴厲的懲罰措施,那么這將大大降低背叛同夥的收益值,使得兩個囚徒都不再把背叛當成一種理性選擇,這樣他們就可以由於雙方保持沉默的合作而得到較輕的徒刑。
事實上,幫助人們擺脫“囚徒困境”正是政府的一個主要的功能:要求人們無論如何也得做那些對社會有用的事—一即所謂“公民義務”,比如交稅、守法、忠實履行與陌生人的契約。這每一件事都可以看做是有許多人參加的大“囚徒困境”:沒有人願意納稅,因為它的好處(如各種社會福利、公共設施的建設等)對個人而言是間接的,而代價是直接的。但是如果你逃避交稅,你就可能被送進監獄,這種前景使得背叛的選擇就不那么吸引人了。政府所做的正是改變有效的收益值,結果是每—個人都納稅,大家都能生活得更好,即分享學校、道路和其他公共設施的好處。這就是盧梭所說的,政府的作用就是保證每一個公民“被強迫得到自由”。
在收益結構上作調整,能夠改變策略的相互作用,使得情況不再是一個“囚徒困境”。如果對背叛的懲罰是如此之大以至於不管對方如何選擇,從短期來說合作都是最好的選擇的話,那么就不再有“困境”。可是,收益值的改變沒有必要如此激烈才能奏效,其實相當小的一點兒改變就可以有助於回報合作的穩定,儘管這相互作用的情況仍然是“囚徒困境”。
這裡只說一個外力干預打破“困境”的例子,它很有悖謬甚至滑稽的色彩。
1971年,在“禁菸運動”的聲勢下,美國國會通過了禁止在電視上做菸草廣告的法律。令許多人奇怪的是,這一回財大氣粗的菸草公司反應相當平靜,並沒有動用其龐大的社會資源和影響力阻止這個法律的通過。而且,後來的統計資料表明:儘管菸草廣告因受到限制而減少,可是菸草公司的利潤卻提高了。
你是否知道菸草公司為什麼不反對,甚至可能還歡迎這項法律?因為這個禁令使他們從“囚徒困境”中解放了出來。
菸草行業同樣競爭激烈,為了爭奪市場,各大菸草公司都必須大做廣告。為此,它們每年都要花費巨額的廣告費用,這無疑降低了它們的利潤。也就是說,如果菸草公司都不做廣告,它們的利潤要更高。可是,如果其中一家公司不做廣告,它的市場份額就會被其他公司搶走。這正是一個“囚徒困境”:你合作,對方不合作,你就吃虧了。在這種情況下,做廣告就是優勢策略。那么,菸草公司能否達成都不做廣告的協定呢?不能,因為誰遵守協定,就很可能被對手耍弄。
現在好了,菸草公司做不到的,國家為它做了:法律起到了協定的作用,而政府承擔了監督的責任,菸草公司又何樂而不為呢?

相關詞條

相關搜尋

熱門詞條

聯絡我們