提要與思考
這個簡單的例子,幾乎是博弈論的代名詞。兩個基於“坦白從寬,抗拒從嚴”審訊的囚徒,從理性的角度出發,會產生怎樣的結局?結果若是,從個人理性並追求個人利益最大化,那么二人皆坦白,也就是背叛。這在四種策略中並不占優,那為什麼不採用集體最有策略呢而合作。很簡單集體的最佳化,必然侵害個人利益的最大化。當然這一切前提是理性假設,也就是著名的經濟人假設:經濟學中的人都是“小人”(管理學則認為人是“君子”,有意思而有道理的比喻)。破解這一困境的途徑則是打破信息孤立,而執法者的反制則是維持孤立或者加強威脅。無論背叛還是合作,誰在這裡面堅持到最後,誰將取勝。
博弈信息
重複博弈
囚徒困境,砸了傳統經濟學的場子。因為個人的自利行為,並不一定導致集體利益的最大化,“看不見的手”拉不住,人類向墮落之城下滑的趨勢,難道這真是一個悲哀?索性並非如此,撇去博弈論的理性假設不說。博弈論者很快發現囚徒困境只在單次博弈情形下明顯,一旦博弈的開始陷入重複,合作將到來。因為,未來的收益將左右目前的決策。
以牙還牙
重複的博弈理論上導致了合作的產生,但是誰也不能保證合作的繼續,因為之前已經說過,合作的代價是建立在損害個人利益基礎之上的。如果個人放棄未來收益或當前背叛收益大於未來收益,背叛的風險仍然存在。那么在重複博弈中怎樣的策略才是最優。若干睿智而複雜在經過計算機中PK之後,極其原始的“以牙換牙”策略脫穎而出,固然這個策略簡單至極,其威力卻無窮,以至於人們在短暫的欣喜之後,發現這把太阿指之劍倒持的可怕,一旦重複鏈條中出現一次(也許不經意的)背叛,那據此原則行事的博弈將永無止境的背叛下去,個人利益極度膨脹的同時,集體利益無限衰微。幸好,這個世界不是模型,也不是如此簡單。很多時候,我們不必以牙還牙,第三方的規範:道德與法律就是我們的假牙,他們更加有利、有理、有節。
人質困境
一場憋屈的博弈。搶打出頭鳥,人質聯合固然可以制服歹徒,但是誰願出頭。這一點給了無數處於劫持者地位的一方以機會,類似於秦的遠交近攻、各個擊破的策略,將最終全盤贏下。人質可有反制的策略,當然有,不過艱難至極。人質可以選擇沉默,這樣他有一定時間苟延殘喘;或者聯合劫持者對付人質,結局還是取決於劫持者,萬一他過河拆橋怎么辦;同時反抗,集體將獲得左右策略,但是這需要壯士斷腕的勇氣,部分人可能因此受傷。這裡是實力與勇氣的較量,而且實力暫居上風。
酒吧博弈
如果人人理性,那么每一天到達酒吧的人數將是差不多正好的,但是人非聖賢,往往是有限理性的。第一次到酒吧的人多,那么大多人人認為酒吧人太多,太擠。第二次決定的時候,參考前次而不去酒吧。少數去的人發現酒吧的人第二天很少,感覺很爽,第三次將繼續回來,並重新帶回許多人……循環就此開始。酒吧博弈一方面顯示,現實的博弈參與者,是極其有限理性的,其理性只前延後伸一小段。歷史數據只對計算機有用,對人,則不一定。
另一個方面,酒吧博弈指出,勝利者永遠只是少數。儘管酒吧存在調諧的可能,譬如發簡訊時時提醒,但成本恐怕太高。而在其他場合,少數派可能更加會設定種種障礙阻止後進者的上升。也就是說,我們的世界仍然是操弄在少數派的手中。不過,總算這個世界不是模型,少數派的道路到底還是有跡可循的。老練的將軍仍舊會在八卦迷陣中找到唯一的生門。若你想要,必須做一個更加老練的將軍。
槍手博弈
王者的悲哀。三人對槍自決,甲乙丙槍法優劣遞減。最後無奈而神奇的結局,將不取決於同時開槍還是先後開槍,最優良的槍手,倒下的機率將最高;而最蹩腳的槍手,存活的希望卻最大。因為沒有人會把威脅最小的槍手列為一號清楚目標。在這裡,後發制人的弱勢者將勝出。以弱勝強,絕不是神話。
難道王者的命運就真如此不堪,呵,道別忘了每個理論模型都是有其前提的,擊破之中任何一個,王者仍將歸來。這就是先發優勢。假設這是一場類似CS的競技,優秀的槍手擊倒二號槍手,立刻獲得獎勵:盾牌。那么三號槍手將陷入絕境。不過,不管怎樣,這個博弈模型,到底給了弱勢者一份希望。機會永遠存在。
獵鹿博弈
兩個獵人合作獵鹿獲得的收益將遠大於分別獵兔的收益,戰略聯盟將開始。這或許是件好事,不過有取決於最後獵獲的鹿——這一公共資源的分配,如果分配得當,整體的效率將增加。如果一方主導,另一方受損,那么帕累托改善無法進行,合作可能終將破裂。
另外一個問題,更加大局的問題。合作的示範性將使得更多的獵人加入,獵獲的鹿將大大增加,人類的利益短期內將呈幾何級數增長。但是最後,確是生態失衡,鹿群滅群。短暫的繁華之後,獵人將再一次回歸於原始獵兔生活。儘管為了避免這一悲劇,人類還有最後的希望:制度經濟學的法寶——科斯定理以產權歸屬來解決外部經濟問題。但由於談判成本以及可行性,人類社會的公共悲劇仍將不斷上演。
智豬博弈
混沌之前最後的博弈。小豬和大豬住在豬圈的一邊(食槽在這裡),開啟食物的開關在另一頭,誰去踩,誰喪失先機。結果怎樣?是小豬選擇“搭便車”,大豬勤跑。因為小豬無論跑還是停,大豬的最優策略都是策略都是去踩機關。不過在實際生活中。這裡依舊存在兩種策略。
小豬的“搭便車”大豬有的時候,自覺或不自覺地自封“俠之大者,為國為民”,並因此承受一些不能承受之重。《博弈論的詭計》指出美國戰後的行為極似大豬,戰後的美國竭力宣傳自己的普世價值觀,並深入到海外事務,甚至不惜重金協助小國防務。這樣小國不自覺地對大國進行了“剝削”。
大豬在擊破模型的一個假設之後,仍然有一個後發制人的機會。因為大豬和小豬的耐餓能力不一樣,大豬完全有能力撐得更久,小豬如果不想餓死,那只有一條豪賭的路子:龜兔賽跑式的豪賭,但願大豬打了個盹兒,他回來的時候,還能吃上一兩口,要不然真是賠了夫人又折兵了。據此,再也不難解釋為什麼很多人切齒的騰訊,毫無顧忌地跟風,做QQ旋風,做拍拍,做滔滔。因為不甘心的小豬早早把新技術研發的前期搞定了,大豬們只需要悄悄跟隨,適當的時候踢開擋路的,就可以了。
大豬在這裡的後發制人和槍手博弈的後發並不一致,槍手後發是建立在他人惡鬥的基礎上,大豬後發完全是以自身實力為基礎。而且大豬完全不必採取任何激進措施,只要跟隨就好。因為小豬獲勝的條件不是接近,還是距離。
警察與小偷
令人沮喪的博弈結局。警察和小偷各只有一個機會去巡查或者偷盜A地或B地。A地的價值大於B地,那么警察應該為了保護價值大而一直保護A地嗎。博弈論認為當然不是,警察的合理策略應當是有傾向於A以一定機率的隨機巡查。這個機率就是:p=A地價值/AB地總價值。這種情況下才能使小偷最大得手幾率降至最低。但是很不幸的是,此時的小偷謀求的是,最小得手幾率的最大化。也就是說,警察的最優策略將把小偷的最差策略改良!這個便是馮·諾伊曼提出的“最小最大定律”。
我們必須再一次感謝這個不完美的世界,因為現實之中,類似的現象,對於一方仍然可以設法找到對手致命的規律性行動(當然必須考慮到對方是不是一個更加老練的獵手,故意放出的誘餌)。而保持自己的行動的無序性,則有可能成為欺騙策略的武器,這倒似張三豐所言道的:無招勝有招。
鬥雞博弈
兩隻鬥雞在決鬥的時候,無論選擇進或退都是一個難題,因為納什均衡已經給出了一勝一敗的最優策略。在很多較量下,死拼將是得不償失的,因為很可能給第三者機會。因此,兩個已經在戰場的強勢力很可能自覺的遵循納什均衡,當一方攻擊時,另一方暫退。雖然可能某方暫時受損,但較之於兩敗俱傷是好得多的。不過,要維持這一狀況,必須保證下一次先期受損的一方發動攻勢的時候,另一方同樣的後退。於是這樣的攻擊性行為開始變得“儀式化”,沒有人真正流血。這只不過是兩個巨頭玩弄的遊戲,目的是警告後來者,想進來,那么也得陪我們一起玩,可是你玩的起么?這正是百事的廣告,即使暗含挑釁也最多只到“敢為中國紅”這樣的地步的原因。
協和謬誤
歐洲政府在大量投資協和飛機後,終於不能自拔。即使前景黯淡,也撐著面子投下去,非要走投無路才放棄。而這時投入的成本已經全打水漂了。如果,發現不能繼續的時候,就果敢放手,損失會小得多。可是他們會、能這么做么?壯士斷腕,是何等的壯烈,卻也是何等的艱難!
沉沒成本很可能會延續人們無畏的堅持。已經沉沒的本該放棄,可惜大部分有賭徒式的心理,相信阿基米德的槓桿終將啟動。可惜他們在爬到足夠撬動槓桿的支點之前,已經窒息了。
協和謬誤,倒是給了人們半途而廢的理由,會不會有人擔心它的濫觴會左右一些本該堅持的目標?的確有這個可能,但是應該相信人們足夠理智,完全可以比較沉沒成本、機會成本與未來收益的關係。看清了的,必定會坦然地走出協和謬誤。
蜈蚣博弈
一場顛前倒後的博弈。蜈蚣博弈的機理是以最終的結果倒退至開始。這是一個睿智的策略,因果相報,把握好因緣,自有好結果。它的另一個好處,就是使得未來的計畫明晰化,是你不再徘徊。只可惜,很多時候,碌碌無為的我們並沒有看透迷局的眼睛。我們黑色的眼睛只習慣於黑夜。
蜈蚣博弈也有一個致命的悖論,仍舊是個人利益和集體利益的衝突,因為最後一次的背叛收益始終優於合作。可悲的是,這一次背叛將由於人性的理智,穿越時光隧道,回到原始的地點:人們將從開始就拒絕合作。還是感謝我們這個不完美的世界吧,事實上人們很少這樣做。當然合作到最後的也很少,這意味著,倒推法只在中間階段突然發生了作用,只不過誰也不能預測,中間一步在哪裡。在那裡,我們只有冀望信任、道德、良知等等。
分蛋糕博弈
兩個小孩怎么分蛋糕?經典的故事,經典的解答:一個分,一個選。現實多如此,權利的合理分配將有效促進公平與效率。經營權與所有權的分置的確使得經濟更加活力。不過分蛋糕的進階模型卻強調了討價還價的策略,分蛋糕不是一次性的,而是多回合的,而且出現成本:蛋糕在融化。
時間稱本的加入,將使得分配變得複雜化。雙方如果不能及時達成交易,不僅集體的收益將減量,而且個體的收益也將減少。在此情況下,利用時間稱本以及威脅、承諾將對其中一方極其有利。顧客可能迫於情勢,必須儘快結束談判,這時賣方卻不慌不忙,故意拖延,顧客一方將不得不在價格上作出妥協。
顧客一方當然也有策略,它的策略就是貨比三家,要求承諾或威脅。這個前提是買方市場的存在。顧客還應當保護自己討價還價的能力,這就是顧客有權投訴商家。
鷹鴿博弈
這個博弈很多人等同於鬥雞博弈。不過,鬥雞是兩個兼具侵略性的個體,鷹鴿卻是兩個不同群體的博弈,一個和平,一個侵略。在只有鴿子一個苞穀場里,突然加入的鷹將大大獲益,並吸引同伴加入。但結果不是鷹將鴿逐出苞穀場,而是一定比例共存,因為鷹群增加一隻鷹的邊際收益趨零時(鷹群發生內斗),均衡將到來。
由此產生了ESS進化上的穩定策略,也就是說一旦均衡形成,偏離的運動會受到自然選擇的打擊。也就是鷹群飽滿後,再試圖加入的鷹將會被鷹群排擠。
進化上的穩定均衡最大的好處莫過於保持穩定。但問題在於形成強勢的路徑依賴,也就是勝出的不一定是最好的。因為最好的會被當作出頭鳥幹掉,這是個體的失敗,集團的勝利以及集體的止步不前。
髒臉博弈
恍然大悟的博弈。三個人在屋子裡,不許說話。美女進來說:你們當中至少一個人臉是髒的。三人環看,沒有反應。美女又說:你們知道嗎?三人再看,頓悟,臉都紅了。為什麼?因為美女後一句廢話點破天機,三個人都知道髒臉的存在,而且推測知道對方也知道了髒臉的存在(因為另兩人臉沒紅,說明他們看到髒臉了),而且知道對方知道自己已經想到上一步……循環開始,知識開始共同化,真相大白:三個人都是髒臉,所有人都臉紅了。
這就是共同知識的作用,它的作用顯得有點可怕的強大。幾乎是一招無影腿,殺人不見血。在檯面上的博弈之前,私下的算計已經置對手於死地。不過,很可能對方也預料到這一點,早也想到這一點,同時殺來。終於,形成雙死局面。
當然,現實雖然存在類似現象,不過共同知識更大的作用在於減少交易成本。因為某些規則人盡皆知,雙方只要各自依之行事就可以了。
信息均衡
很想然,信息的作用在博弈之中非常重要。將博弈論還原到現實,人們不再完全理性,信息存在不對稱,博弈就需要在搶占信息高地上作出努力。
信息不對稱,是一個很大的障礙。信息的不對稱會造成“逆向選擇”和“道德風險”,前者事前,後者事後。信息不對稱短期內對某一方會有利,但最終會破壞整個市場。於是有兩個解決策略。
信息傳遞
傳達你的正面的信息的策略,也就是說吸引顧客走到你的櫃檯面前。它的要點是保持有效、減低成本。
信息甄別
誘導對手暴露其私下擁有的真實信息。就是給顧客一個放大鏡,保證顧客不會走到其他櫃檯去。這種策略顯然更加有效,不過風險也更大:萬一顧客用放大鏡看出了了自己的瑕疵怎么辦?