王春永:王春永，男，暢銷書作家。70年代出生，文學學士、法學碩士，曾在洛 -百科知識中文網

提要與思考

這個簡單的例子，幾乎是博弈論的代名詞。兩個基於“坦白從寬，抗拒從嚴”審訊的囚徒，從理性的角度出發，會產生怎樣的結局？結果若是，從個人理性並追求個人利益最大化，那么二人皆坦白，也就是背叛。這在四種策略中並不占優，那為什麼不採用集體最有策略呢而合作。很簡單集體的最佳化，必然侵害個人利益的最大化。當然這一切前提是理性假設，也就是著名的經濟人假設：經濟學中的人都是“小人”（管理學則認為人是“君子”，有意思而有道理的比喻）。破解這一困境的途徑則是打破信息孤立，而執法者的反制則是維持孤立或者加強威脅。無論背叛還是合作，誰在這裡面堅持到最後，誰將取勝。

博弈信息

重複博弈

囚徒困境，砸了傳統經濟學的場子。因為個人的自利行為，並不一定導致集體利益的最大化，“看不見的手”拉不住，人類向墮落之城下滑的趨勢，難道這真是一個悲哀？索性並非如此，撇去博弈論的理性假設不說。博弈論者很快發現囚徒困境只在單次博弈情形下明顯，一旦博弈的開始陷入重複，合作將到來。因為，未來的收益將左右目前的決策。

以牙還牙

重複的博弈理論上導致了合作的產生，但是誰也不能保證合作的繼續，因為之前已經說過，合作的代價是建立在損害個人利益基礎之上的。如果個人放棄未來收益或當前背叛收益大於未來收益，背叛的風險仍然存在。那么在重複博弈中怎樣的策略才是最優。若干睿智而複雜在經過計算機中PK之後，極其原始的“以牙換牙”策略脫穎而出，固然這個策略簡單至極，其威力卻無窮，以至於人們在短暫的欣喜之後，發現這把太阿指之劍倒持的可怕，一旦重複鏈條中出現一次（也許不經意的）背叛，那據此原則行事的博弈將永無止境的背叛下去，個人利益極度膨脹的同時，集體利益無限衰微。幸好，這個世界不是模型，也不是如此簡單。很多時候，我們不必以牙還牙，第三方的規範：道德與法律就是我們的假牙，他們更加有利、有理、有節。

人質困境

一場憋屈的博弈。搶打出頭鳥，人質聯合固然可以制服歹徒，但是誰願出頭。這一點給了無數處於劫持者地位的一方以機會，類似於秦的遠交近攻、各個擊破的策略，將最終全盤贏下。人質可有反制的策略，當然有，不過艱難至極。人質可以選擇沉默，這樣他有一定時間苟延殘喘；或者聯合劫持者對付人質，結局還是取決於劫持者，萬一他過河拆橋怎么辦；同時反抗，集體將獲得左右策略，但是這需要壯士斷腕的勇氣，部分人可能因此受傷。這裡是實力與勇氣的較量，而且實力暫居上風。

酒吧博弈

如果人人理性，那么每一天到達酒吧的人數將是差不多正好的，但是人非聖賢，往往是有限理性的。第一次到酒吧的人多，那么大多人人認為酒吧人太多，太擠。第二次決定的時候，參考前次而不去酒吧。少數去的人發現酒吧的人第二天很少，感覺很爽，第三次將繼續回來，並重新帶回許多人……循環就此開始。酒吧博弈一方面顯示，現實的博弈參與者，是極其有限理性的，其理性只前延後伸一小段。歷史數據只對計算機有用，對人，則不一定。

另一個方面，酒吧博弈指出，勝利者永遠只是少數。儘管酒吧存在調諧的可能，譬如發簡訊時時提醒，但成本恐怕太高。而在其他場合，少數派可能更加會設定種種障礙阻止後進者的上升。也就是說，我們的世界仍然是操弄在少數派的手中。不過，總算這個世界不是模型，少數派的道路到底還是有跡可循的。老練的將軍仍舊會在八卦迷陣中找到唯一的生門。若你想要，必須做一個更加老練的將軍。

槍手博弈

王者的悲哀。三人對槍自決，甲乙丙槍法優劣遞減。最後無奈而神奇的結局，將不取決於同時開槍還是先後開槍，最優良的槍手，倒下的機率將最高；而最蹩腳的槍手，存活的希望卻最大。因為沒有人會把威脅最小的槍手列為一號清楚目標。在這裡，後發制人的弱勢者將勝出。以弱勝強，絕不是神話。

難道王者的命運就真如此不堪，呵，道別忘了每個理論模型都是有其前提的，擊破之中任何一個，王者仍將歸來。這就是先發優勢。假設這是一場類似CS的競技，優秀的槍手擊倒二號槍手，立刻獲得獎勵：盾牌。那么三號槍手將陷入絕境。不過，不管怎樣，這個博弈模型，到底給了弱勢者一份希望。機會永遠存在。

獵鹿博弈

兩個獵人合作獵鹿獲得的收益將遠大於分別獵兔的收益，戰略聯盟將開始。這或許是件好事，不過有取決於最後獵獲的鹿——這一公共資源的分配，如果分配得當，整體的效率將增加。如果一方主導，另一方受損，那么帕累托改善無法進行，合作可能終將破裂。

另外一個問題，更加大局的問題。合作的示範性將使得更多的獵人加入，獵獲的鹿將大大增加，人類的利益短期內將呈幾何級數增長。但是最後，確是生態失衡，鹿群滅群。短暫的繁華之後，獵人將再一次回歸於原始獵兔生活。儘管為了避免這一悲劇，人類還有最後的希望：制度經濟學的法寶——科斯定理以產權歸屬來解決外部經濟問題。但由於談判成本以及可行性，人類社會的公共悲劇仍將不斷上演。

智豬博弈

混沌之前最後的博弈。小豬和大豬住在豬圈的一邊（食槽在這裡），開啟食物的開關在另一頭，誰去踩，誰喪失先機。結果怎樣？是小豬選擇“搭便車”，大豬勤跑。因為小豬無論跑還是停，大豬的最優策略都是策略都是去踩機關。不過在實際生活中。這裡依舊存在兩種策略。

小豬的“搭便車”大豬有的時候，自覺或不自覺地自封“俠之大者，為國為民”，並因此承受一些不能承受之重。《博弈論的詭計》指出美國戰後的行為極似大豬，戰後的美國竭力宣傳自己的普世價值觀，並深入到海外事務，甚至不惜重金協助小國防務。這樣小國不自覺地對大國進行了“剝削”。

大豬在擊破模型的一個假設之後，仍然有一個後發制人的機會。因為大豬和小豬的耐餓能力不一樣，大豬完全有能力撐得更久，小豬如果不想餓死，那只有一條豪賭的路子：龜兔賽跑式的豪賭，但願大豬打了個盹兒，他回來的時候，還能吃上一兩口，要不然真是賠了夫人又折兵了。據此，再也不難解釋為什麼很多人切齒的騰訊，毫無顧忌地跟風，做QQ旋風，做拍拍，做滔滔。因為不甘心的小豬早早把新技術研發的前期搞定了，大豬們只需要悄悄跟隨，適當的時候踢開擋路的，就可以了。

大豬在這裡的後發制人和槍手博弈的後發並不一致，槍手後發是建立在他人惡鬥的基礎上，大豬後發完全是以自身實力為基礎。而且大豬完全不必採取任何激進措施，只要跟隨就好。因為小豬獲勝的條件不是接近，還是距離。

警察與小偷

令人沮喪的博弈結局。警察和小偷各只有一個機會去巡查或者偷盜A地或B地。A地的價值大於B地，那么警察應該為了保護價值大而一直保護A地嗎。博弈論認為當然不是，警察的合理策略應當是有傾向於A以一定機率的隨機巡查。這個機率就是：p=A地價值/AB地總價值。這種情況下才能使小偷最大得手幾率降至最低。但是很不幸的是，此時的小偷謀求的是，最小得手幾率的最大化。也就是說，警察的最優策略將把小偷的最差策略改良！這個便是馮·諾伊曼提出的“最小最大定律”。

我們必須再一次感謝這個不完美的世界，因為現實之中，類似的現象，對於一方仍然可以設法找到對手致命的規律性行動（當然必須考慮到對方是不是一個更加老練的獵手，故意放出的誘餌）。而保持自己的行動的無序性，則有可能成為欺騙策略的武器，這倒似張三豐所言道的：無招勝有招。

鬥雞博弈

兩隻鬥雞在決鬥的時候，無論選擇進或退都是一個難題，因為納什均衡已經給出了一勝一敗的最優策略。在很多較量下，死拼將是得不償失的，因為很可能給第三者機會。因此，兩個已經在戰場的強勢力很可能自覺的遵循納什均衡，當一方攻擊時，另一方暫退。雖然可能某方暫時受損，但較之於兩敗俱傷是好得多的。不過，要維持這一狀況，必須保證下一次先期受損的一方發動攻勢的時候，另一方同樣的後退。於是這樣的攻擊性行為開始變得“儀式化”，沒有人真正流血。這只不過是兩個巨頭玩弄的遊戲，目的是警告後來者，想進來，那么也得陪我們一起玩，可是你玩的起么？這正是百事的廣告，即使暗含挑釁也最多只到“敢為中國紅”這樣的地步的原因。

協和謬誤

歐洲政府在大量投資協和飛機後，終於不能自拔。即使前景黯淡，也撐著面子投下去，非要走投無路才放棄。而這時投入的成本已經全打水漂了。如果，發現不能繼續的時候，就果敢放手，損失會小得多。可是他們會、能這么做么？壯士斷腕，是何等的壯烈，卻也是何等的艱難！

沉沒成本很可能會延續人們無畏的堅持。已經沉沒的本該放棄，可惜大部分有賭徒式的心理，相信阿基米德的槓桿終將啟動。可惜他們在爬到足夠撬動槓桿的支點之前，已經窒息了。

協和謬誤，倒是給了人們半途而廢的理由，會不會有人擔心它的濫觴會左右一些本該堅持的目標？的確有這個可能，但是應該相信人們足夠理智，完全可以比較沉沒成本、機會成本與未來收益的關係。看清了的，必定會坦然地走出協和謬誤。

蜈蚣博弈

一場顛前倒後的博弈。蜈蚣博弈的機理是以最終的結果倒退至開始。這是一個睿智的策略，因果相報，把握好因緣，自有好結果。它的另一個好處，就是使得未來的計畫明晰化，是你不再徘徊。只可惜，很多時候，碌碌無為的我們並沒有看透迷局的眼睛。我們黑色的眼睛只習慣於黑夜。

蜈蚣博弈也有一個致命的悖論，仍舊是個人利益和集體利益的衝突，因為最後一次的背叛收益始終優於合作。可悲的是，這一次背叛將由於人性的理智，穿越時光隧道，回到原始的地點：人們將從開始就拒絕合作。還是感謝我們這個不完美的世界吧，事實上人們很少這樣做。當然合作到最後的也很少，這意味著，倒推法只在中間階段突然發生了作用，只不過誰也不能預測，中間一步在哪裡。在那裡，我們只有冀望信任、道德、良知等等。

分蛋糕博弈

兩個小孩怎么分蛋糕？經典的故事，經典的解答：一個分，一個選。現實多如此，權利的合理分配將有效促進公平與效率。經營權與所有權的分置的確使得經濟更加活力。不過分蛋糕的進階模型卻強調了討價還價的策略，分蛋糕不是一次性的，而是多回合的，而且出現成本：蛋糕在融化。

時間稱本的加入，將使得分配變得複雜化。雙方如果不能及時達成交易，不僅集體的收益將減量，而且個體的收益也將減少。在此情況下，利用時間稱本以及威脅、承諾將對其中一方極其有利。顧客可能迫於情勢，必須儘快結束談判，這時賣方卻不慌不忙，故意拖延，顧客一方將不得不在價格上作出妥協。

顧客一方當然也有策略，它的策略就是貨比三家，要求承諾或威脅。這個前提是買方市場的存在。顧客還應當保護自己討價還價的能力，這就是顧客有權投訴商家。

鷹鴿博弈

這個博弈很多人等同於鬥雞博弈。不過，鬥雞是兩個兼具侵略性的個體，鷹鴿卻是兩個不同群體的博弈，一個和平，一個侵略。在只有鴿子一個苞穀場里，突然加入的鷹將大大獲益，並吸引同伴加入。但結果不是鷹將鴿逐出苞穀場，而是一定比例共存，因為鷹群增加一隻鷹的邊際收益趨零時（鷹群發生內斗），均衡將到來。

由此產生了ESS進化上的穩定策略，也就是說一旦均衡形成，偏離的運動會受到自然選擇的打擊。也就是鷹群飽滿後，再試圖加入的鷹將會被鷹群排擠。

進化上的穩定均衡最大的好處莫過於保持穩定。但問題在於形成強勢的路徑依賴，也就是勝出的不一定是最好的。因為最好的會被當作出頭鳥幹掉，這是個體的失敗，集團的勝利以及集體的止步不前。

髒臉博弈

恍然大悟的博弈。三個人在屋子裡，不許說話。美女進來說：你們當中至少一個人臉是髒的。三人環看，沒有反應。美女又說：你們知道嗎？三人再看，頓悟，臉都紅了。為什麼？因為美女後一句廢話點破天機，三個人都知道髒臉的存在，而且推測知道對方也知道了髒臉的存在（因為另兩人臉沒紅，說明他們看到髒臉了），而且知道對方知道自己已經想到上一步……循環開始，知識開始共同化，真相大白：三個人都是髒臉，所有人都臉紅了。

這就是共同知識的作用，它的作用顯得有點可怕的強大。幾乎是一招無影腿，殺人不見血。在檯面上的博弈之前，私下的算計已經置對手於死地。不過，很可能對方也預料到這一點，早也想到這一點，同時殺來。終於，形成雙死局面。

當然，現實雖然存在類似現象，不過共同知識更大的作用在於減少交易成本。因為某些規則人盡皆知，雙方只要各自依之行事就可以了。

信息均衡

很想然，信息的作用在博弈之中非常重要。將博弈論還原到現實，人們不再完全理性，信息存在不對稱，博弈就需要在搶占信息高地上作出努力。

信息不對稱，是一個很大的障礙。信息的不對稱會造成“逆向選擇”和“道德風險”，前者事前，後者事後。信息不對稱短期內對某一方會有利，但最終會破壞整個市場。於是有兩個解決策略。

信息傳遞

傳達你的正面的信息的策略，也就是說吸引顧客走到你的櫃檯面前。它的要點是保持有效、減低成本。

信息甄別

誘導對手暴露其私下擁有的真實信息。就是給顧客一個放大鏡，保證顧客不會走到其他櫃檯去。這種策略顯然更加有效，不過風險也更大：萬一顧客用放大鏡看出了了自己的瑕疵怎么辦？

王春永

基本信息