協調博弈

協調博弈是參與人對不同策略組合有相同偏好的博弈,如果其他人能夠正確地預期,那么在多個納什均衡中會存在唯一解,即均衡選擇依賴參與人之間對博弈進行有充分相似的信念。

概述

協調博弈,是指在博弈所定義的收益空間中,任何均衡點都符合以下條件:即

(1)在給定其他參與人行為策略的條件下,沒有人有激勵改變其行為策略;

(2)沒有參與者希望其他參與者會願意改變其行為。

類型

Jasmina Arifovic(2000); Hans Carlsson, Mattias Ganslandt(1998); Paul G.Straub(1995)等認為協調博弈就是存在多個能夠進行帕累托排序納什均衡的博弈;

Vincent P.Crawford and Hans Haller(1990);Vincent P.Crawford(1995)等認為協調博弈是參與人對不同策略組合有相同偏好的博弈,如果其他人能夠正確地預期,那么在多個納什均衡中會存在唯一解,即均衡選擇依賴參與人之間對博弈進行有充分相似的信念。

他們描述的側重點不同,前者強調均衡多重性,後者強調參與人行為選擇信念的一致性。當然,沒有多重均衡就不存在行為選擇信念,有了多重均衡就需要探討行為選擇信念的形成過程,參與人之間行為預期是協調博弈均衡選擇問題的核心之所在。

根據均衡選擇時參與人之間是相同行動的行為預期還是不同行動的行為預期而把協調博弈分為對稱協調博弈與非對稱協調博弈。

案例

夏娃靠右
夏娃靠左
亞當靠左 3,3 0,0
亞當靠右 0,0 3,3

表:交通博弈

協調博弈的最為經典的弈局出現在“交通博弈”中。下表中的收益矩陣給出了一個交通博弈的收益分布。觀察該矩陣可以發現:該矩陣有三個納什均衡,即(靠左,靠左)、(靠右,靠右)以及一個靠左和靠右各占50%機率的混合動機策略均衡。因此,只要給定對方的選擇,參與者就沒有激勵偏離均衡策略;或者即使不給定對方的策略,參與者也只能通過協調來實現均衡。

顯然,在這種博弈中,每個參與者的策略問題是:他希望和他的對手就策略選擇進行“協調”,因為不管是否給定對手的策略,協調的結果總是最好的。森在1967年的論文中,將一個協調博弈稱為“信心博弈”。他指出,協調博弈與囚徒困境博弈剛好相反,每個參與者選擇策略A或B,僅僅需要確信對方也會相應地選擇A或B。他們不像合作博弈那樣需要一個有約束力的契約之類的東西,而是更需要在彼此之間確立一種相互信任的信心。

如果我們考慮將上述關於交通的協調博弈擴展為,(1)在固定參與者之間進行的重複博弈,或(2)在特定的群體系統內部非固定參與者之間進行的超博弈,那么就不難想像,與其每次出現時都去嘗試解決這個博弈,遠不如在行為人之間建立起某種行為或慣例的穩定的均衡模式,進而使得參與人在此後遇到類似問題時都可以加以遵循,而不需要反覆支付信息成本交易成本。但協調博弈的一個問題在於,均衡解具有不確定性和多樣性,因此哪種均衡的規則將被選擇具有隨機特徵。因此,在習俗層面上講,協調博弈的均衡規則是多樣的。但不管怎樣,只要相應的一種行為模式被廣泛接受,並被自覺遵從,就會形成習俗或自發秩序,並且有助於包括參與者在內的所有群體成員,避免類似弈局中無效率的非均衡收益。

選舉

在堯舜時代,自然資源相對豐富,人性淳樸,人們為爭奪資源而進行爭鬥的情形相對較少。但是隨著時間的推移,人口的增加,以及人性的複雜化,為爭奪資源所進行的爭鬥就愈加激烈,且手段也花樣百出了。特別是在目前的市場經濟情況下,人們以無限追逐物資利益為目標,一個人能否在激烈的競爭中取得資源控制權就成為一個人或者一個單位生存及發展的關鍵要素。對於市場經濟還欠成熟,法制傳統還比較欠缺的國度來說,不擇手段地進行資源控制權爭奪就特別重要。因此,一些單位在與其它單位的資源或者市場控制權爭奪中,實際上就是在玩“協調博弈 ”——給定其它單位不擇手段地爭奪資源,己方的最優策略就是不擇手段地爭奪資源。但是,能否有能力不擇手段地去爭奪資源是依賴於單位“領導”的人格素質的。

一般而論,能不擇手段進行資源爭奪的人通常是“膽大”的人,俗話說:“餓死膽小的,撐死膽大的”就是這個意思。而膽大的人一般又不太在乎社會公眾輿論或者不太在乎社會規範的約束,通常就在“德行”上得分不高——即所謂大奸大惡之人,如三國時的曹操。所以,給定其它競爭性單位推選“大奸大惡之人”作領導,該單位也有動機推選自己的“大奸大惡之人”作領導,讓他去迎戰競爭方的“大奸大惡之人”是恰當的。當然,“大奸大惡之人”也可能並不受本單位廣大人民民眾的歡迎,但是作為集體的生存與發展,廣大人民民眾在一定程度上也可能容忍,讓他們實際上並不喜歡的人去當他們的領導,這叫做“以毒攻毒 ”!如果競爭對手推選他們的領導是德高望重之人而非“大奸大惡之人”,本單位推選“大奸大惡之人”也是要占便宜的,因為在爭奪資源上德高望重之人是鬥不過 “大奸大惡之人”的;這樣一來,每個單位都選擇“大奸大惡之人”就是“占優戰略”的了。也就是說,無論競爭對手推選什麼樣的人作領導,本單位都推選“大奸大惡之人”作領導是最優的。這樣的博弈實際上是“囚徒困境 ”。但是,用“囚徒困境”來描述實際現象沒有用“協調博弈”恰當。理由是,通常“大奸大惡之人”也會損害本單位廣大人民民眾的利益。如果競爭對手單位推選德高望重之人當他們的領導,本單位廣大人民民眾通常也會推選本單位的德高望重之人作本單位領導的。因為儘管本單位的領導是德高望重之人時不會比“大奸大惡之人”爭奪帶來更多的資源,但他也通常會比“大奸大惡之人”更少地損害本單位廣大人民民眾的利益,甚至通常還會增進本單位廣大人民民眾的利益。

一個更為強有力的原因是來自柏克利加州大學的Rabin教授的公平博弈觀點。他根據近年來心理學實驗的發現概括出人們普遍表現出的”互惠互損“行為準則。Rabin(1993)的一個有價值的貢獻是把“公平性”(fairness)定義為“當別人對你友善良時你也對別人友善,當別人對你不善時你也對別人不善(即“投桃報李”和“以牙還牙”),而且他的獨特貢獻是將這種概念給予了明確的規定,即“如果你在損失自己效用(收入,利益等)情況下去損害別人的效用(收入,利益等),就被定義為你對別人不善;如果你在損失自己效用(收入,利益等)情況下去增進別人的效用(收入,利益等),就被定義為你對別人友善。”

心理學的諸多實驗證據表明人的行為在許多情形下是遵循這樣定義的“公平性”規則的,特別是在按照這種規則作出反應時所可能造成的潛在物質利益損失不太大的情況下更是如此。這樣,當競爭對手單位推選“大奸大惡之人”作他們的領導時,事實上他們是以放棄讓“大奸大惡之人”為他們帶來更多資源的同時來增進本單位廣大人民民眾的利益。此時,按照Rabin的理論,本單位廣大人民民眾也會放棄讓“大奸大惡之人”可能帶來更多資源的好處而推選讓德高望重之人來作本單位的領導。

參考文獻

  • 張良橋.協調博弈理論前沿研究新進展
  • 顧自安自發秩序演化的四類博弈問題 See Sen Amartya. (1967) “Isolation Assurance and the Social Rate of Discount”, Quarterly Journal of Economics, vol. 81.112-124. 蒲勇健.“雜皮”為何當“領導” ——基於協調博弈的思考

    盤點各種博弈策略

    博弈論聽上去很深奧,其實每時每刻就發生在我們的身邊,有時博弈論可以成為幫助我們在一些重大人生決策時提供幫助

    盤點各博弈論

    博弈論(Game Theory),有時也稱為對策論,或者賽局理論,是研究具有鬥爭或競爭性質現象的理論和方法,它是套用數學的一個分支,既是現代數學的一個新分支,也是運籌學的一個重要學科。

    相關詞條

    相關搜尋

    熱門詞條

    聯絡我們