擴展形式的博弈

擴展形式的博弈

博弈論中,與正則形式相對應,擴展形式是一種通過樹來描述博弈的表達方式。每個節點(稱作決策節點)表示博弈進行中的每一個可能的狀態。博弈從唯一一個初始節點開始,通過由參與者決定的路逕到達終端節點,此時博弈結束,參與者得到相應的收益。每個非終端節點只屬於一個參與者;參與者在該節點選擇其可能的行動,每個可能的行動通過邊從該節點到達另一個節點。和正則形式不同,擴展形式允許互動的顯式模型(explicit modeling of interactions),互動中,一個參與者可以在博弈中多次行動,並且在不同的狀態中可以做出不同的行為。

概述

一個擴展形式的博弈擴展形式的博弈

完整的擴展形式表述包括:
1.博弈中的參與者

2.每個參與者能行動的所有機會。

3.每個參與者在行動時的選擇

4.每個參與者在行動時所知道的情況

5.每個參與者通過各種可能的行動之後的收益。
右圖是一個雙人博弈:1和2。每個非終端節點上的數字表示該節點所屬的參與者。終端節點上的數字表示參與者的收益(例如:2,1表示參與者1得到2,參與者2得到1)。圖片裡每個邊上的符號是這個邊所代表的行動的名字。
初始節點屬於參與者1,表示該參與者先動。博弈順序如下:參與者1選擇U或者D;參與者2觀察到參與者1的選擇,然後選擇U'或者D',最後得到最終收益。四個終端節點代表四個結果:(U,U'),(U,D'),(D,U')和(D,D')。每個結果得到的收益分別是(0,0),(2,1),(1,2)和(3,1)。
如果參與者1選擇D,參與者2為了最大化收益,會選擇U',最後參與者1隻能得到1。但是如果參與者1選擇U,參與者2為了最大化收益,會選擇D',此時參與者1得到2。所以參與者1會選擇U,參與者2選擇D'。即是子博弈完美均衡。

無限行動空間

用擴展形式中無限行動空間表示的博弈用擴展形式中無限行動空間表示的博弈

參與者在一個特定的決策節點上可能有無數種可能的行動可以選擇。其表示方法是用弧來連線從該決策節點延伸出的兩條邊。如果行動空間是在兩個數字之間的閉聯集(continuum),那么這兩個限定上下界限的數字需要分別被放在弧的上方和下方,並通常會用一個變數來表示其支付。此時無數個決策節點可以用一個在弧中心的節點所代替。這種表示方式同樣可以用在一個有限的行動空間中,只要該行動空間很大,以至於用邊來表示每個行動會變得不實際。

左側的樹表示這樣一個博弈:該博弈或者有一個無限行動空間(任何0到5000的實數),或者有一個很大的行動空間(可能是任何在0到5000的整數)。在這裡,我們假設是後者,更具體的說,它表示兩個參與Stackelberg競爭的企業。公司的支付表示在左邊,其中q1和q2表示他們採用的策略,c1和c2是常數(此處表示公司的機會成本)。該博弈的子博弈完美納什均衡可以通過對支付函式求追隨者策略變數(q2)的一階偏導數,並求出其最優反應函式,q2(q1)=(5000−q1−c2)/2。同樣原理可以套用於計算先行者利潤最大化,只是先行者知道公司2會選擇上述的行動。通過一階偏導數來解出q1,得到q1*=(5000+c2−2c1)/2。在將q1代入到公司2的最優反應函式中,q2*=(5000+2c1−3c2)/4,此時(q1*,q2*)就是子博弈完美納什均衡。例如如果,c1=c2=1000,那么子博弈完美納什均衡是(2000,1000)。

不完美信息

擴展形式中的不完美信息擴展形式中的不完美信息

樹圖清楚地表示了參與者1先動,參與者2觀察到參與者1的行動。然而,一些博弈並不是這樣。參與者並不是一直能觀察到另一個人的選擇(例如,同時行動或者行動被隱藏)。信息集是決策節點的組合:
每個節點都屬於一個參與者。
參與者無法區分信息集裡的多個節點。也就是說:如果信息集有多個節點,信息集所屬的參與者就不知道能往哪個節點移動。
完美信息的博弈是指在博弈的任何階段,每個參與者都清楚博弈之前發生的所有行動,也即每個信息集都是一個單元素集合。沒有完美信息的博弈具有不完美信息。
參與者2行動時不知道參與者1的選擇,除此之外和第一個博弈相同。第一個博弈具有完美信息。如果兩個參與者都是理性的,並且都知道對方也是理性人,對方知道的信息,自己也能獲得(即參與者1知道參與者2知道參與者1是理性的,參與者2同樣也知道,如此循環下去。

相關詞條

相關搜尋

熱門詞條

聯絡我們