博弈學習理論

《博弈學習理論》一書中,朱·弗登伯格和戴維·K·萊文提出了另一種解釋:均衡是並非完全理性的參與人隨時間的推移尋求最最佳化這一過程的長期結果。他們研究的模型為均衡理論提供了基礎,並為經濟學家評價和改進傳統的均衡概念提供了有用的方法。在經濟學中,絕大多數的非合作博弈理論集中研究博弈中的均衡問題,尤其是納什均衡及其精煉。對均衡什麼時候出現以及為什麼均衡會出現,傳統解釋是,均衡是在博弈的規則、參與人的理性以及參與人的支付函式都是共同知識的情況下,由參與人的分析和自省所得出的結果。不論是在概念上還是在實證上,這個理論都存在許多問題。

內容摘要

在經濟學中,絕大多數的非合作博弈理論集中研究博弈中的均衡問題,尤其是納什均衡及其精煉。對均衡什麼時候出現以及為什麼均衡會出現,傳統解釋是,均衡是在博弈的規則、參與人的理性以及參與人的支付函式都是共同知識的情況下,由參與人的分析和自省所得出的結果。不論是在概念上還是在實證上,這個理論都存在許多問題。

在《博弈學習理論》一書中,朱·弗登伯格和戴維·K·萊文提出了另一種解釋:均衡是並非完全理性的參與人隨時間的推移尋求最最佳化這一過程的長期結果。他們研究的模型為均衡理論提供了基礎,並為經濟學家評價和改進傳統的均衡概念提供了有用的方法。

作者簡介

作者:(美國)朱·弗登伯格 (Drew Fudenberg) (美國)戴維·K·萊文 (David K.Levine) 譯者:肖爭艷 侯成琪 解說詞:陳彥斌

朱·弗登伯格(Drew Fudenberg),哈佛大學經濟系教授。1981年畢業於麻省理工學院,獲得經濟學博士學位。主要研究領域為博弈論和動態經濟學。曾在加州大學伯克利分校、麻省理工學院、史丹福大學和法國土魯斯大學任教。1 982年至今,朱·弗登伯格教授一直是美國國家科學基金的主要負責人,1998年以來為美國計量經濟學會委員會委員。他與讓·梯若爾教授合著的《博弈論》是全球範圍內最流行的博弈論教材。

戴維·K·萊文(David K.Levme),華盛頓大學聖路易斯分校經濟學教授,他的研究工作包括研究智慧財產權和內生增長的動態一般均衡模型,偏好的內生形成,社會規範和機構,博弈學習理論和實驗經濟學中的博弈理論套用。

圖書目錄

第1章引論?

1.1前言?

1.2大群體模型和匹配模型?

1.3三個常用的學習和/或進化模型?

1.4庫諾特調整?

1.5庫諾特動態分析?

1.6具有鎖定功能的庫諾特過程?

1.7回顧同時行動有限博弈?

附錄:動態系統和局部穩定性?

參考文獻?

第2章虛擬行動?

2.1引言?

2.2兩人虛擬行動?

2.3虛擬行動中的漸近行動?

2.4對虛擬行動中循環的解釋?

2.5多人虛擬行動?

2.6虛擬行動的支付?

2.7兩戰略博弈中的一致性和相關均衡?

2.8虛擬行動和最優反應動態?

2.9虛擬行動的一般化?

附錄:狄利克雷先驗和多項抽樣?

參考文獻?

第3章模仿者動態和相關的確定性進化模型?

3.1引言?

3.2同質群體中的模仿者動態?

3.3同質群體模仿者動態的穩定性?

3.4進化穩定戰略?

3.5非對稱模仿者動態模型?

3.6對模仿者動態方程的解釋?

3.7模仿者動態的一般化和重複剔除嚴格劣戰略?

3.8短視調整動態?

3.9集值極限點和漂移?

3.10廉價磋商和秘密握手?

3.11離散時間模仿者系統?

附錄:劉維爾(Liouville)定理?

參考文獻?

第4章隨機虛擬行動和混合戰略均衡?

4.1引言?

4.2收斂的概念?

4.3漸近短視和漸近經驗主義?

4.4隨機擾動支付與平滑最優反應?

4.5平滑虛擬行動和隨機逼近?

4.6部分抽樣?

4.7普遍一致性和平滑虛擬行動?

4.8刺激反應和作為學習模型的虛擬行動?

4.9對戰略空間的學習?

附錄:隨機逼近理論?

參考文獻

第5章具有持續隨機性的調整模型?

5.1引言?

5.2回顧隨機調整模型?

5.3坎多里邁拉斯羅布(Kandori?Mailath?Rob)模型?

5.4討論其他動態?

5.5局部相互作用?

5.6吸引域的半徑和協半徑?

5.7修正的協半徑?

5.8具有異質群體的一致隨機匹配?

5.9隨機模仿者動態?

附錄A:有限馬爾可夫鏈的回顧?

附錄B:隨機穩定分析?

參考文獻?

第6章擴展式博弈和自確認均衡?

6.1引言?

6.2一個例子?

6.3擴展式博弈?

6.4一個簡單的學習模型?

6.5自確認均衡的穩定性?

6.6異質的自確認均衡?

6.7一致自確認均衡?

6.8一致自確認均衡與納什均衡?

6.9可理性化的自確認均衡和關於對手支付的先驗信息?

參考文獻?

第7章納什均衡,大群體模型和擴展式博弈中的變異?

7.1引言?

7.2相關信息集和納什均衡?

7.3外生試驗?

7.4在被比做吃角子老虎機問題的博弈中的學習?

7.5定態學習?

7.6“快速學習”模型中的隨機調整和後向歸納?

7.7廉價磋商博弈中的變異和快速學習?

7.8試驗和期限的長度?

附錄:吃角子老虎機問題回顧?

參考文獻

第8章老練學習?

8.1引言?

8.2條件學習的三個範例?

8.3老練學習的貝葉斯方法?

8.4絕對連續條件的解釋?

8.5選擇專家?

8.6條件學習?

8.7折現?

8.8分類策略和循環?

8.9內省的分類規則,校準和相關均衡?

8.10模式識別中的索斯諾模型?

8.11操縱學習程式?

相關詞條

熱門詞條

聯絡我們