以牙還牙[詞語]

以牙還牙,拼為yǐ yá huán yá,比喻針鋒相對地進行回擊。出自《舊約全書•申命記》。

基本信息

概述

以牙還牙 ( yǐ yá huán yá )
解釋 用牙咬來對付牙咬。比喻針鋒相對地進行回擊。
出處舊約全書·申命記》:“以眼還眼,以牙還牙,以手還手,以腳還腳。”
用法 偏正式;作謂語、定語、狀語;常與以眼還眼連用
示例 魯迅《墳·論費厄潑賴應該緩行》:“'犯而不校'是恕道,'以眼還眼,~'是直道。
近義詞 針鋒相對
反義詞 退避三舍

博弈理論

簡介

以牙還牙(Titfortat)是一個用於博弈論的重複囚徒困境(ReiteratedPrisoner'sDilemma)非常有效的策略。這策略最先由數學家阿納托·拉普伯特(AnatolRapoport)提出,並在密西根大學社會學家羅伯特·阿克塞爾羅(RobertAxelrod)有關囚徒困境的研究中擊敗其他方法,脫穎而出,成為解決囚徒困境的最佳策略。

這一策略有兩個步驟:
第一個回合選擇合作

下一回合是否選合作要看上一回對方是否合作,若對方上一回背叛,此回合我亦背叛;若對方上一回合作,此回合繼續合作
以牙還牙策略有四個特點:
友善:以牙還牙者開始一定採取合作態度,不會背叛對方

報復性:遭到對方背叛,以牙還牙者一定會還擊作出報復

寬恕:當對方停止背叛,以牙還牙者會原諒對方,繼續合作

不羨慕對手:以牙還牙者個人永遠不會得到最大利益,整個策略以全體的最大利益為依歸
在眾多策略中,以牙還牙是最有效的,曾連續數年擊敗由計算機科學家,經濟學家和心理學家等團隊所提出的策略。博弈論者儘管沒有實質證據,但他們認為以牙還牙是最佳的策略。

囚徒困境例子

假設有四個參與者:兩個用以牙還牙的策略,另外兩個無論任何時候都會背叛其他人以讓自己得到最大的好處。假定每個參與者將要面對另外三個參與者進行六次對決。如果一名參與者背叛對方而對方不背叛,前者有5分,後者得0分;如果雙方不背叛對方,雙方各得3分;如果雙方同時背叛對方,雙方各得1分。
當以牙還牙者對背叛者,前者第一場比賽選擇不背叛,而後者正好相反,後者獲得5分。在餘下的5場比賽,兩位參與者背叛對方,每一場比賽各得1分。最後,背叛者得10分,以牙還牙者得5分。
當雙方均為以牙還牙者,在所有6場比賽中彼此均不會背叛對方。雙方每回合各得3分,最後每人各得18分。
當背叛者互相對賽,雙方每次都會背叛對方。雙方每回合各得1分,最後每人各得6分。
儘管以牙還牙者從來沒有贏得過一場比賽,而背叛者從未輸過一場比賽,考慮到雙方的最大共同利益,以牙還牙仍然是最好的策略。

問題

雖然阿克塞爾羅德證明了以牙還牙在某些情況下是最佳的策略,但兩名以牙還牙者有時候在博弈時仍會產生問題。假如其中一方錯誤理解形勢,就可能造成災難性結果。在以牙還牙的策略下,博弈者被迫懲罰之前背叛自己的對手(儘管他不是有意的),造成惡性循環。雙方都認為自己是無辜的,自己所作的只是為了自衛,並歸咎對手惡毒或是不跟自己合作。這種情況經常發生在現實世界的衝突,如學生間的打鬥和地區戰爭。而且實際上用以牙還牙策略只能保證和對方打成平手,很難獲得更大的勝利。
在重複囚徒困境的20周年紀念賽中,來自英國南安普敦大學的一個小組(由尼古拉斯·詹寧斯(NicholasJennings)領導,包括了拉蒂普·達什(RajdeepDash)、薩瓦帕里·拉姆瓊(SarvapaliRamchurn)、亞歷克斯·羅傑斯(AlexRogers)斯和皮魯克里士南·維特林根(PerukrishnenVytelingum))找出了另一種策略,這個新的策略在另一次實驗中打敗了以牙還牙策略。在以牙還牙策略成功的那個實驗裡,競爭者與競爭者之間是獨立的。而該團隊的新策略卻提供了一個小組,這個小組的人都有一個目的,就是力保小組中的其中一人。也就是說這個小組可以看作一個大的競爭者。

套用於真實世界

點對點下載
BitTorrent套用以牙還牙策略以最佳化下載速度[3]。BitTorrent運用的OptimisticUnchoking技術就是運用了以牙還牙策略。BitTorrent會定期隨機選擇其他用戶作上載,以尋找更多潛在合作者(願意上載的用戶),最大化上下載者的共同利益。

互惠利他主義
在動物群落,施予者提供幫助予受益者。利他行為應該得到回報,當雙方的需求互換,原來的受益者應報答及幫助原來的施予者。群落當中有機制以查明和懲罰“不報答者”。以牙還牙原則是一個調節互惠利他主義的重要機制。

相關詞條

熱門詞條

聯絡我們