信任的进化博弈论 信任的进化博弈原理解析
yq4qlskj 发布:2022-07-16 06:11:10 82
信任的进化是一个博弈论游戏,那么这些博弈论是什么,他们各自的博弈原理又是什么?今天蕾米为大家带来信任的进化博弈论,信任的进化博弈原理解析,一起来了解一下游戏背后的哲理吧!
| 最高分49分 | 最低分7分 | 博弈原理解析 | 网页版在线玩 |
▍罪犯困境
这是本游戏的基本博弈模型,对此最经典的阐述为:两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都招供,各判八年;如果两人中一个招供而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:招供或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是招供:如果同伙抵赖、自己招供的话放出去,抵赖的话判一年,招供比不招供好;如果同伙招供、自己也招供的话判八年,比起抵赖的判十年,招供还是比抵赖的好。结果,两个嫌疑犯都选择招供,各判刑八年。

就像这个游戏机一样,当你投一个硬币进去,对方就会得到两枚硬币。显然,对于总体来说,选择合作得到的回报最高(每人失去1个,得到2个,总和4,增加2个),但对个人而言风险也是最大的(对方选择欺骗,你-1,对方3,总和2),所以在这种局面下,欺骗变成了最优策略。这样的局面,归根到底,是因为双方缺乏沟通而导致的。在无法信赖对手的一局游戏中,欺诈师往往会成为最后的赢家。有意思的是,囚徒困境推广到确定的N局游戏中也是成立的。原因如下:对于第N局,由于不用担心之后被报复(最后一局了嘛),最优策略显然是欺骗。对于第N-1局,由于已经知道了对方下一局的最优策略是欺骗,为了防止受到更多损失,最优策略显然也是欺骗。对于第N-2局,……所以,对于确定的N局游戏,最优策略永远是欺骗。

▍重复困境
这个升级版的囚徒困境源于一个全世界的重复囚徒困境竞赛(也是这个游戏的来源)。在这个竞赛中,许多博弈论专家将自己的策略编写成程序,和其它程序进行博弈(没错,游戏里的策略是其中的一些)经过很多很多轮竞赛后,出人意料的是,最佳确定性策略被认为是“以牙还牙”,这是阿纳托尔·拉波波特(Anatol Rapoport,《合作的进化》作者,也是竞赛的发起人)开发并运用到锦标赛中的方法。这个策略只不过是在博弈的开头选择合作,然后,采取对手前一回合的策略。

在完美的博弈中,复读机是最有效的。这种策略较好地规避了被欺骗的风险(被骗了还是要涨点记性),而对于合作者,显然双方都能获得较高的利润。而对于有可能失误的博弈(玩家准备合作,但是由于各种不可控因素造成背叛的结果),更好些的策略是“宽恕地以牙还牙”,即当你的对手背叛,在下一回合中你无论如何要以小概率(大约是1%~5%)时而合作一下。这是考虑到偶尔要从循环背叛的受骗中复原。至于更自由的博弈(可以选择对手),比较好的策略是:前几局选择合作进行试探,被多次欺骗后不再与此对手博弈(排挤掉欺诈师)
版权说明:如非注明,本站文章均为 兔玩游戏网 原创,转载请注明出处和附带本文链接;
相关推荐
- 11-24咒术回战手游ssr强度排行一览 咒术回战幻影夜行ssr角色推荐
- 11-24大侠立志传大白鹅剧情怎么触发 大侠立志传大白鹅攻略
- 11-24咒术回战手游分数挑战怎么玩 咒术回战幻影夜行分数挑战玩法介绍
- 11-24仙剑世界玩法攻略分享 仙剑世界萌新开局玩法介绍
- 11-24大侠立志传甲级外功怎么获得 大侠立志传甲级外功获取方式
- 11-24仙剑世界紫宠收集攻略 仙剑世界紫宠如何收集
- 11-13修勾地铁逃生BOSS怎么打 修勾地铁逃生BOSS攻打方法
- 11-13修勾地铁逃生动力机甲什么样子 修勾地铁逃生动力机甲获取使用方法分享
- 11-18疯狂掠食者下载入口分享 疯狂掠食者正版下载地址
- 11-21读书软件app推荐 好用的读书软件有哪些
- 排行榜
- 推荐资讯
-
- 07-16红蓝大作战2怎么玩 红蓝大作战新手玩法攻略
- 11-24咒术回战手游ssr强度排行一览 咒术回战幻影夜行ssr角色推荐
- 11-24大侠立志传大白鹅剧情怎么触发 大侠立志传大白鹅攻略
- 11-24咒术回战手游分数挑战怎么玩 咒术回战幻影夜行分数挑战玩法介绍
- 11-24仙剑世界玩法攻略分享 仙剑世界萌新开局玩法介绍
- 11-24大侠立志传甲级外功怎么获得 大侠立志传甲级外功获取方式
- 11-24仙剑世界紫宠收集攻略 仙剑世界紫宠如何收集
- 03-22纳迪亚之宝全流程通关指南(纳迪亚之宝详细玩法教学)
- 03-092024年和平小店返场时间公布(和平小店皮肤大曝光)
- 03-01方舟生存进化全部鞍代码合集(方舟物品指令分享)












