具有条件惩罚策略的社会困境博弈与合作演化

【www.zhangdahai.com--其他范文】

郭慧婷

(武汉理工大学管理学院,湖北 武汉 430070)

合作行为需要以自己的利益为代价去完成共同的目标,然而这与达尔文“优胜劣汰,适者生存”的进化论相悖,当个人利益与集体利益相冲突时,社会困境就会出现。长期以来,许多不同学科的学者都致力于解决社会困境以及合作涌现的难题。演化博弈论为探究合作的演化动力提供了一个极好的理论框架。其中不少学者在公共物品博弈的基础框架上提出了几种有利于合作演化的机制。代价高昂的惩罚在阻止搭便车行为方面的作用被广泛关注。在人类社会中,对法律的遵守是通过制裁来维持的。如果触犯了法律,就会受到惩罚。因此,及时的惩罚可以使得我们避免从事非法活动。许多实验表明惩罚是一个值得信赖的信号,人们愿意付出代价惩罚他人,惩罚自私的个人是有利的,能够表明他们自己并不自私。在现实社会中,个体倾向于根据一定条件惩罚其他参与者,而不是直接惩罚他们。Szolnoki和Perc从理论上表明条件惩罚者在促进合作方面发挥着重要作用。社会驱逐作为一种特殊的惩罚形式,近年来备受关注。以往的研究大多数将惩罚和驱逐单独进行研究,而在现实世界中,这两种行为常常组合起来使用,例如对违反交通法规的人进行罚款或吊销执照,对排放污染物的企业进行处罚或停业等。本文从条件惩罚的视角入手,在传统的空间公共物品博弈中条件惩罚机制,采用数学建模和计算机数值模拟的实验方法,对条件惩罚下群体合作演化问题做了进一步研究和探讨。

本文在方格子网络上进行公共物品博弈(SPGG),其中个玩家被组成大小为=5的重叠组,因此,每个人都与其最近的-1个邻居有联系。因此,每个人都属于标号为=1,…,不同的组。

最初,每位玩家被随机指定为背叛者、合作者、条件惩罚者其中的任意一种角色。按照以往的研究,所有的和都会贡献1到公共物品池。种群中的条件惩罚者具有统一的容忍阈值,与残酷的直接驱逐相比,条件惩罚者制裁背叛者时会考虑背叛者的数量,如果在玩家的容忍范围内,即群组内背叛者的数量小于容忍阈值,玩家将扮演传统惩罚者的角色,对背叛者实施一定金额的罚款制裁,否则玩家将扮演驱逐者的角色。假设驱逐成功的概率为,则一个背叛者被成功驱逐出去的概率为=1-(1-),为群体中条件惩罚者的数量。

玩家完成了所有的互动后,所有贡献之和乘以增益因子,除被驱逐出去的玩家之外,扩大后的贡献会在所有之间平均分配。群组中背叛者、合作者、条件惩罚者的数量分别用、、表示,则这三种策略在群组中产生的收益为:

(1)

(2)

(3)

其中,是被驱逐出去的背叛者的数量;
为单位惩罚罚金;
、分别为单位驱逐成本和单位惩罚成本。玩家的总收益是参加的轮博弈的总和,计算如下:

(4)

本文采用蒙特卡罗模拟方法进行仿真,包括以下基本步骤。一个随机选择的玩家与其所在的组中的位伙伴进行SPGG,其总收益Π是其所在五个组中获得的所有收益的总和。接下来,玩家随机选择其最近邻居中的一个玩家,被选择的合作玩家也以同样的方式获得其收益Π。

最后,根据费米规则玩家会采取玩家策略的概率为1{1+exp[(Π-Π)]},其中=05量化了策略采用时的不确定性,这意味着如果玩家表现得更好,其策略很容易被采用,但玩家采取表现更差的策略仍然有可能会发生。每一个完整的蒙特卡罗步骤(MCS)都会给每个玩家一次改变策略的机会。

我们采用Microsoft Visual Studio软件对上述模型编码,程序运行的结果利用MATLAB进行绘图分析。拟定后的模型在100×100方格网络上进行仿真实验,经过足够长的演化时间,种群的平均合作率慢慢会趋于稳定。在大多数情况下,演化系统在10,000MCS后会稳定下来,对于一些特殊的相变点,我们进行了50,000MCS。并且最后的实验结果是经过10次独立重复实验后取平均值得到的。其中,我们用(+)来表示种群的平均合作率。

图1 不同容忍阈值T下种群平均合作率ρ(C+M)随着增益因子r变化的曲线图

图1展示了在不同容忍阈值下(+)随变化的函数曲线图,考虑了(a)=05和(b)=20,其余的参数分别是=03、=02、=04。尽管(+)随增大不断上升,但这会受到阈值的强烈影响。从图1(a)中可以看出,当=1时,种群突然在=15时由全部背叛状态转变为全部合作状态。然而当=4时,种群在=18时出现合作,但在=40仍未达到完全合作状态。这是因为种群中条件惩罚者对背叛者的忍耐度很低,相当于无条件驱逐者。只要其所在的群组中有背叛者,就会受到驱逐,并且此时的驱逐成功的概率为0.5。而当=4时,驱逐成功的概率等于1,也就意味着即使条件惩罚者的容忍度很高,即使在周围邻居均为搭便车者的群组中,他可以很好地面对这种情况,背叛者均会被驱逐出去。因此,即使比较大,合作型玩家也可以在较小时与背叛者共存。而且越大,种群达到完全合作状态所需要的更大,例如当=4时,(+)等于0.95,种群仍没有达到完全合作状态。这可能是因为条件惩罚者对背叛者的评价标准较宽松,导致背叛者仍然可以在较高增益因子的作用下生存。与此同时,=2、3也显示出类似的规律。结果表明,低阈值可以有效地促进合作的演化。

在=20的情况下(如图1(b)所示),种群合作率与增益因子的函数关系受到阈值的影响更加明显。种群中出现合作的临界值随容忍阈值的增大而变小,而种群出现全部合作状态的临界值随着阈值的增大而上升。具体来说,我们令=1、2、3、4,合作涌现时的增益因子值分别是3.4、2.62、2.47、1.7,而种群达到完全状态时的增益因子值却分别是3.4、2.6、4.0、4.2。驱逐成功概率随着容忍阈值改变的函数形式变为了二次函数,当=1、2、3、4时,概率依次递增,分别为0.0625、0.25、0.5625和1。当驱逐成功概率等于0.0625时,条件惩罚者虽然严厉,但驱逐成功的概率极低,种群中的背叛者贪婪地占领领地。我们改变了驱逐成功概率随容忍阈值变化的函数形式后,容忍阈值对合作演化的影响也会随之发生改变。

图2 不同容忍阈值下三种策略频率随着迭代时间推移的演化曲线

我们进一步观察了在不同容忍阈值下种群中三种策略比例随着迭代时间演变的过程,、、的值同图1中所设置的一样,而=20和=28。从四张图中,可以显然看出相对于条件惩罚者,合作者不能更有效地抵抗背叛者,总是最先开始消失。我们可以观察到,整个变化过程可分为三个阶段。在第一阶段,也就是在迭代开始的10MCS内,背叛者总是遥遥占领着优势,其他愿意贡献的玩家的生存空间狭窄。容忍阈值决定了背叛者比例达到最高点的值。=1时,背叛者很快就统领了整个种群。在第二阶段,条件惩罚机制的优势开始显现,因此条件惩罚者的比例迅速上升,对于=2,惩罚者在短时间内占据几乎整个网络,而背叛者则开始减少。最后,也就是稳定阶段,条件惩罚者比例的最终稳定值也取决于的值。具体来说,我们还可以观察到图5.2(b),条件惩罚者比例在0.95之间波动,图(c)中该比例在0.58之间波动,图(d)中该比例在0.36之间波动,且随着阈值变大在慢慢地下降。

本文还对惩罚罚金对合作的影响进行了探讨,绘制了不同的罚金=01、0.2、0.3、0.4、0.5下种群平均合作率随变化的函数关系图,其余的参数为=02、=04、=20、=3。如图3所示,增大惩罚罚金可以更好地促进合作。当惩罚罚金较小如=05,种群中在=23时开始出现合作,并且种群在等于3.1时出现全部合作状态。而=04时,合作出现所需要的增益因子值为2.4且直到=35种群中背叛者才被全部清除。然而当惩罚罚金下降到0.1时,种群中出现合作所需要的增益因子值上升,即在=26才出现合作。这表明较高的惩罚罚金可以使得合作在更低的值上出现并且更早地达到全部合作状态,同时我们可以观察到,罚金对种群达到完全合作状态的影响非常显著。这或许是由于模型的设定,条件惩罚者依据容忍限度来对背叛者进行概率驱逐和惩罚,当种群内达到一定合作水平的后惩罚行为占主导地位,此时合作水平对惩罚罚金比较敏感,因而罚金对种群达到全部合作状态时的影响明显大于合作出现的关键值的影响。

图3 不同罚金β下种群平均合作率ρ(C+M)随增益因子r变化的曲线图

综上所述,本文将条件惩罚策略引入到方格网络上的SPGG中,研究条件惩罚机制对合作演化的影响。与传统版本相比,该机制有效地促进了合作。在本文中,惩罚强度通过容忍阈值来控制。随着的增加,合作会进一步增强。值得注意的是,从微观角度来看,合作水平的提高归功于条件惩罚者。即使在诱惑相当大的情况下,也会导致合作型策略获胜,这表明条件惩罚在合作演化中起着至关重要的作用。与此同时,该模型采用与容忍阈值有关的驱逐概率,结合现实情况,阈值越小,驱逐实施的情况越恶劣,驱逐成功的概率越小。最后,本研究探讨了惩罚罚金对合作的影响,种群中玩家持有相同的忍耐力,罚金越大,合作水平显而易见地上升。本研究有助于进一步理解合作涌现背后的原因,为解决社会困境提供一些见解。另一方面,这可以给现实中制裁方案的制定提供一些思路。

猜你喜欢 罚金阈值种群 山西省发现刺五加种群分布今日农业(2022年15期)2022-09-20非平稳声信号下的小波变换去噪方法研究现代电子技术(2022年11期)2022-06-14非均匀光照下文本图像分割算法研究科技研究(2021年15期)2021-09-10罚金刑执行难的立法解决路径法制博览(2020年3期)2020-04-30由种群增长率反向分析种群数量的变化中学生物学(2018年8期)2018-03-01利用迭代软阈值方法抑制恒时演化类核磁共振实验中的采样截断伪峰分析化学(2017年12期)2017-12-25江南春破财2100万董事会(2015年11期)2015-12-02两种改进的局部阈值分割算法现代电子技术(2009年14期)2009-09-05罚金刑易科制度类型之比较法制与社会(2009年4期)2009-07-07论罚金刑的适用法制与社会(2009年1期)2009-07-05

推荐访问:演化 博弈 困境

本文来源:http://www.zhangdahai.com/shiyongfanwen/qitafanwen/2023/0411/582829.html

  • 相关内容
  • 热门专题
  • 网站地图- 手机版
  • Copyright @ www.zhangdahai.com 大海范文网 All Rights Reserved 黔ICP备2021006551号
  • 免责声明:大海范文网部分信息来自互联网,并不带表本站观点!若侵害了您的利益,请联系我们,我们将在48小时内删除!