渴望水平收益相比较,其中δ>0是很小的数。如果个体实现的收益低于其生存水平收益,那么该个体就会随机地模仿已抽取的个体,在相同的参与者群体中,所有其他个体都具有相同的概率被抽取。由此可见,如果渴望水平收益具有均匀分布(某一个区间上包含所有可能的收益值),那么模仿的概率对于个体的当前策略而言,在预期收益上是线性递减的。对于很小的δ,他们证明这个过程可以由有限时间区间上的复制动力学来*近。
人们把个体策略的适应过程作为连续时间中的一个随机过程。假设在有限群体中每一个个体时常得到一个冲动,使其改变纯策略。如果这些冲动是依照i.i.d.的Poisson分布,那么同时发生的概率是零,而且总的过程也是一个 Poisson过程。此外,总过程的密度刚好是各个过程密度的和。如果群体是很大的,那么人们利用预期值给出的确定流来近似这个总过程。
Bjornestedt和Weibull在1996年研究了一系列这种模型,其中改变的个体在其博弈的群体中模仿其他的个体,并证明许多正收益的选择动力学可以被人们推导出来,包括复制动力学的三种形式。特别,如果个体改变比率对其策略而言预期收益是线性递减的,那么每一个纯策略Poisson过程的密度是与其个体总数大小成比例,同时比例因素将是其预期收益递减的。如果每一个改变的个体选择其未来的策略是通过在其博弈中随机地模仿抽取的个体,那么其作为结果的流*近也是一个复制动力学。
Schlag在1997年分析当个体经常以参与者的同样地位去模仿其他参与者个体时,个体应该选择什么样的模仿规则的问题,然而参与者的同样地位却受制于信息和记忆的约束。他发现,如果个体想要学习规则是在所有平稳环境中收益递增,那么此个体应该满足:(1)当改变策略时,总是通过模仿来进行;(2)永远不向收益实现比其所拥有收益低的那些个体模仿;(3)向收益实现比其拥有收益高的那些个体模仿。
这种模型被各种各样不同的环境所发展。在有限两人博弈中,Schlag假设在随机地来自于两个相等大小的有限群体的个体之间两两配对,每一个有其自己的地位。个体总是执行纯策略。在每一个收益实现之后,每一个个体都要随机地与其他个体所处的群体进行抽样调查,并且比较两种收益的实现。行为规则是一种函数关系,即把收益实现和所用策略对应到博弈中个体地位上可获得的纯策略集合上的分布,为的是采用新的策略。换句话说,允许使用个体的唯一资料是这种收益实现和纯策略对。特别,从较早的博弈回合中实现收益被忽略。此外,假设个体在所有博弈中运用相同的行为规则,具有相同数目的纯策略可选择;也就是,个体不需要知晓他们执行什么样的博弈,他们知道所使用的纯策略数目就足够了。
在任何这样的博弈中,导致预期收益弱递增的以及在对手种群中对于任何固定策略分布的行为规则,称为改进。本文中的重要结果是对于所有这样规则的刻画。改进规则的一个特征是他们是模仿的:个体坚持其初始的策略或者采用抽样的个体策略;但是不会转向第三个的策略。
行为规则称为是占优的改进规则,如果在某一个博弈中不存在改进规则产生比较高的预期收益改进比例,而且在对手种群中的某一个策略分布上。Schlag证明,某一个行为规则为占优的改进规则,其具有上面给出的性质(1)(2)(3)。这个比例模仿规则是其自己的一个改进规则,而且可以证明它确有一些其他吸引人的性质。Schlag证明,Taylor两种群复制动力学的离散时间形式可以*近在任何给定有限时间范围内导出的一个随机过程,只要种群充分的大就行。
(四)进化对策论中的一些结论
本文集中探讨关于有限n人博弈的显性动力学种群模型方向的介绍,其中个体执行纯策略。首先探讨确定性选择动力学,然后介绍随机进化模型,其中把随机变异过程与确定性选择过程或者随机选择过程结合起来。
研究确定性动力学项目性质的一种直接方法是选取一个初始的种群状态,并且稍后可以计算。然后,人们应该记住让初始的所有纯策略在种群中出现,由于初始的已亡策略将在选择过程中仍保持已亡的状态。这种解的轨迹称为内部的。解的轨迹随时间流逝而安定下来,就称为收敛的。反之,则称为发散的。
如果种群状态是收敛的,那么什么是长时期限制状态的本质呢?可以证明,在任何一种弱的正收益选择动力学中,沿着任何收敛的内部轨迹,限制状态必将构建纳什均衡,研究人员发现,种群执行某种纳什均衡或者在渐进意义上的纳什均衡。Nachbar在1990年第一个证明出单种群复制动力学的这个结果。事实上,如果选择过程遇见弱的正收益的相对温和的条件,且如果汇总的行为随时间而安定下来,那么在长时期种群状态中的个体就好像他们预期一个特殊的纳什均衡对此执行着一个最佳反应,这点颇像是纳什所声称的“群体解释”。
如果对于弱的正收益选择动力学的内部解随时间而收敛,那么我们看到幸存下来的策略在作为结果的混合策略组合的最佳反应的意义上是理性的。此处的问题是,如果解的轨迹不收敛,那么会发生什么情况吗?当长时期中没有均衡达成时,我们产生的问题是,执行是否为理性的。
非合作博弈论中基本的理性假设是参与者不采用作为严格的劣(strictly dominated)纯策略。这个假设要求不知道其他参与者的偏好或者行为。一个更严格的理性一--附有知识的---假设是参与者不采用作为迭代的严格的劣策略。除了回避严格的劣的策略之外,这个假定要求所有参与者相互知道彼此的收益,而这些就是他们知道等等,一直到共同知识的某一个有限水平上使得迭代剔除严格劣的纯策略的过程停止。
因此,进化对策论中的基本问题是进化选择过程是否剔除掉所有的严格劣策略或者所有的迭代的严格劣纯策略。如果所有迭代的严格劣策略消失,那么这提供了在策略上相互作用的参与者行为假设的一种进化证明,就好像此假设是参与者他们作为理性人的共同知识。
Akin在1980年证明,在任何有限对称两人博弈中所有严格劣的纯策略沿着关于单种群复制动力学的任何一个内部解的轨迹都能消失。Samuelson和Zhang在1992年把这一结论推广到某一个两种群选择动力学的正收益子集合中的迭代的严格劣纯策略上。他们将这种情况称为聚集单调的(aggregate monotonic)。
对长时期进化状态分析的辅助方法是研究种群状态的稳定性,也就是考察种群对于很小的扰动是如何反应的。Bomze教授在1986年曾证明,如果种群状态在单种群复制动力学中是弱的动态稳定的,那么此状态就是对自己的最佳反应,这里的状态被认为是采用混合策略的。经常运用的稳定性准则是李雅普诺夫稳定性,即状态x是李雅普诺夫稳定的,如果x的邻域B包含x的邻域A,使得在A中开始的解将永远保留在B中。不是李雅普诺夫稳定的状态称为不稳定的。因此,不仅进化稳定性的静态稳定性准则,而且复制动力学中的动态稳定性都蕴涵着纳什均衡的实施。这个结果能够推广到任何有限n人博弈中的任何弱的正收益选择动力学上。总之,对进化压力而言,以各种不同方式系统阐述的稳定性都需要纳什均衡来实施。然而,不是所有的纳什均衡在这个方面都是稳定的,因此,这些进化稳定性准则是纳什均衡概念的精炼。
另外,研究者在考察动力学进化稳定性时,把随机因素并入到进化过程的建模当中。特别,变异过程被认为是内在随机的一种情况。随机振动可以凭借稳定性分析方法来解释确定性选择动力学;一个稳定的种群状态对于种群的孤立的很小扰动而言是稳健的。然而,这种稳定分析几乎说不出一系列的小振动或者同时发生的小振动累计之后促成的大振动的稳健性。这样的一系列或者同时发生的连续不断的振 上一页 [1] [2] [3] [4] [5] [6] 下一页
Tags:
|