当前位置:首页 >> 初中教育 >>

博弈论与信息经济学-5.演化博弈


第5章 演化博弈

经济学与生物学
? 经济学和生物学的历史从来就交织在一起。 众所周知,Charles Darwin的一个核心洞 见就来源于Thomas Malthus(1803)。对 于Darwin来说,Malthus的人口的增长率倾 向于超过产量增长率的论证暗示着不可避 免的生存之战,因此暗示着适者生存的自 然选择。

经济学与生物学
? 二者研究的都是个体在给定环境下的最优策略。 它们包含的内在逻辑相当一致:所有生命体的 行为看上去总好像设法使其基因的遗传频率最 大化,正如企业最大化其利润一样。
经济学 企业 最优化 策略 利润 扩张 生物学 物种(或个体) 适应 基因 适应性(fitness) 繁殖

倒闭
创新

灭绝
变异

?

在经典博弈论中,假设参与人具有使自己支付最大化的主 观意识与对于对手策略的最优反应能力,在实际中,这种 假设可能是不现实的。譬如在“象棋”中,棋手不可能在 每一步都能够采取最优的反应行动。

自然界中的博弈

? 吸血蝙蝠夜间去大型哺乳动物那里吸血,有些个 体偶尔会空腹而归,此时吸饱血的个体就会吐出 胃内的血液喂给饥饿的个体,尽管它们之间并没 有直接血缘关系。吸血蝙蝠更有可能回吐血液给 以前曾经回吐过血液的蝙蝠,而骗子(拒绝分享 的蝙蝠)将被蝙蝠群体记住,并且被排除在这种 协作之外。

自然界中的博弈

? 白色念珠菌(Monilia albican 或 canidia Albicans), 是一种真菌,通常存在于正常人口腔和消化道粘膜中, 一般在正常机体中数量少,不引起疾病。当机体免疫 功能或一般防御力下降,则本菌大量繁殖并改变生长 形式(芽生菌丝相)侵入细胞引起疾病。

? 演化博弈论(evolutionary stable strategy) 整合了理性经济学与演化生物学的思想, 不再将参与人模型化为超级理性的博弈方, 认为参与人通常是通过试错的方法达到博 弈均衡的,与生物演化具有共性。

? 在演化博弈中,认为参与人的选择行为可以依据 前人的经验、学习与模仿他人行为、受遗传因素 的决定等。因而演化博弈把具有主观选择行为的 参与人扩展为包括动物、植物在内的有机体,动 植物参与者的支付可被理解为为某种适应程度。 把博弈论的分析与应用从研究人类的竞争行为扩 展为研究有机体的策略互动关系。这个领域的开 创性工作是由英国生物学家约翰· 梅纳德· 史密斯 (John Maynard Smith)和G.R.普莱斯 (G.R.Price)1973年进行的。演化博弈现在正 逐渐被广泛应用于社会经济学领域。

演化博弈的关注内容
? 演化博弈强调经济变迁过程中以个体多样 性变异机制和偏好选择机制为代表的种群 研究。 ? 它探讨种群选择的策略是否获得最佳的收 益,并消除任何小的突变群体的扰动。

演化博弈的假设条件
? 首先我们假定群体中的参与人都是完全相 同的,因此以下我们只考虑对称博弈。 ? 其次,我们假定每个参与人只能机械地选 择某种策略(而无法改变自己的策略)。 如果某种策略获得了成功,采用这种策略 的参与人将越来越多,反之如果某种策略 不成功,采用这种策略的参与人就越来越 少。

演化稳定策略(ESS)
? 演化稳定策略,是指如果占群体绝大多数 的个体选择演化稳定策略,那么小的突变 者群体就不可能侵入到这个群体。 ? 或者说,在自然选择压力下,突变者要么 改变策略而选择演化稳定策略,要么退出 系统而在进化过程中消失。

例1:囚徒困境博弈
C C
D

D 0,3
1,1

2,2
3,0

C代表合作,D代表背叛。 合作是否是一种演化稳定策略?

分析:

C C D 2,2 3,0

D 0,3 1,1

假定一个群体由合作者构成,由于基因变异出现 了比例为ε的背叛者。 此时合作者的收益为:(1-ε)*2+ε*0=2-2ε 背叛者的收益为:(1-ε)*3+ε*1=3-2ε 由于背叛者的收益高于合作者的收益,背叛者不 仅不会消亡,反而会越来越多。因此,合作不是 一个演化稳定策略。

演化稳定策略是 什么呢?

C C D 2,2 3,0

D 0,3 1,1

假定一个群体由背叛者构成,由于基因变异出现 了比例为ε的合作者。 此时背叛者的收益为:(1-ε)*1+ε*3=1+2ε 合作者的收益为:(1-ε)*0+ε*2=2ε 由于合作者的收益低于背叛者的收益,合作者会 逐渐消亡,因此背叛是一个演化稳定策略。

结论:
? 严格劣策略不可能是演化稳定策略。

例2:
A B

A 2,2 0,0

B 0,0 0,0

C 0,0 1,1

C

0,0

1,1

0,0

问题1:C是否是一个演化稳定策略? 结论:一个策略可以入侵别的策略,并不意味着 它就是演化稳定策略。 问题2:C是否是一个纳什均衡? 结论:如果一个策略组合(S,S)不构成纳什 均衡,则S不是演化稳定策略。

纳什均衡与演化稳定策略
A A B 1,1 0,0 B 0,0 0,0

博弈的纳什均衡(A,A)和(B,B)。 B是否是一个演化稳定策略? 结论: 1. 纳什均衡并不意味着演化稳定策略; 2. 严格纳什均衡意味着演化稳定策略。

纯策略下演化稳定策略的定义1 (Maynard Smith, 1972)
在二人对称博弈中,纯策略S*是演化稳定策略,如果 存在0 ? ? ? 1,对于? ? ? , 下式对于所有的纯策略S ' 成立:

?1 ? ? ?U ? S *, S *? ? ?U ? S *, S '? ? ?1 ? ? ?U ? S ', S *? ? ?U ? S ', S '?

纯策略下演化稳定策略的定义2
在二人对称博弈中,纯策略S*是演化稳定策略,如果 以下两式成立:

?1?U ? S *, S *? ? U ? S ', S *? ? 2 ? 若U ? S*, S *? =U ? S ', S *?,则U ? S *, S '? ? U ? S ', S '?

例3:找出ESS
A A B 1,1 1,1 B 1,1 0,0

U(A,A)=U(B,A) U(A,B)>U(B,B) 因此A是演化稳定策略

例4:
A B

A
10,10 0,0

B
0,0 1,1

演化稳定策略:A和C C是一种效率很低的状态,但社会一旦陷入 了这种状态,就很难走出去。 这就是所谓的“路径依赖”

路径依赖
? 路径依赖(Path-Dependence),指人类社 会中的技术演进或制度变迁均有类似于物 理学中的惯性,即一旦进入某一路径(无 论是“好”还是“坏”)就可能对这种路 径产生依赖。一旦人们做了某种选择,就 好比走上了一条不归之路,惯性的力量会 使这一选择不断自我强化,并让你轻易走 不出去。

路径依赖的例子
? 有人将5只猴子放在一只笼子里,并在笼子中间吊上一串香蕉,只要 有猴子伸手去拿香蕉,就用高压水教训所有的猴子,直到没有一只猴 子再敢动手。 ? 然后用一只新猴子替换出笼子里的一只猴子,新来的猴子不知这 里的“规矩”,竟又伸出上肢去拿香蕉,结果触怒了原来笼子里的4 只猴子,于是它们代替人执行惩罚任务,把新来的猴子暴打一顿,直 到它服从这里的“规矩”为止。 ? 试验人员如此不断地将最初经历过高压水惩戒的猴子换出来,最 后笼子里的猴子全是新的,但没有一只猴子再敢去碰香蕉。 ? 起初,猴子怕受到“株连”,不允许其他猴子去碰香蕉,这是合 理的。 ? 但后来人和高压水都不再介入,而新来的猴子却固守着“不许拿 香蕉”的制度不变,这就是路径依赖的自我强化效应。

路径依赖的例子
? 一个广为流传、引人入胜的例证是:现代铁路两条铁轨之间的标准距 离是四英尺又八点五英寸。原来,早期的铁路是由建电车的人所设计 的,而四英尺又八点五英寸正是电车所用的轮距标准。那么,电车的 标准又是从哪里来的呢?最先造电车的人以前是造马车的,所以电车 的标准是沿用马车的轮距标准。马车又为什么要用这个轮距标准呢? 英国马路辙迹的宽度是四英尺又八点五英寸,所以,如果马车用其他 轮距,它的轮子很快会在英国的老路上撞坏。这些辙迹又是从何而来 的呢?从古罗马人那里来的。因为整个欧洲,包括英国的长途老路都 是由罗马人为它的军队所铺设的,而四英尺又八点五英寸正是罗马战 车的宽度。 ? 任何其他轮宽的战车在这些路上行驶的话,轮子的寿命都不会很 长。可以再问,罗马人为什么以四英尺又八点五英寸为战车的轮距宽 度呢?原因很简单,这是牵引一辆战车的两匹马屁股的宽度。故事到 此还没有结束。美国航天飞机燃料箱的两旁有两个火箭推进器,因为 这 路径依赖些推进器造好之后要用火车运送,路上又要通过一些隧 道,而这些隧道的宽度只比火车轨道宽一点,因此火箭助推器的宽度 是由铁轨的宽度所决定的。 ? 所以,最后的结论是:路径依赖导致了美国航天飞机火箭助推器 的宽度,竟然是两千年前便由两匹马屁股的宽度所决定的。

成功是一种习惯
? 人们关于习惯的一切理论都可以用“路径 依赖”来解释。它告诉我们,要想路径依 赖的负面效应不发生,那么在最开始的时 候就要找准一个正确的方向。每个人都有 自己的基本思维模式,这种模式很大程度 上会决定你以后的人生道路。而这种模式 的基础,其实是早在童年时期就奠定了的。 做好了你的第一次选择,你就设定了自己 的人生。

路径依赖与制度变革
? 对组织而言,一种制度形成后,会形成某 个既得利益集团,他们对现在的制度有强 烈的要求,只有巩固和强化现有制度才能 保障他们继续获得利益,哪怕新制度对全 局更有效率。对个人而言,一旦人们做出 选择以后会不断地投入精力、金钱及各种 物资,如果哪天发现自己选择的道路不合 适也不会轻易改变,因为这样会使得自己 在前期的巨大投入变得一文不值,这在经 济学上叫“沉没成本”。沉没成本是路径 依赖的主要原因。

猎鹿博弈
? 猎鹿博弈源自启蒙思想家卢梭的著作《论人类不平等的起源和基础》 中的一个故事。 ? 古代的村庄有两个猎人。当地的猎物主要有两种:鹿和兔子。如果 一个猎人单兵作战,一天最多只能打到4只兔子。只有两个一起去才 能猎获一只鹿。从填饱肚子的角度来说,4只兔子能保证一个人4天 不挨饿,而一只鹿却能让两个人吃上10天。

改变收益矩阵的猎鹿博弈

3 3 4

0

4 0 4

4

另一个例子 问题1:此博弈对应现实生活中的什么情况 问题2:此博弈是否存在演化稳定策略

A A B 0,0 1,2

B 2,1 0,0

混合策略下演化稳定策略的定义
在二人对称博弈中,混合策略P*是演化稳定策略,如果 以下两式成立:

?1?U ? P*, P *? ? U ? P ', P *? ? 2 ? 若U ? P*, P *? =U ? P ', P *?,则U ? P*, P '? ? U ? P ', P '?

找出以下博弈的混合策略ESS
A
A B 0,0 1,2

B
2,1 0,0

(1)找出博弈的混合策略纳什均衡。 由于博弈的对称性,双方的混合策略纳什均衡必然是相同 的,设为(p,1-p) 给定局中人1的策略(p,1-p) 局中人2选择A的收益:p*0+(1-p)*2=2-2p 局中人2选择B的收益:p*1+(1-p)*0=p 根据2-p=p,解出p=2/3 (2)(2/3,1/3)是否是一个严格纳什均衡? (3)(2/3,1/3)是否是ESS?

象海豹的生存策略

鹰鸽博弈
H H D (v-c)/2,(v-c)/2 0,v D v,0 v/2,v/2

博弈的演化稳定策略是什么? 当v>c时,(H,H)是严格纳什均衡,因此H是演化稳定策 略。 当v=c时,(H,H)是弱纳什均衡,因为U(H,D)>U(D,D), 因此H是演化稳定策略 当v<c时,不存在纯策略演化稳定策略。 此时是否存在混合策略ESS? 首先找出混合策略纳什均衡(v/c,1-v/c), 其次验证其是否为ESS。

石头剪刀布
R R S P 1,1 0,V V,0 S V,0 1,1 0,V P 0,V V,0 1,1
1<V<2

易证,博弈中唯一的混合策略纳什均衡是p=(1/3,1/3,1/3) 验证其是否为ESS,设p‘=(p,q,1-p-q) U(p,p')=(1+V)/3 U(p',p')=1 U(p,p')<U(p',p') 因此博弈中不存在ESS

蜥蜴的生存策略

动态演化
? 复制者(replicator)
? 能够大致精确地复制自身的个体。 ? 例如基因、生物体或是弥母(meme)

? 动态演化的复制者系统
? 不同复制者的所占比例随时间的变化过程,其

中不同策略复制的速度与他们的收益呈正相关。

复制者的策略
? 考虑一个n人演化博弈(i=1,2,...n),博弈在每个时间 点t上进行(t=1,2,...).设pit为在t期中采用策略si的局中 人的比例,此时si的收益为πit=πi(pt),其中p=(p1,...,pn)。 不妨设π1t≤π2t≤…≤πnt ? 假定在每个时期dt,每个个体i都以αdt的概率发现某个 随机个体j的收益,如果i发现j的收益比自己高,就以pijt 的概率转变为j的策略。

?? (? tj ? ? it ) ? t pij ? ? ?0 ?

当? ? ? 当? ? ?
t j t j

t i t i

此时在t+dt期使用si策略的局中人所占比例的期望 值Epit+dt为:
Ep
t ? dt i

? p ? ? dtp
t i

t i

j ?i ?1 n

?
j ?1

n

p ? (? ? ? ) ? ? dtp
t j t j t i

t i

p tj ? (? it ? ? tj ) ?
j ?1

i

? pit ? ? dtpit ? p tj ? (? it ? ? tj ) ? pit ? ? dtpit ? (? it ? ? t )
t t 其中? t ? ? 1t p1t ??? ? n pn

如果个体数量很多,则Epit+dt≈pit+dt
pit ? dt ? pit ? ? dtpit ? (? it ? ? t ) dpi t ? pi t ? ? ?? pi t (? i t ? ? t ) dt

这个式子称为复制者动态(replicator dynamic)方程

复制者动态方程的应用
鹰 鸽




u-1,u-1
u,u+2

u+2,u
u+1,u+1

? 设群体由n个个体构成,p是“鹰”策略的局中人在群体 中所占比例

? 在dt的时间内,一个“鸽”策略局中人可以繁殖 的后代个数的期望值为:

f d ( p )dt ? ( pu ? (1 ? p )(u ? 1))dt ? (u ? 1 ? p )dt
? 下个时期群体中“鸽“策略局中人个数为

n(1 ? p )(1 ? f d ( p )dt ) ? n(1 ? p )(1 ? (u ? 1 ? p )dt )

? 同理,在dt的时间内,一个“鹰”策略局中人可 以繁殖的后代个数的期望值为:

f h ( p)dt ? ( p (u ? 1) ? (1 ? p)(u ? 2)) dt ? (u ? 2 ? 3 p)dt
? 下个时期群体中“鹰“策略局中人个数为

np(1 ? f h ( p)dt ) ? n(1 ? p)(1 ? (u ? 2 ? 3 p)dt )

? 在dt的时间内,所有局中人可以繁殖的后代个数 的期望值为:

f ( p)dt ? ((1 ? p) f d ( p) ? pf h ( p)) dt
? 下个时期群体中所有局中人个数为

n(1 ? f ( p)dt )

? 第t+dt期”鹰“策略局中人所占比例p(t+dt)为

p (t ? pt ) np (t )(1 ? f h ( p )dt ) ? n(1 ? f ( p )dt ) 1 ? f h ( p) dt ? p (t ) 1 ? f ( p )dt ? f h ( p) ? f ( p) ? p (t ? dt ) ? p (t ) ? p (t ) ? ? dt ? 1 ? f ( p )dt ? dp ? p (t )[ f h ( p ) ? f ( p )] dt

? 代入数字,得:
dp ? p(1 ? p)(1 ? 2 p) dt
dp/dt

0

1/2

1

p


相关文章:
《博弈论与信息经济学》课程论文
博弈论与信息经济学》 课程作业 姓学专导 名: 号: 业: 师: 黄文彬 S...(这并不是一句客套话) 二、研究计划书(限 3-5 页) 1.论文题目 不同征税...
博弈论与信息经济学
(陈伟民chenweimin9988@163.com) 经济管理学科一种主流的研究方法或工具 诺贝尔经济学奖先后5个年度颁发给研究博弈论及其相关领域的13位经济学家/数学家(1994年3...
博弈论与信息经济学
博弈论与信息经济学》 ,上海三联书店,上海人民出版社,1996 年 (5)缪尔森《经济学》 (http://www.sciencenet.cn/m/user_content.aspx?id=278594)说的 是...
博弈论与信息经济学
博弈论与信息经济学博弈论与信息经济学》期末考试考试论文 目录事件发生...媒体数字报刊( 2011 年 6 月 14 日) 5 全国博弈论与实验经济学 2006 学术...
博弈论与信息经济学复习题3
博弈论与信息经济学复习题3_经济学_高等教育_教育专区。博弈论与信息经济学复习...L G R L T M B 9,6 8,4 7,7 7,8 8,5 6,6 6,7 7,4 8,5 ...
博弈论与信息经济学应用论文
博弈论与信息经济学应用论文_经济/市场_经管营销_专业资料。《博弈论与信息经济...参考文献: 我国汽车金融服务业信用风险的管理对策,百度文库 [5] ...
读《博弈论与信息经济学》后之感
博弈论与信息经济学》这本书 博弈论与信息经济学》中国在博弈论和信息经济学领域方面的研究很少,几乎为零。最先引进博 弈论和信息经济学的算是张教授的此本...
博弈演化
演化博弈 5页 免费 演化博弈 25页 1下载券 10.演化博弈 30页 1下载券 演化...博弈论与信息经济学 257页 免费博​弈​演​化 暂无评价|0人阅读|0次下...
演化博弈理论
如今,经济学家们运用演化博弈论分析社会习惯、规范、制 度或体制形成的影响因素...参考文献: [1] 谢识予 有限条件下的进化博弈论,上海财经大学,2001,(5) [2]...
《博弈论与信息经济学》课程论文:贵大四、五食堂的博弈
博弈论与信息经济学》课程论文:贵大四、五食堂的博弈_经济学_高等教育_教育...最后的结果就是:五食堂选择 -5- “提升” ,四食堂选择“保持” 。 又由...
更多相关标签:
演化博弈论 | 演化博弈论 pdf | 演化与博弈论 | 演化与博弈论 pdf | 演化博弈论数据分析 | 演化博弈论 清华 | 演化博弈论 模型 | 演化博弈论计算过程 |