当前位置:首页 >> 农林牧渔 >>

向传统智猪博弈理论发起挑战


向传统智猪博弈理论发起挑战
张天瑞 本文摘要: 本文认为,传统的智猪博弈理论有偏颇和不详尽之处,在其中 所描述的对于均衡唯一性的看法只能在博弈是一次性或者虽然重 复进行但是双方共同追求的唯一的收益不可以分割或者收益可以 分割的某些情况下存在, 事实上在传统智猪博弈理论的描述中丝毫 看不出为了生存双方的博弈是一次性的。倘非如此,即在重复进行 的收益可以分割的智猪博弈中,

对于大猪一方总存在出让食物的激 励, 因为凭借此策略他最终所获得的净收益至少不会比他在传统策 略下所获得的净收益更少,并且这一切的实现由纳什均衡保证。 关键词: 一次性 重复博弈 收益可分割 纳什均衡 正文: 本文为传统智猪博弈理论掘墓。 在本文中我选取美国艾里克.拉斯谬森先生所著的《博弈与信 息》一书中所描述的智猪博弈作为我要批判的靶子,我将要说明为 什么在大多数情况下面对同样的博弈经典看法给出的均衡是错误 的以及什么时候它给出的均衡又是正确的, 当然我的一系列论证是 建立在我所选取的该智猪博弈的案例本是就是对智猪博弈的经典 描述,并且它给出的均衡从未在前人的思考中得到任何的质疑。 这一描述是这样的:“两头猪被关在同一个猪圈里,猪圈的一 头安装着一个特制的按键,另一头安装着一个食槽。当一头猪按下 按键时,会有10单位的食物进入槽中,但按键的猪会付出2单位的 成本。这两头猪中,有一头身强力壮(我们不妨假定他是头大猪)。 如果大猪先到食槽,则小猪只能吃到相当于1单位的残羹冷炙,但 若小猪先到的话,则它能吃到4单位的食物。若两头猪同时到,则 小猪可吃到3单位食物。”可以看出,该博弈是一个完全信息静态博

弈,由此我们给出支付矩阵,见下图: 小猪 按键 按 大 键 猪 等 待 等待

( 5, 1)

(4,4)

( 9, -1 )

(0,0)

(经典支付矩阵) 并且,作者认为(大猪选择按键,小猪选择等待)是本博弈唯 一的纳什均衡, 这一点显然已经在所有知道该博弈的前人的头脑中 形成共识。 所谓结论往往是我们懒得再思考下去的地方, 我的质疑就在此 开始。粗略的一看,博弈中大猪的策略空间是{如果小猪选择等待 我将选择按键,如果小猪选择按键我将选择等待},但也正是这一 粗略的看法, 我们的思维被蒙骗了。 如果我们细心一点, 就会发现, 传统的智猪博弈理论隐含着这样一个事实——大猪对于他该吃多 少食物是力所能及的。如我后文将要指出,倘若这一假设是正确的 话,传统的结论还情有可原,但事实上假如大猪聪明一点的话这条 假设根本就是不能成立的。在传统智猪博弈理论的描述中我无法想 象大猪和小猪为了生存他们之间的博弈是一次性的, 我的分析就此 展开。难道我们可怜的大猪就没有发现正是他贪得无厌的策略使得 小猪认为自己去按键的话根本无利可图才选择每次都等待吗?况 且贪得无厌的收益也不过只是他的想法罢了, 他并没有得到他当初 想得到的9单位的净收益,得到只是来回奔波和小于9单位的4单位 的净收益。大猪应该思考,有什么办法能让他得到的比4单位多一 点,而小猪也不得不去按键,即这是一种均衡呢?我们再思考原博 弈,小猪之所以不选择按键是因为他知道,大猪是贪得无厌的,留 给他的只有1单位食物,而他却要为此付出两单位成本。既然是博 弈,大猪就应该也站在小猪的角度思考,如果自己付出两单位成本

后所得的净收益为正,自己还是有利可图的,所以会选择按键。那 么, 大猪现在要思考的一件事情就是, 他是否应该不那么贪得无厌, 即能否在每次博弈中为小猪出让点食物,使得最后自己得到的净收 益大于因为他贪得无厌而最终只能得到的4单位的净收益,并且当 然,这是一种均衡,谁也没有激励打破它。 我们假设出让的食物的单位为x,用数学来表示上述想法就应 x 该是如下所展示的: 1+x>0,且 -1+x>0,且9-x>4, =>1<x<5 我们试任选一个x的值,带入原博弈中看看均衡是否会发生变 x 化。比如我们选取x=2 x=2,此时得到如下支付矩阵(这一系列由x的值 x=2 x 得到的新的支付矩阵不妨称之为叛逆支付矩阵): 小猪 按键 按 大 键 猪 等 待 等待

( 5, 1)

(4,4)

( 7, 1)

(0,0)

(叛逆支付矩阵) 现在我们来重新考察博弈, 此时无论大猪还是小猪都没有严格 优势策略,不管用什么方法,最终我们看到在这一给定的支付矩阵 下存在两个纯策略纳什均衡:(大猪等待,小猪按键)或者(大猪 按键,小猪等待),在后者中,大猪的福利和传统智猪博弈理论中 描绘的一样好,但是在前者中,大猪的福利显然优于传统智猪博弈 理论中的描绘,也即是说,当大猪愿意在和小猪反复的博弈中总是 出让两个单位的食物时,他最终所得至少和他凭借“能吃就吃”的 传统策略所得一样好。 但是x=2仅仅是一个特殊的值, 我们还不能仅凭借于此就轻易 x 的下结论,博弈的思维提醒我们继续我们的工作: 当1<x<5,且9-x<5 1<x<5, 9 x<5,即4<x<5 4<x<5时,在叛逆支付矩阵中,选择按键 1<x<5 4<x<5

是大猪的占优策略, 此时博弈拥有唯一的纳什均衡 (大猪选择按键, 小猪选择等待);当1<x<5 9-x>5 1<x<5,且9 x>5,即1<x<4 1<x<4时,在叛逆支付矩阵 1<x<5 1<x<4 中,每对应一个给定的x值,博弈都拥有两个纯策略纳什均衡,它 x 们是(大猪选择按键,小猪选择等待)或者(大猪选择等待,小猪 选择按键);当x=4 x=4时,支付矩阵如下: x=4 小猪 按键 按 大 键 猪 等 待 等待

( 5, 1)

(4,4)

( 5, 3)

(0,0)

我们用划线的方法可以知道博弈仍旧拥有(大猪选择按键,小 猪选择等待)或者(大猪选择等待,小猪选择按键)两个纳什均衡。 从以上的分析可以看出,我们所得到的均为纯策略纳什均衡, 当对应一个给定的x值时,如果纯策略纳什均衡的个数是两个,由 x 威尔逊(wilson)奇数定理可知博弈还应该有一个混合策略纳什均 衡,这一点可以由“无差异原则”算出,但是我觉得在这里混合策 略纳什均衡可能对现实的意义不大,并且实际的来讲,在混合策略 下大猪的期望支付往往会小于4单位的净收益,所以对大猪而言没 有激励实施混合策略,而当他抱定某种策略时,由于纳什均衡的意 义,小猪也没有激励采用混合策略。 所以,我们只关注纯策略纳什均衡。如上面讨论x值范围所分 x 析的那样,具体的讲,对于每一个给定的x值,当博弈拥有两个纯 x 策略纳什均衡时,大猪在其中所得的净收益至少和4单位一样好, 即使仍然只有一个纯策略纳什均衡,大猪也不会拥有比4单位更差 的净收益。因为可实现的x值满足于一个范围,所以我们也可以认 x 为在重复进行的收益可以分割的智猪博弈中存在无穷个纳什均衡。 在这样一种可以实现的激励下, 我们还有什么理由坚持最终属于大 猪的只能是来回按键和那4单位的净收益呢?一定要注意,完全信 息的博弈提醒我们,大猪出让上述范围食物的策略小猪一定是知道

的,他知道大猪坚信采取这样的策略所得至少不小于4单位,他也 知道当大猪顽强等待时自己选择等待劣于选择按键。 那么如果出现 两个纳什均衡时,到底会实现哪一个呢?稍带调侃我们可以说,这 要取决与博弈时大猪和小猪饥饿的程度,谁的忍耐力更强一些,谁 就可以选择等待。自然,当大猪得到比4单位更多的净收益的想法 实现时,伴随而来的是小猪福利的降低,因为既然有1<x<5 1<x<5,则推出 1<x<5 1+x<4 因为如上策略的分析建立在博弈是重复进行的并且收益可 <4。 -1+x<4。 以分割的基础上,我还要大致说明一下,我们这样考虑智猪博弈时 认定他们之间的较量只进行有限次,从逆向归纳的角度来说,小猪 考虑到最后一次博弈和一次性博弈等同,可能在博弈进行到某次时 开始抱定等待的策略,但这也是在十分靠后情况下了,何况更可信 的我们可以认为,即使是在倒数第二次博弈中,小猪也会选择当大 猪等待时他去按键,因为这可以是纳什均衡。 另外我们还要细心考察一下端点。当x=1 x=1时,博弈的支付矩阵 x=1 如下:

小猪 按键 按 大 键 猪 等 待 等待

( 5, 1)

(4,4)

( 8, 0)

(0,0)

博弈的均衡仍然是(大猪按键,小猪等待),我只是想让我们 的思维扩展一下,如果我们假设同样等待下去小猪比大猪先死(当 然,我们不允许大猪和小猪之间发生直接的残杀),那么相当于我 们修改了博弈的支付,大猪等待同时小猪等待的结果为(大猪活, 小猪死)!我们把小猪死的净收益看作为负无穷,那么纳什均衡就 为(无论如何大猪选择等待,无论如何小猪选择按键),并且大猪 所得是完完整整的9单位的净收益,小猪虽然净收益总为负,但是 请注意,他毕竟活了下来,生存是最大的收益。

考虑另一个端点,如果有x=5 x=5,博弈的支付矩阵如下: x=5

小猪 按键 按 大 键 猪 等 待 等待

( 5, 1)

(4,4)

( 4, 4)

(0,0)

博弈的均衡仍然是(大猪按键,小猪等待),同样的道理,如 果我们修改博弈的支付,认为同样等待小猪比大猪先死,那么实际 的纳什均衡就为(无论如何大猪选择等待,无论如何小猪选择按 键)。当然了,无论是x=1 x=1,还是x=5 x=5,正如我所说的,这样的均衡建 x=1 x=5 立在我们已经修改了原博弈支付的基础上,也就是说,仅就这两个 端点的情况而言, 我们人为的改动不能说传统智猪博弈理论的看法 是错误的。此外,如果你承认这样对双方等待所获支付的改动更贴 近现实的话,我们回到叛逆支付矩阵中,既然大猪和小猪都顽强等 待下去的话小猪先死, 那么大猪的策略必定是坚决选择等待并且每 次能吃多少就吃多少,他的净收益是完完整整的9个单位,小猪虽 然总是净收益为负,但正如我所说的,他毕竟活下来了,为了生存 多按几次就可以了。当然,这些都是题外话,属于对模型的扩展, 因为这些思路改变了原来博弈的支付。 这就引出了一个问题,如同有人在聆听了我陈述完我叛逆的看 法之后所辩驳的那样, 他们认为我修改了原博弈的支付因此我对传 统智猪博弈结论的批评是不成立的, 也就是说他们认为传统智猪博 弈理论是正确的。形式上看我的确是修改了原博弈的支付,因为任 意带入一个x的值,支付矩阵都与原博弈不再相同了。不要再试图 x 捍卫旧的理论了,我根本没有修改什么支付,我只是提出了一些不

同的策略, 支付作为结果之所以改变难道不是因为策略发生了变化 吗?最最重要的是大猪不将因为小猪努力而掉下的食物全部吃完 而出让一部分,所得到的比他不这样做所得到的利益至少不会更 差,而绝不是什么为了面子即不来回奔波比来回奔波要好,虽然形 式上的确是那样。在不修改原博弈支付的基础上,即大猪与小猪同 样等待的结果是双方一无所获,净收益均为零,此时每选取一个x x 值的水平,都可以对应不同的纳什均衡。对大猪来说,x当然是越 x 小越好,但是x=1 x=1的端点取不到了,在大猪可能的福利增进的决策 x=1 过程中没有一个极限值可以选取。但是无论选择哪一个水平的x都 至少不会比传统智猪博弈中的选择更差。当然了,如前所述,大猪 选择一个什么样的x水平可以由当时他的饥饿水平决定,小猪同样 x 也不必悲观,既然净收益总是为正的,那么想吃多少多去按几次就 可以了。 那么什么时候传统智猪博弈理论又是正确的呢?说起来也是 很简单的, 大猪之所以可以做到出让一些食物不正是建立在收益可 以被他拿来分割的基础之上吗?所以, 当类似智猪博弈的事情发生 时, 假若双方共同面对的收益是不可分割的——那么大猪无法出让 一些利益——则大猪的策略也只能是能占有多少就占有多少。这 样,均衡就还是如同传统智猪博弈理论所描述的那样,大猪来回奔 波按键,小猪选择等待坐享其成。 另外,传统智猪博弈理论上可以是一次性的,也可以是重复进 行的。如果是一次性的,双方都知道他们之间进行的博弈只此一次 (我再次申明,智猪博弈中看不到这一点,无法想象大猪、小猪吃 一次食物是否能一直活下去),那么无论大猪怎样保证,小猪也绝 对不敢相信大猪真的能为他出让一些食物以弥补他按键的成本, 所 以在双方等待各得为零的假定下小猪坚决选择等待。 如果是重复进 行的博弈,无论怎样,只要收益可以分割,在前人所描述的博弈中 (即支付的相对关系是不变的),大猪都可以凭借出让部分食物而 获益——这比起不愿出让食物的最终收获可能有一个额外的剩余 但不可能有一个额外的缩水。智猪博弈是完全信息的,如果不是也 没有关系。在重复博弈中,最多只需要一次均衡就会按照收益是否 可分割而呈现传统的形态或是我提出的解释所描述的形态, 由于存 在出让食物的激励,在双方试探性等待的过程中大猪可以选择向小

猪提供信息,让小猪知道他选择按键的净收益为正是可信的,这就 好似博弈理论中所讲的廉价磋商。 而且我们不得不注意,智猪博弈中的参与人只有两个,或者,广 义的为两种力量。 当博弈中的一方面对的竞争对手除了形式上的另 一方还有很多潜在的竞争者时,请你考虑一方和另一种力量之间的 博弈,这时候谁是大猪谁是小猪可就不好说了,要视具体情况而定。 另外我联想到同样是《博弈与信息》中提到的一个案例——“大猪 控股”与“小猪有限”都打算引进一种新产品,但为了获得公众的认 可,必须花费可观的广告费用。因此,如果“大猪控股”打头阵的话, “小猪有限”随后跟进也可以分一杯羹。相反,如果“小猪有限”贸然 先行,那么“大猪控股”就会后发制人独霸市场——曾有老师以此为 例反驳我对传统智猪博弈理论的发难,他的意思是说,在此例中, “大猪控股”为什么要向“小猪有限”出让利益呢?对此我想说,首先 我们要确保此例中市场上只存在“大猪控股”和“小猪有限”两个寡 头,即我们分析问题时不考虑其他可能的潜在瓜分利益者,我们认 为他们不存在。 在此基础上, “大猪控股” 和“小猪有限”之间相互争 夺的利益是否为其必须呢?在智猪博弈中,生存是最大的收益,除 了吃到食物没有其他途径可以保障, 因此才会出现大猪和小猪为食 物博弈的情况,在此例中,倘若引进新产品的收益不是他们一方所 必须的,既存在其他资源配置途径维持企业的生存并赢得利润,那 么企业的策略就不仅仅考虑是先打广告还是坐收渔利,对此恐怕需 要放宽假设引入更复杂的模型,但与简单的智猪博弈无关。我们假 设新产品的预期利益巨大,他影响到企业今后的市场份额,关系到 企业今后的生存,即引进新产品是必须的,则广告也是必须的。在 此情况下,“独霸市场”提醒我们,在“小猪有限”看来他们对于本 产品广告收益的争夺是一次性博弈,所以他对先行策略慎之又慎, 他不相信他先行后“大猪控股”不会选择独霸市场,所以他一定是按 兵不动。 但这些又与智猪博弈何干呢?难道我们不承认在逻辑正确 的前提下不同的结论只是建立在不同假设之上的结果吗?如果智 猪博弈是一次性的,小猪必然选择等待,无论收益是否可以分割; 如果智猪博弈是重复进行的——这也和现实中的很多现象相吻合, 当收益不可以分割时,大猪和小猪之间的均衡遵循传统的解释;当 收益可以分割时, 大猪有能力或者让小猪来回奔波并且此时他获得

的净收益大于他在传统解释的描绘中所能得到的净收益或者至少 一样好。即使用一个简单的模型解释世界时,我们也应该分清楚不 同的约束条件。 倘若反对我文中看法之人能和我身临其境于智猪博 弈模型的环境中为生存而不停的博弈,那么我愿意选择当大猪,因 为我拥有能让他来回奔波并且我所得的无论如何都更多的选择, 而 且即使不是如此我所获得的也不会比我不这样做更差,对此我愿意 和他永远博弈下去! 难道,我上文中呈现出来的逻辑有什么不正确的地方吗? 到此,全文结束。

参考书籍:[美]《博弈与信息》艾里克.拉斯谬森 ] 经济学专业2002 2002级 西南财经大学 经济学院 经济学专业2002级1班 张天瑞 (手机 手机) Tel:87359227 (寝室) (寝室) 寝室 13880673420 (手机)


相关文章:
向传统智猪博弈理论发起挑战
向传统智猪博弈理论发起挑战张天瑞 本文摘要: 本文认为,传统的智猪博弈理论有偏颇和不详尽之处,在其中 所描述的对于均衡唯一性的看法只能在博弈是一次性或者虽然重...
智猪博弈理论
向传统智猪博弈理论发起... 9页 免费 20任务二十-智猪博弈理论... 2页 免费...博​弈​论​(​G​a​m​e​ ​T​h​e​o​r...
智猪博弈理论
向传统智猪博弈理论发起挑... 9页 免费如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点击此处进行反馈。 ...
智猪博弈理论
智猪博弈理论_公共/行政管理_经管营销_专业资料。运用新智猪博弈理论在市场转型...“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽, 大猪吃...
20任务二十-智猪博弈理论
智猪博弈理论 1页 免费 向传统智猪博弈理论发起挑... 9页 免费 信息经济学...智猪博弈理论“智猪博弈”是假设猪圈里有一头大猪、一头小猪。猪圈的一头有 ...
智猪博弈论与纳什均衡
智猪博弈理论 介绍 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名...·斯密的“看不见的手”的 原理提出挑战:按照斯密的理论,在市场经济中,每一...
运筹学智猪博弈论文
运筹学智猪博弈论文_教育学/心理学_人文社科_专业资料。运筹学 博弈论 论文运筹学期中论文——“智猪博弈”问题及其在 中小企业发展中的应用 选题背景: 选题背景...
墨菲定理
智猪博弈理论 坠机理论 自来水哲学 煮蛙效应 自吃...无论是怎样的困难和挑战,我们总能找到 一种办法或...3) 发挥警示职能,变被动管理为主动管理 传统安全...
坠机理论
智猪博弈理论 坠机理论 自来水哲学 煮蛙效应 自吃幼崽效应 L 雷尼尔效应 零和博弈 柯维定理 卡尔岑定理 雷尼尔效应 自我参照效应 自我选择效应 帐篷理论 最高...
懒蚂蚁效应
零和博弈 Z 智猪博弈理论 坠机理论 自来水哲学 煮蛙效应 自吃幼崽效应 自我...基于此,企业传统的“依据候选人的知识技能以 及经验背景”进行招聘甑选已经不能...
更多相关标签:
智猪博弈理论 | 冰桶挑战是谁发起的 | 冰桶挑战谁发起的 | 冰桶挑战发起人 | 假人挑战是谁发起的 | 冰桶挑战的发起人 | 炫舞打工宠物发起挑战 | 对打工的宠物发起挑战 |