本站介绍
联系我们
加入收藏
今天是:     欢迎易迈会员免费发布求职招聘信息!  [kf01  2007年8月13日]            如何增加会员的点券  [kf01  2007年5月31日]            只需98元就可以成为易迈VIP会员,赶快行动把.  [KF01  2008年4月2日]            欢迎免费订阅《每日管理》电子期刊!  [易迈  2006年10月23日]            欢迎广大认证会员加入易迈学习交友QQ群!  [rtb  2006年8月7日]        
您现在的位置:易迈管理学习网 >>每日管理
 
博弈论研究的是什么?
 
更多管理词汇
普通文章 创新型人力资本
普通文章 人才派遣
普通文章 科技人才
普通文章 潜意识广告
普通文章 媒介策略
普通文章 生产决策
普通文章 产品质量责任
普通文章 工序质量
普通文章 定岗定编
普通文章 人才危机管理
普通文章 科技人力资源
普通文章 政治风险管理
普通文章 人力资源配置力
普通文章 潜人才
普通文章 独立董事
 
普通文章 企业家精神
普通文章 狼性文化
普通文章 二八原则
普通文章 蘑菇定律
普通文章 一分钟管理
普通文章 看板管理
普通文章 蓝海战略
普通文章 资产负债表
普通文章 核心竞争力
普通文章 例外原则
   
作者:未知    文章来源:未知    点击数:    更新时间:2008-7-21  【字体:
 
物种群中,小气鬼或傻瓜也难以逞强。
生物学家道金斯对三种策略的博弈进行了计算机模拟。开始模拟时,傻瓜占大多数,小气鬼占少数,骗子也属于少数,与小气鬼的比例相仿。骗子对傻瓜进行无情的剥削先在傻瓜种群中引发了剧烈的崩溃。骗子的激增随着最后一个傻瓜的死去而达到高峰。这时,骗子还要应付小气鬼。在傻瓜激剧减少时,小气鬼在日益取得优势的骗子的打击下也缓慢地减少,但仍能勉强地维持下去。在最后一个傻瓜死去之后,骗子不再能够跟以前一样那么随心所欲地进行剥削。小气鬼在抗拒骗子剥削的情况下开始缓慢地增加,并逐渐取得稳步上升的势头。接着小气鬼突然激增,骗子从此处于劣势并逐渐接近灭绝的边缘。由于处于少数派的有利地位同时因受到小气鬼怀恨的机会相对地减少,骗子这时得以苟延残喘。不过,骗子的覆灭是不可挽回的。它们最终慢慢地相继死去,留下小气鬼独占整个种群。
根据以上模型,只要一个骗子,利他主义的“傻瓜”的存在,将带来组织内骗子的繁荣和组织的覆灭。小气鬼策略是组织的稳定策略,它的含意“互惠”,是相互报答和感恩,因此也可以说是互惠利他或互惠自私,就象市场中的那种情况一样。假如大家把相互清除寄生虫作为“宪法”固定下来,那么,可以说,这个组织就有一个道德共识。
编者视点:“傻子”在这个世界一定是无法生存的,因为“傻子”代表“利他”,而“利他”必须“损己”,在一个资源稀缺的世界,任何“利他”行为都是以“损己”为代价的,可以说“利他”的机会成本就是“损己”,而“损己”的极致便是让出你的生存空间给别人。所以,最后的结局,一定是“利他”的“傻子”逐渐地消失,而“骗子”在“傻子”消失之后由于没有了其生存的依托也将自然地走向消失。最后这个世界的生物种群就构成了一个由“小气鬼”所组成的“食物链”——现实存在的世界。当然,“傻子”和“骗子”并非完全消失,即便“小气鬼”有时也会偶尔地充当一回“傻子”和“骗子”,比如说,有人对你说“你应该‘利他’”,那么你一定是碰到了一位“骗子”,他无非是想占你的便宜而已,如果你信了他的话,你也就充当了一回“傻子”。但由于小气鬼把握的原则是“互惠”,他给出的“无偿”机会只有一次,不会有第二次,这就迫使其对手也不得不采取同样的交易规则,否则,交易就会中断,不可能延续。于是,这社会(或市场)就出现了走向公正、有序的转机。

合 作 的 进 化

北京天则经济研究所第139次双周学术讨论会由吴坚忠博士作主题发言,研讨了美国学者艾克斯罗德提出的《合作的进化》问题,艾克斯罗德通过对多人多次重复博弈的对策研究,指出在博弈中产生合作的必要条件和获胜策略的主要特征。当策略群体是按各种策略的得分进行淘汰和进化时,艾克斯罗德发现,群体以一种不可逆转的方式向合作的方向进化,也就是说,群体的合作性随进化过程越来越大。与会学者在主题发言之后展开了热烈的讨论。以下是这次学术讨论会的综合观点。

 

一、 博弈中最优策略的产生

艾克斯罗德在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。


社会实践中有很多合作的问题。比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。


A和B各表示一个人,他们的选择是完全无差异的。选择C代表合作,选择D代表不合作。如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。


显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。如果一方选C,一方选D,总体得5分。如果两人都选D,总体得2分。


对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于A来说,当对方选C,他选D得5分,选C只得3分;当对方选D,他选D得1分,选C得零分。因此,无论对方选C或D,对A来说,选D都得分最多。这是A单方面的优超策略。而当两个优超策略相遇,即A,B都选D时,结果是各得1分。这个结果在矩阵中并非最优。困境就在于,每个人采取各自的优超策略时,得出的解是稳定的,但不是帕累托最优的,这个结果体现了个体理性与群体理性的矛盾。在数学上,这个一次性决策的矩阵没有最优解。


如果博弈进行多次,只要对策者知道博弈次数,他们在最后一次肯定采取互相背叛的策略。既然如此,前面的每一次也就没有合作的必要,因此,在次数已知的多次博弈中,对策者没有一次会合作。


如果博弈在多人间进行,而且次数未知,对策者就会意识到,当持续地采取合作并达成默契时,对策者就能持续地各得3分,但如果持续地不合作的话,每个人就永远得1分。这样,合作的动机就显现出来。多次对局下,未来的收益应比现在的收益多一个折现率W,W越大,表示未来的收益越重要。在多人对策持续进行下去,且W比较大,即未来充分重要时,最优的策略是与别人采取的策略有关的。假设某人的策略是,第一次合作,以后只要对方不合作一次,他就永不合作。对这种对策者,当然合作下去是上策。假如有的人不管对方采取什么策略,他总是合作,那么总是对他采取不合作的策略得分最多。对于总是不合作的人,也只能采取不合作的策略。


艾克斯罗德做了一个实验,邀请多人来参加游戏,得分规则与前面的矩阵相同,什么时候结束游戏是未知的。他要求每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两博弈,以找出什么样的策略得分最高。


第一轮游戏有14个程序参加,再加上艾克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作),运转了300次。结果得分最高的程序是加拿大学者罗伯布写的"一报还一报"(tit for tat)。这个程序的特点是,第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。艾克斯罗德还发现,得分排在前面的程序有三个特点:第一,从不首先背叛,即"善良的";第二,对于对方的背叛行为一定要报复,不能总是合作,即"可激怒的";第三,不能人家一次背叛,你就没完没了的报复,以后人家只要改为合作,你也要合作,即"宽容性"。


为了进一步验证上述结论,艾氏决定邀请更多的人再做一次游戏,并把第一次的结果公开发表。第二次征集到了62个程序,加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是"一报还一报"。艾氏总结这次游戏的结论是:第一,"一报还一报"仍是最优策略。第二,前面提到的三个特点仍然有效,因为63人中的前15名里,只有第8名的哈灵顿程序是"不善良的",后15名中,只有1个总是合作的是"善良的"。可激怒性和宽容性也得到了证明。此外,好的策略还必须具有的一个特点是"清晰性",能让对方在三、五步对局内辨识出来,太复杂的对策不见得好。"一报还一报"就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。

 

二、 合作的进行过程及规律

"一报还一报"的策略在静态的群体中得到了很好的分数,那么,在一个动态的进化的群体中,这种合作者能否产生、发展、生存下去呢?群体是会向合作的方向进化,还是向不合作的方向进化?如果大家开始都不合作,能否在进化过程中产生合作?为了回答这些疑问,艾氏用生态学的原理来分析合作的进化过程。


假设对策者所组成的策略群体是一代一代进化下去的,进化的规则包括:一,试错。人们在对待周围环境时,起初不知道该怎么做,于是就试试这个,试试那个,哪个结果好就照哪个去做。第二,遗传。一个人如果合作性好,他的后代的合作基因就多。第三,学习。比赛过程就是对策者相互学习的过程,"一报还一报"的策略好,有的人就愿意学。按这样的思路,艾氏设计了一个实验,假设63个对策者中,谁在第一轮中的得分高,他在第二轮的群体中所占比例就越高,而且是他的得分的正函数。这样,群体的结构就会在进化过程中改变,由此可以看出群体是向什么方向进化的。


实验结果很有趣。"一报还一报"原来在群体中占1/63,经过1000代的进化,结构稳定下来时,它占了24%。另外,有一些程序在进化过程中消失了。其中有一个值得研究的程序,即原来前15名中唯一的那个"不善良的"哈灵顿程序,它的对策方案是,首先合作,当发现对方一直在合作,它就突然来个不合作,如果对方立刻报复它,它就恢复合作,如果对方仍然合作,它就继续背叛。这个程序一开始发展很快,但等到除了"一报还一报"之外的其它程序开始消失时,它就开始下降了。因此,以合作系数来测量,群体是越来越合作的。


进化实验揭示了一个哲理:一个策略的成功应该以对方的成功为基础。"一报还一报"在两个人对策时,得分不可能超过对方,最多打个平手,但它的总分最高。它赖以生存的基础是很牢固的,因为它让对方得到了高分。哈灵顿程序就不是这样

上一页  [1] [2] [3] [4] 下一页

 
     
  发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口  
::相关文章::
博弈论
::本文评论::
 
  • 上一篇文章:

  • 下一篇文章: 没有了
  •  
       


    Copyright 2007 易迈管理学习网
    辽ICP备05001647号