角力中的平衡点,信息对称下的博弈

作者: 美高梅游戏官网娱乐  发布:2019-12-21

今年五月,美国新泽西州发生了一起交通事故,其中有两人死亡。这起事故吸引了全世界经济学家的眼光,倒不是因为它有着多么大的经济影响,而是因为去世的两人,正是1994年诺贝尔经济学奖的获得者之一数学家约翰·纳什与他的妻子阿莉西亚·纳什。一代大师意外去世,自然令人悲痛。

**博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。**

博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。

博弈论已经成为经济学的标准分析工具之一。在金融学证券学、生物学、经济学[1]、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。

纳什是一名数学家,不是一名经济学家,为何他能获得诺贝尔经济学奖?我们来看看当年挪威皇家科学院为纳什而写的颁奖词:“纳什首次区分了合作博弈与非合作博弈,合作博弈允许结盟,而非合作博弈不允许。纳什发展了一种非合作博弈上的均衡概念,后来它被称为纳什均衡。”这一段解释似乎更加把人绕糊涂了。什么是博弈?什么是均衡?这些算是数学吗,又与经济学有什么关系?

这周主要介绍一下在信息对称条件下的博弈论,以及在生活中的应用。

万事皆博弈

博弈论翻译自英语的“game theory”,原意是“游戏的理论”。在某种意义上,可以说博弈论就是对于游戏的研究。“石头剪子布”可能是大家最熟悉的游戏。最简单的版本只有两个玩家,两人分别选择石头、剪子、布中的一种手势,然后按照“石头砸剪子、剪子剪布、布包石头”的规则来判断这一局谁胜谁负。一般意义上的博弈也非常类似,其中有数位参与者,每人可以自由选择一定的行动,最后根据给定的规则判定每个人的得失。

博弈的种类繁多,从简单的“石头剪子布”到复杂的象棋,都算是博弈。广义地说,社会上很多经济活动,小至选择商品和购买保险,大至公司并购和货币政策,都可以抽象为某种博弈。这就是经济学家对博弈论感兴趣的原因。

但类似象棋这样的博弈,需要每个玩家反复做多次选择,研究的难度相当大。饭要一口一口吃,在博弈论发展的早期,数学家考虑的都是像“石头剪子布”那样,所有玩家都知道同样的信息,而每个玩家只需要同时做一次选择就能决出确定结果的博弈。在这种博弈中,玩家有多种策略的选择。比如一直出石头,或者各以三分之一的概率选择三种手势,这都是可行的策略。

图片 1稳定的选择

我们先来举个例子。假设你很喜欢粤菜,而你的朋友喜欢西餐。今天晚上你们打算出去就餐。如果分开吃的话,两人都会觉得独自用餐索然无味。如果一起吃粤菜,两位会更高兴,但你会更高兴一些;如果吃的是西餐,则是你的朋友更高兴。现在两人分别从家里出发,应该选择什么策略呢?

这是一个典型的非零和博弈。在这场博弈中,最好的情况当然是两人一起用餐。但如果我们用零和游戏中最优策略的方法分析的话,每个人应该采取的策略显然是去吃自己喜爱的餐点,这种“最优策略”带来的结局却是最糟糕的。矛盾在于,在零和游戏中,因为玩家的收益就是对方的损失,所以玩家清楚对方的目的就是减少玩家本人的收益。但现在双方的得失并不矛盾,玩家无法得悉对方的想法,之前的“最优策略”自然无效。我们需要一个更好的概念来涵括对方的想法。

假设我们知道对方希望采取的策略,比如说你朋友希望迁就你吃粤菜,那么,你最好的选择当然是吃粤菜。我们将这种情况记作,前者是你采取的策略,后者是对手采取的策略。在这种情况下,每个人都没有动力改变自己的策略,包括你朋友,即使他比较喜欢吃西餐,但在你不改变策略的前提下,他如果决定吃西餐也只能一个人吃,还不如跟你一起吃没那么喜欢的中餐。这种情况就是这个博弈的一个纳什均衡。

更一般地说,在某个博弈中,假设每位玩家都已经选定了自己的策略,并且每个人都知道各自的策略。这时,如果每位玩家在别人不会改变策略的假设下,即使改变自己的策略,也不会带来更高的收益,那么这种情况就称为一个纳什均衡。纳什均衡是一个神奇的稳定点。在一切不是纳什均衡的情况中,都会有玩家希望改变策略来打破现况。而在纳什均衡中,每位玩家的策略都是当前情况下的最优策略,他们都没有动力改变自己的策略,博弈于是达到了平衡点。

因为纳什均衡的概念能延伸到非零和博弈上,而现实生活中的博弈往往是非零和的,所以纳什均衡在经济学上有着更重要的意义。

一个博弈可能有不只一个纳什均衡。在之前你与朋友的博弈中就有两个纳什均衡点,和。这时,如何选择均衡点呢?如果你的朋友对西餐非常执着的话,他可能会以一些代价(比如说送你两罐啤酒)来换取你同意去吃西餐,而你也可以跟他讨价还价,比如除了啤酒还跟他要点花生。在拥有多个纳什均衡的博弈中,双方如何通过协商选取某个均衡的问题,就叫讨价还价问题。纳什同样解决了这个问题。

纳什提出纳什均衡的概念时,刚刚开始在普林斯顿大学攻读博士。他同时证明了每个博弈都存在至少一个纳什均衡。他将博弈论作为博士论文题目,以这些研究为基础,在一年半内就完成了博士学业,这无论在什么时代都是极高的速度,也能说明纳什的天才之处。

在讲博弈论之前,就不得不先提一下帕累托最优(或者叫帕累托效率),人类社会的高度发展离不开人与人之间的高度协作,帕累托最优往往更适用在内部范围探讨,在双方建立充分的信任的基础之上的,这种“公平与效率的理想王国”,谈的是合作,但促进人类发展的不光只有协作,还有竞争。

操纵均衡

纳什均衡能够用于解释很多经济现象,比如“公地悲剧”,也就是公共物品往往会被无节制地使用殆尽的现象。比如污染的河水和由于放牧而沙漠化的草地,这往往是公地悲剧的体现。如果某项公共资源的使用所导致的代价会平均分摊到每个人头上,那么在这个博弈中,无论在哪一个纳什均衡点上,公共资源都会被过度消耗,每个人的收益反而不如对资源有节制的使用。空气污染、全球暖化、人口问题,这些都是公地悲剧的体现。

但除了解释以外,纳什均衡也能用作解决问题的参考工具。通过不同的经济手段改变博弈中每个人的收益,就可以将均衡点引导到对所有人更加有利的情况。比如在公地悲剧中,如果按照每个人消耗的资源来征收费用,再用这些收入帮助公共资源的恢复,这就相当于将使用资源的代价从平摊变成与使用量挂钩,均衡点就会改变,人们的最佳策略不再是竭泽而渔,而是按需取用。通过对纳什均衡的研究,我们能设计出更好的制度,保证即使是自私的每个人,在均衡点的引导之下,都能作出有益于社会福祉的行动。

除此之外,纳什均衡在经济学上还有许多应用。在各种投标与拍卖中,拍卖一方希望以尽可能高的价格将商品拍卖出去,而竞拍一方往往有多位参与者,他们希望能以尽量低的价格拍得商品,而双方都不知道各自的底牌。他们只能通过叫价来相互试探。这时,如何设计拍卖的规则,使得拍卖能高效完成而双方的收益都最大,这就是所谓“拍卖理论”研究的问题。拍卖可以很复杂,比如说对各地电视频道的拍卖,竞拍一方可能需要获得多个地区相同频道,才能获得相当的收益。但利用纳什均衡,即使对于复杂的拍卖,很多时候我们仍能设计出对应的拍卖机制,保证拍卖的成功。

但也有一些经济现象不能用纳什均衡来解释,比如说银行挤兑。这是因为在建立模型时,我们假定人们是无限理性的,只会以最优的策略最大化自己的收益,这是对现实的简化,实际上人们的行为要复杂得多,不一定总是理性的。比如说,几个人报1到100之间的数字,最靠近报出的所有数字的平均值的一半的人获胜。如果所有参加者都是无限理性的话,那么每个人都会报1,但实验告诉我们上不是这样。人们在实际生活中的选择往往与纳什均衡很接近,但有时也会有一定的偏差。对这种偏差的研究,是目前行为经济学的研究方向之一,可以视为对以纳什均衡为代表的传统博弈论的一种良好补充。

虽然纳什教授不幸逝世,但他提出的纳什均衡已经深入博弈论与经济学研究的核心,无数学者,仍会沿着他开创的道路前行。所谓科学,就是来自这样的日积月累与前赴后继。

亚当斯密是古典经济学的创立者之一,他主张自由贸易,在市场这只无形的手的调节下,个体追求私利的行为,是在促进社会的财富增长。

关于

本文获得作者方弦授权看法,并已发表于北京日报,未经正式许可禁止转载

约翰·纳什是一位经济学家,同时还是博弈论的创始人,说这些可能大家还都有点儿陌生,《美丽心灵》的主人公的原型就是他。他的理论在后来被成为“纳什均衡”。

一张不要轻易尝试的猜拳进阶指南图

图片出处:

纳什均衡简单来说,就是一种博弈的稳定结果,谁单方改变策略,谁就会损失。

生活中到处都是“纳什均衡”的例子:比如我国成立初期,大家一起吃大锅饭,于是所有人在没有有效监督的情况下,偷懒就成了农民的“最优策略”,这就形成了一个”坏的纳什均衡“。

解决这个的问题的方法,就是通过制度的改变,“包产到户”,让你偷懒分不到别人的劳动成果,农民的“最优策略“就是辛勤地劳动。

经济学课上讲到了,每个人都会追求个人利益的最大化,反过来也可以说每个人在追求个人损失最小化,而这个损失最小化的行为,往往就会形成“坏的纳什均衡”。

个人认为,当预期结果在我可控的情况下,人会追求个人利益的最大化,但是,在个人不可控的情况下,比如与不充分信任的人合作时,有时就会更倾向于追求个人损失最小化。

下面,我们通过一个例子了解一下纳什均衡的两方博弈:

在零售行业中,很多商家相互之间不断的竞争博弈,有时大打价格战,就好比是七伤拳,伤人又伤己,这个时候,一些巨头就会坐下来谈判,制定协议,建立信任,这个时候,托斯拉就应运而生。

托拉斯,英文trust的音译,垄断组织的一种高级形式,一些巨头通过建立一种对他们有利的纳什均衡,从而在市场没有出现可替代品之前,形成一种短期的利润最大化。

这个时候,政府可能就要出来干预了,说这种赤裸裸的垄断是不可以的,于是他出台《反垄断法》,打破这种价格联盟。

我们学过经济学的人都知道需求曲线,没有什么需求是刚需,当你通过垄断涨价,必需品就会成为奢侈品,薛老师在专栏中说过,即使是垄断,也会由市场最终作出调节,让最终的价格趋于正常化,但市场的反应时间并不总是那么迅速,又价格上涨出现的需求降低并不是瞬间的,替代品的出现也不是一朝一夕的,在这个过渡期,商家就可以赚的盆满钵满,而政府在观察到这个现象后,如果想改变这个纳什均衡的方向,就必须制定相应的策略,但我们知道,凡政策必遭遇对策,现实与预期往往有很大的差距,如何与利益集团进行博弈,也成了政府的必修课之一。

政府希望通过制定政策,形成对消费者有利的纳什均衡,而商家之间的联盟,就是跟竞争对手之间,形成一种有利于自身的纳什均衡。

看完纳什均衡,你有什么感受,有没有找到之间生活工作中对应的例子呢?


接着我们再来讲一下著名的囚徒困境

两个共犯被抓住,并进行审讯,在没有提前沟通的情况下,他们面临下面的选择。

图片 2

如果我们光看这幅图,根据帕累托最优,他们的最佳方案就是两人都选择沉默,这样两人都只需要服役1年。

审讯者和囚徒之间,审讯者会刻意制造信息不对称,甲乙双方也没有做好沟通,并且没有绝对的信任,怕对方会出卖他,无法商量出这个合作解的帕累托最优。这个时候,这个纳什均衡就会倒向,两人同时服刑8年。

在这个博弈中,我们可以看到两点:

1、对于单个囚徒来说,背叛的诱惑(坦白)大于合作的报酬(判一年)

2、而受骗需要支付15年,大于背叛的惩罚8年

都背叛,是这个囚徒困境中唯一稳定的纳什均衡。

如果两个囚徒是隶属于一个黑社会组织—意大利黑手党,那么这个黑帮就要想办法破局,从制度上创造最利于自己的结果,也就是从上面两点出发。

本文由美高梅手机登录网站发布于美高梅游戏官网娱乐,转载请注明出处:角力中的平衡点,信息对称下的博弈

关键词:

上一篇:是为了庆祝日月合璧
下一篇:没有了