什么是纳什均衡(纳什均衡是种什么理论)

纳什均衡——是什么决定了很多人会选择“损人不利己”?

今天,跟大家分享博弈论里的一个重要理论——纳什均衡。

先来看一个经典案例:有两名囚犯犯了重罪,分开关在牢房里。然而,检方手头的证据只够证明他们犯了一起轻罪,最多能判处一年徒刑。于是检方告诉两人:如果有一人招供,另一人保持沉默,招供者可免于起诉,而沉默者将会在牢房里待上20年。如果两人都招供,则同时服刑5年。要是两人均保持沉默,则同时服刑1年。

纳什均衡——是什么决定了很多人会选择“损人不利己”?

很显然,“双方都保持沉默”是最优策略,这样两人都只需服刑1年。然而,真实的情况是,这两名囚犯是被分开关的,双方不得串供。这样一来,他们的选择还是“沉默”吗?

不如设想一下自己就是其中一名囚犯,你不知道对方会做出什么样的选择。如果对方招供,那你肯定也得招供,否则将要服刑20年;如果对方沉默,你也沉默的话,将服刑1年,但如果你招供的话,你可以被释放。从利己的角度出发,不管对方怎么做,招供对你来说都是最有利的。两个人动同样的脑筋,最后的结果就是两个人都选择了招供,都被判了5年的刑期。

这就是著名的“囚徒困境”。每个人都选对自己最有利的,但最终获得一个对双方都最差的结果,这反应了个人理性和集体理性的矛盾。

为什么会出现这一结果?是什么原因使得双方最后都选择了“损人不利己”呢?这就要说到美国数学家约翰·纳什,和他著名的“纳什均衡”了。

亚当·斯密认为,在市场经济中,个体追求私利的行为,会促进集体利益的最大化。但纳什却发现:基于理性人的假设,从利己目的出发,结果却是损人不利己,既不利己也不利他。

比如上面的例子,谁会在乎两人的利益最大化,他们只在乎一件事:如果对方招供,而自己沉默,那自己就完了。这个风险承受不起,博弈到最后,就是双方都招供。

而且,一旦“都招供”的结果形成,会非常稳定。什么意思呢?你想改变现状,决定沉默,则将服刑20年;如果对方单方面沉默,也会服刑20年。谁也无法单方改变现状。因此,在这个“制度设计”下,“都招供”就成了一个稳定的“纳什均衡”,虽然它是一个“坏的均衡”。

因此,简单来说,纳什均衡就是一种博弈的稳定结果,谁单方改变策略,谁就会损失。

那么,有没有可能把“坏的均衡”变成“好的均衡”呢?即从“不合作”到“合作”?有,那就是改变“制度设计”。

举个例子:假设有A、B两个人,如果A和B合作,则每人赚10000元;如果一方合作、另一方不合作,那合作的那方就被人骗了,赔5000元,而不合作的那方将分享别人的成果赚2000元;如果都不合作,则不赚不赔。从利己的角度出发,“都不合作”则是坏的纳什均衡。

纳什均衡——是什么决定了很多人会选择“损人不利己”?

如果在合作前签署违约条款呢?不合作的那方,赔偿对方5000元。这样一来,不合作的一方将从先前的赚2000元,到赔3000元;而合作的一方则从赔5000元,都不赚不赔。这个时候,“共同合作”就成为新的纳什均衡,一个好的均衡。

纳什均衡——是什么决定了很多人会选择“损人不利己”?

从这里我们就可以体会到制度的意义:一个制度其实就是某种博弈规则,它不仅影响人的行为,还决定着什么样的纳什均衡会出现。

在刚才这个例子当中,我们可以设想这就是人民公社制度。“大锅饭”的理想是共同富裕,但在这个制度设计下,不干活也能吃到饭,偷懒就成了大家的“最优策略”,最终形成所有人都不干活的“坏的均衡”。怎么办呢?“包产到户”解决了这个问题。偷懒,分不到别人的劳动成果,大家的“最优策略”就变成了勤奋,最终形成“好的均衡”。

知道了纳什均衡和制度的关系,我们再去审视身边的各种游戏规则,就会发现,

在不同的“制度设计”下,有“好的均衡”,也有“坏的均衡”。

比如:价格大战。垄断商们都不降价,收益最大。但如果一家悄悄降价,就会抢占巨大利益。所以,降价是垄断商们的“最优策略”,导致利润微薄的“坏的均衡”。所以,垄断商们通过“制度设计”,组成“托拉斯”,形成价格同盟,走向“好的均衡”。政府接着通过“制度设计”,出台《反托拉斯》法,打破价格同盟,逼着垄断商们走向“坏的均衡”。

再拿环保问题举例,如果没有相关的惩罚机制,每个企业都会做对自己最有利的事情,只管企业盈利,随意偷排污染物,最后的结局对各方都是最坏的。同样通过制度设计,政府会引导企业往“都关注环保”的好的均衡。

还有在企业管理上,如果没有分工明确、奖惩分明,最后会导致人浮于事、相互推诿、大家都混日子的坏的均衡,但有了制度约束和激励,大家会争相努力、相互帮助和合作,达成好的均衡。

这样的例子还有很多,我们身边很多事,如果大家从利己主义出发,可能会得到坏结果,但换个思维,也可以通过规则重新设计,达成好的均衡。

总结:

基于理性人的假设(从利己目的出发),纳什均衡是研究人与人互动情况下什么样的结果最可能出现,这个最可能出现的结果就称为“纳什均衡”。并且,这个结果非常稳定,谁单方改变策略,谁就会损失。

不同的游戏规则,也就是不同的制度下,决定了什么样的纳什均衡会出现,有“好的均衡”,也有“坏的均衡”,关键是“制度设计”。同时,纳什均衡也告诉我们,要协商、要合作,才能使双方利益最大化~

好了,今天的分享到这里就结束啦~更多内容请欢迎关注“好买商学院”微信号,进入底部“好好理财”菜单,欢迎来到经济学的游乐园,还有更多投资知识和理财达人等着您!简单有趣的内容,你一定会爱上它~

​主动管理,十年投研,配置全球;立即下载掌上基金,体验好买特色产品牛基宝。