博弈论的发展:一段回顾

前言

《The Journal of Economic Perspectives》16年秋季刊中讨论了两个专题,分别是“移民与劳动力市场(Immigration and Labor Markets)”和“博弈论领域正在发生什么?(What is Happening in Game Theory?)”。在第二个专题中,耶鲁大学经济系教授Larry Samuelson发表了名为“Game Theory in Economics and Beyond”的专题文章,回顾了博弈论是如何以纯数学的内容融入经济学领域并得到极大发展的一段历程,然后提及了博弈论领域目前面临的几个挑战,并在最后就博弈论的未来做了展望。

我这学期刚好修了一门博弈论,所以在这学期的Final之前,编译下这篇文章,加深自己对博弈论的理解,也希望能对国内修博弈论课程的同学有所帮助。本文将主要介绍这篇论文的第一部分,即集中梳理下博弈论这门学科的发展历程,而不会对第二部分(挑战)和第三部分(展望)做详细介绍。感兴趣的同学可以参阅原文。需要说明的是:第一,本文并没有对其涉及到的一些经典博弈模型和术语(如Cournot and Bertrand model、infinitely repeared game、Folk theorem和Signaling等)做出解释,对这些内容的理解要求一些基本的博弈论知识;第二,正文部分小标题内容为本文所取(为了方便阅读和理解),小标题后的英文对应的才是原论文中的标题内容。

正文

在上世纪60和70年代,博弈论基本是经济学学科中分离的一支。学习博弈论的人往往是那些被称作game theorists的人群,而经济学家对博弈论基本没有什么概念。但随着上世纪80、90年代经济学家在博弈论上的发展,博弈论目前已经成为经济学中标准的工具之一。这种转变明显地体现在经济学的课堂上,经济学研究生或博士生会在其第一年的核心课程(具体而言是在微观经济学的课程)中学习博弈论的基本使用。

1.博弈论的微观基础(“Aggregating Individual Behavior”)

首先需要谈及的是博弈论的建立和发展是有其微观基础的,即博弈论的基础跟经济学的基础是一致的。经济学家之所以跟其他社科学者存在差异,就在于其秉持的方法论上的个人主义(methodological individualism)这一信念,即对社会现象的解释是建立在对人体行为的研究上的。经济学家依据这一信念建立的模型有着两大原则:第一个原则跟人体行为有关,即经济学家假设人类存在持续且稳定的偏好(consistent and stable preferences);而第二个原则则是利用个人行为的加总来研究复杂的社会现象。

而博弈论也是建立在个体行为的基础之上,即它同样假设个体存在持续且稳定的偏好,但它使用另外一种视角来理解“使用个体行为的加总来检验社会现象”这一模型。简而言之,博弈论跟微观经济学有一样的假设前提,但会在此假设基础上通过另外一种途径来研究社会现象。

2.古典的博弈论理论(“Classical Game Theory”)

在古典的视角看来,博弈论就是对感兴趣的研究情景的一种描述,而不是我们今天所用说的是一种近似(approximation)。古典的博弈论理论使得这一学科能够自给自足的(self-contained)。这也意味着在古典的视角下,博弈论不需要担心决策者(players)是不是会在游戏中交流,合作或相互发送信号(signal)。而即使发生了上述情况,在古典视角的认知中,这些情况也将会被包含在决策者的行动之中,因而其对博弈的分析并不会受到影响。

其中的一个例子便是Cournot和Bertrand模型。在不完全竞争情况下,Cournot模型假定企业可以选择他们的产出数量,而产品的市场价格由市场上所有产出数量(而非一家企业的产出数量)来决定;而后来Bertrand在其构建的模型中表示,市场上的企业是可以选择其产品价格的,而非由市场的总体产出来决定价格。那我们应该如何在这两个模型中做出选择?在古典视角的下,这一问题是很好解决的。他们认为,如果企业可以选择产品数量,那么就用Cournot模型;如果企业可以现在产品价格,那么就用Bertrand模型;而如果数量和价格都可以选择,我们则需要一个不一样的新模型。

而当我们构建了适当的模型后,在理性人决策者的基础上,均衡便会被反映出来。比如在Cournot模型中,我们很容易就会发现存在纳什均衡且只存在一个纳什均衡。然而,实际上这一模型会存在许多纳什均衡,而我们也需要考虑更多的情况。比如在repeated game中,一种可能的均衡是上文所提及的在one-shot game中的纳什均衡;但在企业足够耐心的情况下,最后可能会导致企业会相互合作的结局,企业会合作以设置垄断价格,并在每一期中划分市场利润。事实上,正如fork theorem所指出的,对于足够耐心的决策者而言,实际上任何结果都会是均衡。而在另外一些情况中,如企业面临的是非线性的需求函数,或者面临不确定性(uncertainty)——如信号模型(signaling models)时,多均衡的结局都会产生。

3.均衡的精炼(“Equilibrium Refinements”)

面对多均衡这一问题,博弈论中开始出现一支关于均衡的精炼(refinement)的文献。在这一支文献中,经济学家试图通过设置各种精炼的标准,对纳什均衡的产生做出进一步限制,由此来“提炼”纳什均衡。然而这一试图解决问题的工具也存在许多问题,如作者指出,在不管增长的精炼理论之中,新的理论的产生给后来者提供了批评他们弱点的机会,而后来者也是如此,仅仅是给下一轮的新理论提供了原材料,并如此反复循环。

但在许多经济学家都在纳什均衡精炼的设置条件上绞尽脑汁的时候,经济学家如Bernheim(1984)和Pearce(1984)仅仅就“理性及其共同知识”(common knowledge of nationlity)这一假设基础上(而不是通过添加其他精炼限制)做出了一连串的突破。还是以Cournot模型为例子,如果我们假定企业是理性决策者,企业的竞争对手也是理性决策者,而且企业知道他的对手是理性的,且企业的对手知道“企业知道他的对手是理性”这一事实(并如此反复…),我们可以一步步消除掉(eliminate)企业们不可能做出的产量决策,并在此反复消除之下达到最终的均衡产量。虽然如此,这一进展在其他许多的博弈(及其精炼)中并不适用。matching pennies game就是一个明显的例子,我们知道,这个游戏最终的均衡是一个(1/2, 1/2)的混合策略均衡,而利用common knowledge of nationlity并不能消除这个博弈中决策者的任一决策。

4.工具主义观点下的博弈论(“An Instrumental View of Game Theory”)

作为回应,古典的博弈论便让位于工具视角下的博弈论理论。在这种视角下,博弈论不再是关于决策者相互博弈的描述,而是变成对人们研究这些博弈过程的有用的模型工具。还是以Cournot和Bertrand模型为例,在这种视角下,我们可以看出企业的行动不再取决于我们所想企业会怎么做,而是取决于哪个模型对我们分析问题较有帮助。如果我们的模型设定是“即使是在只有两个企业的市场上,竞争也足够使得他们的产品价格等于边际成本”,那么选择Bertrand模型更为合适;而在另外一种市场设定中,即当我们认为“新进入的企业会降低现存企业的利润”时,选择Cournot模型会更为合适。

一个工具主义下博弈理论的运用即是,一个更符合现实情况的模型并不一定意味着这是一个更好的模型(能帮助人们更好地理解社会现实的模型才是更好的模型)。也就是说,在工具主义的观点看来,即使不会使得模型更为复杂,更为现实也不是一个模型必要的构建条件。举例而言,无限期的重复博弈(infinitely repeated games)很明显就是一个不现实的模型,一个更为现实的模型是有限期的重复博弈(finitely repeated games)。但是在这里,经济学家关心的是在无限期情况下人们可能采取的行动,而不是关心的人类的死亡率表(human mortality table)。一个很明显的论点即是,在无限期和有限期的情况下,企业可能采取的行为完全是不一样的,在无限期下会导致的垄断的均衡结局在有限期重复博弈下将不复存在。

这种工具主义的观点同时也复杂化了博弈论。以简单的囚徒困境为例,我们知道,在古典视角下,囚徒困境中最后的均衡是双方都会在面临“合作”和“背叛”的决策下选择背叛;但在工具主义的视角下,这一问题就复杂许多。首先,博弈双方的“合作”可能意味着是垄断市场上的合作,也可能是核武器协议中的信号;而“背叛”则可能是涌进市场的新企业对市场总产出的影响,也可能意味着安装反弹道导弹这一抉择。其次,效用的测量将变得困难,我们面临的效用测量可能并不是指的测量诸如企业利润或者数量。于是,问“决策者会不会背叛”这个问题,就等同于在问“对于囚徒困境,我们是否选择了合适的方式去近似他们的博弈了?”,而这可以变为一个很难回答的问题。

5.演化博弈(“Evolutionary Game Theory”)

演化博弈又将博弈论从工具主义带回了经济学长久的传统之中。在经济学中,我们假设理性人会最大化自己的效用,但是我们总会问道,“人们或企业真的会最大化自己的效用吗”?对此,一个标准的回应是,人们或许并不总是最大化自己的效用,事实上,人们会根据自己已有的经验不断做出选择和调整,并由此使得自己达到更优的结果,虽然在这过程中有时人们也会进行试验和犯错。而正是由此产生的人们不断适应的过程,解决了人们最大化自己效用的问题。

演化博弈则借用了类似的理由。演化博弈并不是在说决策者将从博弈的结构中推出均衡,而是在说我们认为决策者将会跟随着博弈过程而不断累积经验。这一观点下的博弈论中使用的方法更接近于传统经济学中所使用的方法。事实上,古典的博弈模型特点之一便是在动态过程中找出均衡,而演化博弈这一视角无疑又将博弈论拉回到了这一局面。有意思的是,1838年Cournot构建Cournot模型时,就是将其结果建立在以最佳策略(best repsonse)为基础的相互调整的过程中。

最后作者提到了演化博弈所要处理的两个最基本的问题是:一是我们能从动态的过程中得到博弈的纳什均衡吗?二是这一动态过程能产出纳什均衡的精炼吗?对于前者,回答是肯定的。经济学家对此的共识是,在适当的条件下,演化博弈是可以产出纳什均衡的;而对于后者,回答则是否定的,即演化博弈并不一定能导致标准的纳什均衡精炼。

 

论文的第一部分对博弈论发展的梳理到此就结束了。在文章剩下的两部分中,作者先提及了博弈论面临的挑战,如多均衡下的选择,博弈论的应用和合作博弈方面的挑战;再谈了下自己对博弈论未来的展望,分别提及了博弈论在经济学学科之外的发展以及博弈论将来可能的发展之地(如在行为经济学和动态效用最大化问题上的应用)。感兴趣的同学可能参阅原文。

 

文献来源:

Samuelson, L. (2016). Game Theory in Economics and Beyond. Journal of Economic Perspectives, 30(4), 107-30.

 

 

欢迎各位批评指正。

联系我

Share

发表评论

电子邮件地址不会被公开。 必填项已用*标注