保罗·米尔格罗姆对当代经济学的贡献

2020年10月12日 18:36:23

文章发表于 2019-06-24

来源：经济学动态

保罗·米尔格罗姆（Paul R. Milgrom）

摘要：保罗·米尔格罗姆是美国当代杰出的经济学家。过去30多年间，米尔格罗姆凭借优秀理论家的深刻思想、敏锐的洞察力以及深厚的数学功底，从信息不对称和激励机制视角，开创性地拓展了拍卖、博弈、产业组织、信息经济学、委托-代理等多个经济学研究领域，为经济理论的演进做出了卓越贡献。尤为重要的是，米尔格罗姆成功地将研究成果应用于实践并得到充分验证。

关键词：米尔格罗姆拍卖信息不对称博弈激励

保罗·米尔格罗姆（Paul R. Milgrom）是美国当代杰出的经济学家，现为斯坦福大学人文与科学学院讲席教授兼经济学教授。他于1948年4月20日出生于美国密歇根州的底特律市。米尔格罗姆在少年时期就展示出对数学的浓厚兴趣，1970年以优异的成绩毕业于密歇根大学并获得数学学士学位，1974年成为美国注册精算师协会会员，1978年获斯坦福大学统计学专业硕士学位，1979年获得斯坦福大学商科哲学博士学位，其关于拍卖理论的博士论文《竞争性投标的信息结构》获得萨维奇奖（Leonard Savage Prize）。

博士毕业后直至1982年，米尔格罗姆执教于美国西北大学凯洛格管理学院管理经济学与决策科学系，先后任助理教授 (1979-1981年)、副教授 (1981-1982年)、教授 (1982-1983年)。在此期间，他深受该学院后来的诺贝尔经济学奖得主迈尔森（R.B.Myerson）、霍尔姆斯特伦（B.Holmstrom）等人影响，这些经济学家擅长定价、拍卖、金融市场与产业组织理论的研究，且将理论深深根植于实践。1983-1987年米尔格罗姆执教于耶鲁大学，先后任管理学兼经济学教授 (1983-1985年)、管理学讲席教授兼经济学教授 (1985-1987年)。1987年起返回母校斯坦福大学，任经济学系教授，1993年起任人文与科学院讲席教授兼经济学系教授至今。

优秀理论家的深刻思想、深厚的数学功底和敏锐的洞察力，使得米尔格罗姆在诸多经济学研究领域做出了开创性贡献，例如拍卖理论、市场设计、产业组织、组织理论、金融、博弈论等，并为他赢得众多荣誉。米尔格罗姆于1984年当选为经济计量学会会士；1992年当选为美国艺术和科学院院士；2006年当选为美国国家科学院院士；2013年荣任美国经济学联合会副会长。2008年荣获内默斯经济学奖内默斯经济学奖由美国西北大学颁发，1994年起每两年颁发一次。截至2018年，共计13位杰出经济学家获奖，他们分别是：戴蒙德 (P.A.Diamond, 1994)、萨金特 (T.J.Sargent, 1996)、奥曼 (R.J.Aumann, 1998)、麦克法登 (D.L.McFadden, 2000)、普雷斯科特 (E.C.Prescott, 2002)、鲁宾斯坦 (A.Rubinstein, 2004)、汉森 (L.P.Hansen, 2006)、米尔格罗姆 (P.R.Milgrom, 2008)、赫尔普曼 (E.Helpman, 2010)、阿西莫格鲁 (D.Acemoglu, 2012)、梯若尔 (J.Tirole, 2014)、布伦德尔 (R.Blundell, 2016)、克雷普斯 (D.M.Kreps, 2018)。其中，7位内默斯经济学奖得主后来获得诺贝尔经济学奖，他们分别是：麦克法登 (2000)、普雷斯科特 (2004)、奥曼 (2005)、戴蒙德 (2010)、萨金特 (2011)、汉森 (2013)、梯若尔 (2014)，其余6位内默斯经济学奖得主也有问鼎未来诺贝尔经济学奖的实力。，2013年获BBVA基金会的前沿知识奖，2014年因拍卖设计的杰出成就荣获金鹅奖（Golden Goose Award）。2007年，米尔格罗姆与威尔逊一起被汤森路透（现科睿唯安）授予“引文桂冠奖”，入选理由为“对拍卖理论与实践的贡献”。

20世纪70年代末至80年代初，经济理论发生了重大变革，完全竞争市场的一般均衡分析不能完整地解释现实生活中的一些重要经济现象，而凭借激励机制和信息不对称视角则可以有效地分析现实问题，经济理论的新进展为市场机制的运行提供了一个更为贴近现实的诠释。米尔格罗姆是经济理论新进展的代表人物之一，本文将系统地梳理和评述他对多个经济学研究领域做出的开创性贡献。

一、对拍卖理论及实际应用的贡献

（一）对拍卖理论的贡献

传统经济理论不重视价格形成的具体过程，而拍卖理论有效地诠释了市场经济中价格形成的内在机理。拍卖理论提出和诠释了经济学最基本的议题：规则明示时，信息不对称条件下的市场参与者应该以什么样的价格获取商品，即信息不对称条件下商品价格如何收敛于均衡价格。事实上，现代市场中诸多的商品、服务、财产交易等都是以拍卖方式进行的。拍卖理论因显而易见的适度假设、其他经济理论对其的滋养以及在现实中的应用，成为近40年经济学殿堂中最具影响力的理论之一。

1996年度诺贝尔奖得主维克里 (Vickrey，1961）曾从拍卖规则视角出发，开创性地探究了单个物品的四种拍卖机制：公开增价拍卖、公开降价拍卖、第一价格密封拍卖、第二价格密封拍卖。公开增价拍卖是拍卖方对拍卖品设置一个底价，众多竞拍者以底价为起始价逐次累进增价竞拍，直至没有竞拍者报以更高价格，最终最高报价者竞拍成功并支付最高报价获取竞拍物。公开增价拍卖起始于英国，为此该拍卖机制也称为英式拍卖。公开减价拍卖的竞价机制则与公开增价的竞价机制相反，拍卖方拍卖时首先报出一个相对高的起始价格，然后拍卖方按固定差价逐渐降低报价，直至某竞标者表示愿意接受当前报价并支付该价格获取拍卖品。荷兰常用该拍卖机制拍卖鲜花，因此公开减价拍卖也称荷兰式拍卖。第一密封价格拍卖是在限定的期限内，每个竞拍者独立于其他竞拍者递交拍卖方一个密封标书，拍卖方在一个具体时间邀请所有竞标者到场当众开标，竞拍者报价最高者支付最高报价获取拍卖品，因而第一价格密封拍卖被称为高价拍卖或招标拍卖。第二价格密封拍卖与第一价格密封拍卖程序一致，唯一不同的是，拍卖方当众开标后将拍卖品售予报价最高者，但支付的价格是所有报价中仅低于最高报价的第二高价，这一拍卖方式最早由维克里提出，因此也称为维克里拍卖。

维克里确立了一个基于私人价值模型的分析框架，探究了这四种拍卖机制并首次提出和实例论证了著名的收入等价定理：不同拍卖机制下同一拍卖品给拍卖方带来的期望收益相等。私人价值模型认为风险中性的竞标者有独立于其他竞标者的私人信息，即每个竞标者对拍卖品都有一个私人估值，其估值不依赖于其他竞标者的私人信息，不同竞标者对拍卖品估值不同且彼此隐匿。一言蔽之，竞标者的私人估值是独立同分布的。但是，某竞标者的私人估值独立于其他竞标者私人信息的假设与现实相悖。拍卖时，拍卖品的估值信息会通过报价被连续揭示出来，竞标者可能会推测出彼此间对拍卖品的估价，为获标必须比其他竞标者报以更高的价格。因此，竞标者对拍卖品的估值与其他竞拍者的私人信息紧密相关，竞标者的报价不仅会揭示本人的私人信息，而且会部分揭示其他竞标者的私人信息，原因在于竞标者的收益依赖于信息的私人性程度。总而言之，对拍卖方而言收益最高的拍卖一定是最大程度地揭露竞拍者私人信息的拍卖。但是，维克里私人价值模型中的拍卖品仅局限于单个物品的拍卖，没有考虑拍卖品之间的替代性和互补性。顾名思义，替代性是指不同拍卖品的效用可以相互替代，而互补性是指拍卖品组合后的效用大于单个拍卖品效用之和。例如，对移动通讯运营商而言，两个城市的无线频谱许可证组合的价值会超过每个城市单个频谱许可证的价值之和，因为客户在两个城市之间的漫游能为移动通讯运营商创造价值。为此，2017年度诺贝尔奖得主迈尔森（Myerson，1979）提出了共同价值模型，认为拍卖品对所有的竞标者具有共同价值。例如，某一矿权的实际价值对所有竞标者均相同，即具有共同价值，但价值不为人所知，直至矿产资源被开发利用。拍卖品的共同价值对每个竞标者来说是有差异的，即竞标者对拍卖品私人估值不同，原因在于竞标者获得拍卖品价值的信息不同，即信息私人性程度不同。而且，当竞标者获知他人的估值信号后会修正对拍卖品的估值。罗杰·迈尔森还进一步地拓展了维克里具体拍卖形式的研究维度，采用机制设计理论刻画了所有拍卖机制，在一系列假设条件下推导出共同价值模型的均衡结果：所有的拍卖机制给拍卖方带来的期望收益相同。迈尔森的结论适用于所有形式的拍卖，超越了维克里较为固化的具体拍卖形式研究。共同价值模型成功地揭示了竞标者在负面信息下会调整对拍卖品的估值，从而避免了“赢家诅咒”情况——赢家赢得拍卖时，赢家会降低拍卖品的估值，因为赢得拍卖表示赢家比其他竞标者的估值更高。

维克里的私人价值模型和迈尔森的共同价值模型在推导强有力的理论成果方面非常有效，但缺乏现实基础。现实中的拍卖一般同时具有私人价值信息和共同价值信息，由此，米尔格罗姆开创性地拓展了维克里和迈尔森的研究成果，其博士论文《竞争性投标的信息结构》（Milgrom，1979a）揭示，拍卖是一个非完全信息条件下的非合作博弈的纳什均衡，从而成功地解决了拍卖理论中一个长期悬而未决的难题：拍卖如何正确聚集竞标者拥有的私人信息。随后，米尔格罗姆与韦伯发表了极具影响力的题为《密封拍卖中的信息价值》一文，首次提出了具有私人价值信息和共同价值信息的附加价值模型，为拍卖理论贡献了基础性结论。附加价值模型假设竞标者对拍卖品的估值直接取决于所有竞标者的私人信息，私人信息相互关联，即不是独立同分布的。竞标者的估值信号（通常是估价）是一个与其他竞标者估值信号相关联的随机变量，这意味着如果某竞标者对拍卖品的估值发出强烈信号，其他竞拍者的估值信号也是强烈的，估值信号之间具有单调似然性：某竞标者在观察到其他竞标者的估值信息后会调整对拍卖品的评价。米尔格罗姆称这种评价为关联评价，它奠定了拍卖理论的基石。这意味着可以做出一个合理的假设：如果一个竞标者有一个高估值的信号，那么其他竞标者的估价也很可能是高的。这表明一旦引入共同价值因素，维克里的“收入等价原理”将不再成立。当越来越多的相关私人信息被揭示，拍卖模式（如升序拍卖）会产生更高的收入，因为对拍卖者而言，最高期望收益的拍卖一定是最有效地减少竞标者信息私人性程度的拍卖，附加价值模型最终得出不同拍卖机制的期望收益排序关系：公开增价拍卖≥第二价格密封拍卖≥第一价格密封拍卖=公开减价拍卖。

（二）对拍卖理论实际应用的贡献

米尔格罗姆不仅贡献了启发性和奠基性的拍卖理论文献，而且在将拍卖理论成功运用到实践的过程中也起到了关键作用。他设计了简洁且不失严谨的同步增价多轮拍卖，也称同时多轮拍卖，这一拍卖模式被美国联邦通信委员会（FCC）成功地应用于多个无线电频谱牌照的拍卖中。1993年之前，联邦通信委员会通过听证会或摇号方式分配无线电频谱牌照，但听证会非常耗时且昂贵，也缺乏授予最佳机构牌照的能力。摇号方式的优势是速度快，但显然一个随机分配的牌照会遗留许多效率方面的问题。这两种方法都没有提供给联邦通信委员会任何捕获无线电频谱牌照价值的能力。无线电频谱牌照的特征是不同牌照对每个买方的价值不同，而且对买方而言，每个牌照的价值还取决于其他牌照的价值，即不同牌照之间存在替代关系和互补关系。由此，传统拍卖机制可能出现帕累托无效，因为投标者会权衡是竞拍当前牌照还是竞拍后面几轮的牌照，以及后面几轮牌照价格的高低等一系列问题。估计错误将导致报价较低的竞拍者赢得第一轮拍卖品。因此，联邦通信委员会需要一个适合于具有潜在相互依存价值的多个牌照的拍卖设计，方便竞拍者可观察到所有牌照的竞拍图景，让竞拍者在可替代和互补的牌照之间任意竞拍，确保拍卖作为一种有效的市场激励机制，实现经济效率与收益、操作简单与合理速度的统一，释放更多的移动频谱宽带。然而，当时无论理论上还是实践中都没有恰当的拍卖设计。

米尔格罗姆的拍卖理论为联邦通信委员会提供了指导思想和拍卖设计基础。依据附加价值模型，理性的竞拍者应该揭示他对牌照评价的真实信息，这提高了对牌照估值较低的竞拍者的估价，从而增加了拍卖方的期望收益。为此，米尔格罗姆和威尔逊（Milgrom & Wilson，1993）设计了一个同步增价多轮拍卖方案。在同步增价多轮拍卖的每轮中，竞标者对一个或多个频谱牌照分别密封报价。每轮竞拍结束后，拍卖方只公布每个频谱牌照的最高竞拍价，下轮拍卖的不同频谱牌照的起始价为上轮的最高竞拍价，直至被更高的竞拍价取代。同时，提交新的报价要比目前的报价高5%～10%，但在未来的几轮竞标中竞标者也可以撤销部分或全部牌照的报价，直至所有频谱牌照都无最高报价时，所有拍卖同时结束。在这种新的拍卖机制中，所有竞标者的信息相互关联，随着拍卖品价格的递增，更多的信息被揭示，竞标者会报以更高的价格，从而确保竞标者在观察他人时不能够隐匿私人信息。在拍卖过程中，随着牌照的增价，对某一牌照报价低于最高报价的竞标者就会转向其他一些价格较低的牌照竞拍，最终使得可替代的牌照价值愈发趋同，减少了组合拍卖中的搭便车、各频段牌照拍卖不同时结束导致的合谋以及“赢者诅咒”问题，这些功能都是传统拍卖机制无法捕获的。由此，同步增价多轮拍卖成为频谱拍卖中的一个范式，已成功地应用于奥地利、丹麦、爱尔兰、荷兰、瑞士、英国等国家的无线电频谱拍卖中。

二、对组织理论和信息经济学的贡献

（一）委托-代理理论

1987年之前，权威的委托-代理理论仅关注委托人如何激励代理人的一维任务，忽略了代理人多维任务激励的研究。现实中，代理人可能将一些不可观察的努力放在可替代的多维任务上。委托人赋予单维任务更多的激励可能会导致代理人忽视其他重要任务，这种替代作用妨碍了委托人构建激励代理人努力的有效机制。同时，委托-代理理论重视绩效指标的测度，这不仅需要海量信息，而且需要先进的测评技术模型，但大量的统计数据可能对一些议题过于敏感，绩效指标的应用从而受到制约。对此，在信息不对称条件下，米尔格罗姆等经济学家的研究视角从代理人的一维任务激励扩展至非线性的多维任务激励，拓宽了委托-代理理论框架。

米尔格罗姆和霍尔姆斯特伦引入规范的数学分析研究了代理人的多维任务问题。其中，代理人连续不断地选择一个多维布朗运动的漂移（drift），这视绩效测评指标的变化过程而定。在代理人效用函数的某些假设条件下，他们论证了委托人给代理人的最佳报酬体系是一个基于绩效度量的时间集合线性函数，这样的线性报酬体系会对代理人施加一个始终如一的激励压力，导致代理人理性地选择每个维度布朗运动的常值漂移。因此，当代理人能够监测到决定他们报酬高低的绩效测评指标的逐步进展时，线性激励方案可能是最佳的。米尔格罗姆和霍尔姆斯特伦用简单的函数形式勾勒出委托-代理人之间的激励约束相容机制，创立了简单的线性激励规则，拓展了激励理论的实用性。

米尔格罗姆和霍尔姆斯特伦还进一步地扩大了激励措施的研究范围，并强调了不同激励措施之间的相互作用。激励措施不仅包括绩效工资，也包括代理人的管理权选择等其他方面，比如，选择何种程度的自由裁决权给代理人，是否给代理人一些公司资产等。其中，代理人的单一任务绩效奖励既可以针对任务奖励，也可以改变代理人执行任务的机会成本，这是理解问题的关键。当代理人可以对多个任务付出努力时，增加某个任务的奖励通常会改变代理人在其他任务上付出努力的机会成本，当任务是可替代时会增加机会成本，当任务是互补时可减少机会成本。他们还研究发现，当任务是可替代或任务绩效难以量化时，强度更低的激励甚至没有激励可能是最优的，比如仅仅支付固定工资即可。

（二）组织理论

组织所处的环境、采用的技术、累积的适合于某一任务的信息和经验发生变化时，组织机构就会发生变革。例如，大型工业企业的出现有助于国内通信市场、交通市场等方面的改善，并驱动金融、管理方式、生产技术的创新等。反之亦然，这些改善和创新促进大型企业不断扩大规模，这又将进一步引致技术、组织和管理的持续创新，它们之间是互补或协同的。

20世纪80年代末，米尔格罗姆与罗伯茨将博弈论和激励设计引入组织理论中，聚焦组织理论中的互补性议题（互补性是指，有数项活动中任何一项活动获益能力增加会提升其他每项活动的边际获益能力）。例如，一个想要在生产过程中频繁改变的公司将受益于为适应这些变化而以灵活方式培训的工人。互补性变化体系一旦形成，随着其应用范围的扩张和企业为适应这种体系而做出的改变，就会形成一种自然推动力，使得这些演进更有效率和价值。技术变化、需求变化，以及企业结构变化和范围变化的互补性是相辅相成的，会彼此产生正的反馈效应。比如，美国19世纪最主要的环境变化是技术的进步（铁路和电报的应用），技术进步促成了统一全国市场的形成。这种变化有利于企业采用大规模生产技术，统一的全国市场又推动了大型组织机构的演进，如铁路、钢铁和石油公司的出现，并促进了可提供大规模融资的金融机构的发展，为企业的大规模经营提供资金支持。处在这一变化浪潮中的企业改善和提高了它们的生产方式，能以更低的成本扩张，并招聘到训练有素且熟悉新范式的管理者，从而进一步改变了传统的产业环境。

米尔格罗姆与罗伯茨运用互补性系统的思想框架处理组织理论中的一些关键议题并获得一些有意义的启示。比如，当组织去适应互补性系统中的某一因素变化时常常会出现绩效降低的情况，这将使得组织很难进行变革。这也是成功企业为何一直无法复制的主要原因，因为复制成功需要组织内所有因素共同发挥作用，这些因素包括绩效激励体系、一系列的人力资源政策、生产管理政策、工人与管理层之间的信任等。他们用该结论预测了日本企业将很难调整以适应20世纪90年代初开始的经济衰退，后来的事实证实了这个预言。

米尔格罗姆和罗伯茨构建了一个模型，聚焦影响活动对组织成本的影响。影响活动是决策者对雇员职位有自由裁量权时，雇员有动机花时间去影响结果，而这些时间本应用在生产任务上，因此，对企业而言影响活动是有成本的。模型结果显示，如果雇员拥有对决策者有价值的信息，一定程度的影响活动对企业是有益的，但过度的影响活动则是成本高昂的。同时，米尔格罗姆和罗伯茨还比较了公司阻止过多影响活动的各种策略，通常情况下，限制雇员访问决策制定者和改变决策制定标准比使用明确的财务奖励更可取。米尔格罗姆、迈耶和罗伯茨还进一步研究了多元化企业的影响成本上升问题。他们研究发现，业绩不佳且与企业其他部门关联紧密的部门经理为保留其工作有夸大部门前景的动机，这会导致影响成本上升。如果部门是独立的，歪曲部门前景的机会则大为减少，影响成本随之下降，原因是组织对该部门的激励绩效相对其他部门是清晰的，该部门的影响活动则减少。这些论点有助于解释为什么业绩不佳的部门会如此频繁地被剥离，以及为什么当这些部门不能成为独立公司时，它们往往被从事相关业务领域的买主购买。

（三）信息经济学

在一个竞争的环境中，信息有两种重要的作用。首先，信息能够显示产品或服务的质量。其次，其他经济主体的信息能够揭示这个经济主体面临的竞争激烈程度。因此，信息经济学的核心是设计有效的激励相容约束机制去试图解决信息不对称引致的一系列等问题。米尔格罗姆在信息经济学中引入“有利”（favorableness）这一新概念：对于所有努力、能力、质量等相关变量的先验信念（belief，一种概率估计）。如果观察（observation）X的后验条件信念一阶随机占优于另一观察Y的后验条件信念，则X比Y更“有利”，即X出现的概率大于Y出现的概率。米尔格罗姆凭借“有利”概念和相关信息结构的“单调似然性”推导出了信息经济学的一系列重要结论：从委托-代理问题中的最优激励契约性质到拍卖理论中的“赢者诅咒”等。米尔格罗姆创新的“有利”概念和“单调似然性”的观点使得经济学模型的分析和解释都更简洁。

三、对博弈论的贡献

20世纪八九十年代，米尔格罗姆重视概率理论在博弈论中的应用，对非合作博弈中的新分支理论——声誉博弈、重复博弈、超模博弈、说服博弈、博弈学习等模型做出了基础性贡献。

（一）声誉博弈

从博弈的视角看，声誉博弈形成的起点是囚徒困境的重复。在标准的一次囚徒困境博弈中，唯一的均衡是帕累托无效的（损失，损失）。同样地，当囚徒困境被重复一个有限且确定的次数时，帕累托无效仍是每次博弈的唯一纳什均衡解。这似乎违背直觉与常识，因为局中人有很强的合作动机并拥有广泛的策略空间。例如，如果一个局中人承诺采取针锋相对的策略，那么其他局中人将会选择一直合作至最后几期，这将产生一个帕累托最优均衡解。米尔格罗姆与克雷普斯、罗伯茨、威尔逊运用概率空间的拓扑性分析了拥有不同信息的局中人的分配策略。他们研究发现，某局中人即使以一个非常小的概率承诺采取针锋相对策略，均衡时双方也会一直合作下去，这是因为，即使一个无承诺的局中人，也有激励去建立一个针锋相对的声誉，激励其他局中人的合作意愿。因此，米尔格罗姆等开创了声誉博弈这一新分支博弈理论。

（二）重复博弈

当局中人的行为隐匿但他们的行为噪音信号可观察时，有两种普适的方法实现效率。一种方法是转让违规局中人的未来收益给其他局中人，但总的未来收益并未减少，用这种方式惩罚潜在的违规者。另一种方法是延迟发布信息，每个时期的噪声信号效果会发布，局中人会在信息发布时“评估”（review）最近时期的信息并决定彼此之间是惩罚还是奖励，这就是广为人知的评估策略。当局中人收到彼此行动的私人信号时，米尔格罗姆与阿布勒、皮尔斯首先证实了重复博弈中满足评估策略有效性的均衡的存在。

（三）超模博弈

超模博弈是一个令人印象深刻的新博弈模型，它为互补策略博弈提供了普适性方法。超模博弈的影响力和重要性源于该模型的广泛应用，涵盖技术采用、银行挤兑、军备竞赛、审前谈判、多人贝特朗（Bertrand）竞争以及两人的古诺模型等。

这个理论的主要贡献包括开创性的Topkis定理（Topkis，1978）和米尔格罗姆与罗伯茨的有影响力的研究贡献。米尔格罗姆与罗伯茨首先将以前的基数超模博弈演变为序数超模博弈，并采用比较静态分析方法推导出纯策略的纳什均衡集。每个局中人都有一个最大和最小准则的理性策略空间，每个局中人采用的最大准则策略是一个纯策略纳什均衡，与策略空间中每个局中人采用的最小准则策略类似。这意味着纳什均衡集和相关理性均衡集具有同样的边界，边界对外生变量具有单调性，这使得模型具有简单的行为假设和强大的预测能力。其次，超模博弈产生的均衡是比较静态分析的结果，局中人的得益受到一些特定参数的影响，最大和最小准则的理性选择的均衡均是受到参数影响后的均衡。这两个基本原因使得超模博弈在理论和应用方面产生重大而持久的影响。

（四）说服博弈

米尔格罗姆（Milgrom, 1981b）构建了一种新型的“说服博弈”模型。模型中，卖方拥有产品的私人信息，通常会选择性地揭示对产品有利的信息而倾向于隐瞒不利信息。买方如果预期卖方隐瞒产品不利信息则会惩罚卖方，即采取极度怀疑策略。在买方可零成本地收集信息且与卖方充分沟通假设下，米尔格罗姆论证了说服博弈的每一个序贯均衡中卖方都有激励去披露信息，任何隐蔽性信息将会被“披露”（unravel）。由此，卖方会采用充分披露策略，这个结果被称为“披露的结果”。随后，米尔格罗姆和罗伯茨引入了一个更符合实际的修正说服博弈模型。其中，当买方只能获得有限的K个信息时，模型存在一种序贯均衡，均衡的结果是所有相关的信息都被披露，即卖方总会披露K个信息。信息披露的含义是，个人可以策略性地选择是否隐瞒信息，但隐瞒信息将招致严重惩罚。米尔格罗姆的说服博弈影响巨大且贴近真实世界，它已被广泛地应用于众多领域，包括法庭辩论、产品测试的监管以及企业应对监管变化的财务披露等。

（五）博弈学习模型

传统博弈学习模型中的学习进程在短期内不一定收敛（converge），即使学习进程收敛，在一定条件下也需要很长时间。而且，传统博弈学习模型仅关注重复进行的相同博弈，没有考虑到灵活学习后更为复杂的问题：前一阶段博弈的得益会对后一阶段博弈的得益有暗示作用。其中，局中人在灵活学习时可以充分利用均衡分析中的得益信息，但不会强加给局中人任何预期目标。由此，米尔格罗姆和罗伯茨提出了两阶段的短期博弈学习模型，每个阶段的学习具有一定程度的普适性。模型中，随着时间的推移，一个局中人n的“观察序贯”记为{xn (t)}：t为任何一段时期，xn (t)是一个纯策略。鉴于此，如果局中人n最终选择的唯一策略是对其他局中人短期联合策略的概率分布的最优反应，那么观察序贯{xn (t)}与适应性学习（adaptive learning)一致。与之相比，如果局中人n在预测其他局中人策略的概率，那么观察序贯{xn (t)}与灵活学习相一致。其中，局中人的策略既包括过去的策略也包括适应性学习后或灵活学习后的选择策略。因此，符合适应性学习的一个序贯也符合灵活学习。有了这些界定，米尔格罗姆和罗伯茨证明了，如果一个序贯收敛于纳什均衡或相关的均衡，那么这个序贯与适应性学习一致。这就给了学习进程一定程度的普适性，同时这些学习进程与占优策略的消失相关，这揭示了古诺博弈和贝特朗博弈中的收敛含义。

四、对产业组织理论的贡献

20世纪70年代，产业组织理论的先驱阿克洛夫、斯蒂格利茨、斯彭斯等提供了产业组织的一些概念性和方法性的背景知识。20世纪80年代，米尔格罗姆与罗伯茨合作的几篇开创性论文，从信息不对称和博弈论视角发展了产业组织中的一些核心思想，构建了产业组织理论的全新框架并使之成为该研究领域的主流思想。

产业组织中一个重要的议题是掠夺性定价。很长一段时期，芝加哥学派麦吉（McGee，1958）的分析为此提供了唯一的连贯经济图景。麦吉认为掠夺性定价的概念缺乏逻辑一致性，除了被掠夺者之外，掠夺者也遭受太多掠夺。如果被掠夺者抵抗掠夺者，并采取积极行动，那么掠夺者最终会放弃自己的努力。预期这个结果，被掠夺者会更激烈地抵御掠夺者的掠夺。反过来，掠夺者通过抑制自己的掠夺策略会更好。进一步地假设，掠夺者被成功地诱导退出，被掠夺者随后提高了产品价格，享受其胜利的果实，新的掠夺者可能又会被吸引，全部问题又重新开始。由此，麦吉得出结论，掠夺不是均衡策略，被掠夺者的容纳是对掠夺者进入的最优策略，掠夺者的进入是对被掠夺者的容纳的最佳反应。当然，这些结论都是建立在完美信息条件下。

米尔格罗姆和罗伯茨、克雷普斯、威尔逊对掠夺性定价提供了一个新的视角。他们在信息不对称条件下创建了一个新的声誉博弈模型，并第一次将它运用于产业组织理论和政策中，为掠夺性定价这一产业组织理论的核心议题提供了新含义。他们假设在一些小的概率下，被掠夺者可能非理性地（irrationally，非利润最大化的行为）与掠夺者激斗。在此情况下，通过较低的成本反复打击对手，被掠夺者增加了“坚韧”（toughness）的美誉，从而强化了被掠夺者的生存空间，并阻止了潜在掠夺者的进入。

在完美信息条件下，限制性定价理论的推论是：潜在进入者如果知道商品成本等信息，在位者就不会采用限制性价格，因为显著限价在降低在位者利润的同时并不会对潜在进入者产生任何影响。但是，现实情况与限制性定价理论的完美信息假设恰恰相反，在位者和潜在进入者之间存在信息不对称，即潜在进入者不知道在位者的产品成本信息。由此，米尔格罗姆和罗伯茨摆脱了完美信息假设的窠臼，将信息不对称引入限制性定价（收费低廉甚至低于边际成本的价格）理论。他们认为，在位者和潜在进入者之间的限制性定价问题可视作信息不对称下的博弈行为。信息不对称时，潜在进入者不知道在位者的类型（高成本或低成本）。由此，在位者通过低价格信号向潜在进入者传递低利润信息，影响潜在进入者对在位者类型的估计概率，让潜在进入者认为该行业前景长期黯淡，从而阻止了潜在进入者的进入。

传统上，经济学家认为广告是一种信息，但为什么一些广告（例如说服广告）很少提供或根本没有产品特性的信息？米尔格罗姆和罗伯茨从信息不对称视角对该问题所提供的合理解释为，即使广告没有提供产品任何特性的直接信息，也可能是有告知性的，在某种程度上至少它是广告者质量的一个信号。

米尔格罗姆与罗伯茨一系列极具影响力的论文表明：掠夺性定价、限制性定价、说服广告等都是不对称信息条件下行为主体的理性策略行为。米尔格罗姆是一个开路先锋，他运用信息不对称和博弈论框架改写了现代产业组织理论的逻辑基础，指明了产业组织理论的未来研究方向。

五、对其他经济领域的贡献

米尔格罗姆研究兴趣广泛，他凭借信息不对称和激励机制分析框架对经济理论的诸多研究领域进行了拓展与整合，增加了人们对信息和激励机制在各种环境中的作用的理解。

（一）市场设计

市场机制通常需要参与者显示其对有关项目的偏好和评估价值，而当多个不同的项目进行分配时，项目组合数量之多使得参与者的决策成本过高，参与者会使用简单的信息去描述完整的偏好，即使用市场设计分配资源。除此之外，诸如器官移植、婚姻选择、学生实习等分配项目因情感伦理、每个个体具有特殊性等原因，价格机制在一些分配项目中无法发挥作用，需要市场设计实现稳定匹配。市场设计就是利用实验室研究、博弈论、算法等模拟竞争市场的分配功能进而实现稳定匹配。市场设计是一项经济工程，启发了人们重新思考经济理论的长期基础。

米尔格罗姆在市场设计的理论和实践方面都做出里程碑式的贡献。米尔格罗姆与哈特菲尔德利用递延接受算法具体论证了在考虑到“合同匹配”时如何泛化稳定婚姻匹配问题。这里，匹配模型两侧代理人之间的匹配关系内生于匹配过程。此外，他们注意到稳定匹配集合形成一个格（lattice，数学上一种特殊的偏序集），而且“似空位链机制”也存在。观察到稳定的匹配是一个格，为他们泛化市场匹配模型提供了洞察力，借此可以简化和优化参与者的信息空间，实现偏好不同的参与者的效用最大化。米尔格罗姆的研究成果成功地运用于不同的领域，有两个成功的案例：一是重新设计了日本的医院和居民的匹配；二是设计了士官生在美国军队部门的配置。

（二）制度

米尔格罗姆对学界理解市场经济中法律制度的演变做出了早期贡献。米尔格罗姆、诺思、温格斯特构建了一个重复博弈模型，阐释了正式制度充当判断契约行为的智囊团的（repository）作用，其中，契约行为可以协调多边声誉机制。他们揭示了中世纪后期欧洲商业法的作用，商人查询并依靠商业法来判断什么是“欺诈”，以判别潜在的贸易伙伴是否在之前的合同中欺诈，从而触发其他商家的惩罚。米尔格罗姆等认为，惩罚的激励源自重复博弈的结构，这是一个囚徒困境，欺诈是占优策略，不欺诈的唯一动机来自未来的合作伙伴可以从欺诈中学习并且欺诈可以不受处罚，这导致子博弈精炼纳什均衡。商人有激励创建类似于上述博弈中惩罚机制的机制，这是相对于合同执行制度的一种分权制度，分权制度有助于克服这样的理论观点倾向：法律执行的效果完全归因于利用集中执法机构（如立法院和警察局）的能力。

在法律制度方面，米尔格罗姆、格雷夫和温格斯特做出了进一步的贡献，他们应用重复博弈模型诠释了欧洲商业行会的作用。中世纪时期，欧洲经营环境混乱，长途贸易中的商人容易遭遇人身攻击、货物没收和契约无执行力等诸多风险，商人因此需要当地统治者对其人身、财产和契约的援助。但是，驱使统治者帮助商人的激励源自哪里？他们的关键洞见是，在有效的贸易层面上，无论是双边或多边的声誉机制都不具备统治者有保护外籍商人的激励。真正的原因是，失去单个商人或者一个商人小团体的贸易而给当地统治者造成的损失极小。因此，单个商人不足以制止当地统治者没收货物或鼓励他们付出资源、政治资本来保护贸易商。阻止统治者不良行为的有效惩罚需要能提供给统治者有价值的所有商人的广泛合作。现在问题是，什么样的激励使得商人不得不参与集体抵制？这就是商人行会的作用，商人行会有权惩罚不遵守行会宣布的抵制措施的行会会员。米尔格罗姆等探究了分权制度在协调和激励契约执行中的广泛作用，类似于声誉机制的作用。

米尔格罗姆等论证了正式制度和声誉机制的相互作用。他们认为无论是声誉机制还是正式制度本身都不能完全有效，它们是整个系统内互补的组成部分，只有组合在一起制度才能有效地发挥作用，也只有这样才有助于克服这样的不良倾向：法律、经济和政治理论都认为，执法机构是完全唯一的具有集中执法能力的正式制度。由此，米尔格罗姆等认为组织机构应建立分权的执行制度。

（三）金融

著名的无交易原理表明，如果交易者有相同的先验信念（prior beliefs，一种概率估计）和纯粹投机的交易动机，那么就不应该交易。因为，所有的交易者都准确地了解均衡价格所反映的信息，并预期他人理性交易。因此，交易者如果预期他与知情交易者交易将蒙受损失时，就不会出现交易。如果交易者不能从交易中获利，为什么还要费时费力收集信息？如果知情交易者不交易，或者交易者不理会推理出的私人信息，这些信息又如何反映在价格中？米尔格罗姆和格罗斯顿的《买价、卖价和内幕交易市场中的交易价格》一文对上述问题提供了合理解释，并阐释了投机者能否从投机中获利的重要问题。他们开创性地提出了一个证券市场价格形成过程的动态模型和一个以信息为基础的买卖价差解释：知情交易者比做市商拥有更多的信息，做市商在与知情交易者交易时会蒙受损失，但做市商会通过买卖价差从因私人原因（例如流动性需求）交易的非知情者手中弥补损失。这个信息不对称的动态交易模型详细刻画了金融市场中的价格形成机制，并成为市场微观结构研究领域的主流模型之一。

20世纪60年代开始，股票交易所的交易量以一个不断增长的速度持续增加，于是米尔格罗姆、布雷斯纳汉和保罗提出疑问：交易量的快速扩大是否也带来证券交易所的实际产出的迅速提高？米尔格罗姆等构建了一个模型，模型中交易者通过收集公司价值信息和交易股票获利。然而，他们认为有价值的信息是企业真正做出决策的附加值信息而不是企业价值信息，增长的交易量只是增加了致力于寻租的资金，并没有改善交易者的投资决策。

（四）劳动经济学

米尔格罗姆与奥斯特评估了“隐形假说”，探究了劳动力市场的缺陷。他们指出，弱势职员有向潜在的新雇主发出工作技能信号的障碍，因为现任雇主拒绝提供给他们能提高其知名度的升职。雇主这样的行为虽然可以为公司赢利，但导致弱势职员的收入更低，即使他们原本与现在具有优势的同事有着同样的教育经历和能力。毫不奇怪，弱势职员在教育和人力资本上的投资回报减少强化了劳动力市场被歧视的苦果。

宏观经济模型中的真实经济周期模型、效率工资模型和搜索/匹配模型长期难以解释劳动力市场的波动。夏默解释了出现在标准的戴蒙德-莫滕森-皮萨里季斯模型（DMP Model）中的这个问题，认为标准的DMP模型中引发企业市场价值上升的冲击会增加企业雇佣求职者的激励，但是随着就业市场的扩大，劳动力市场的状况开始有利于求职者，这使得求职者在与企业的工资谈判时更具优势，引致工资上升，减少公司利润，最终降低了企业雇用求职者的激励，这个负反馈机制被称为“夏默之谜”。虽然经过无数经济学家的努力，但厘清劳动力市场的波动难题绝非易事。米尔格罗姆与霍尔研究发现，标准DMP模型中的讨价还价框架没有贴近真实的工资谈判模式。求职者与雇主见面时，求职者与雇主形成了博弈，双方都知道将从博弈中获得潜在剩余，他们会达成一项分享潜在剩余的工资安排。谈判中求职者面临的威胁是推迟谈判，而不是终止谈判以继续寻找新雇主。同样，雇主面临的威胁也是推迟而非终止谈判。因此，谈判的最终结果取决于参与者延迟谈判的相对成本，而不是拒绝任何谈判的非理性威胁即博弈中的纳什威胁点：求职者重新返回市场，公司等待另一个应聘者。最有可能的结果是，当求职者和雇主坐下来谈判之前，雇主的人力资源部门已对求职者做了初步筛查并评估了他们可能对雇主做出的贡献程度，由此，合适的求职者已被鉴别出。这一结果导致即使在谈判中雇主和求职者意见相左，双方也不可能草率地分道扬镳。该分析框架提供了让宏观经济学家普遍感到困惑的“夏默之谜”的一个潜在答案，米尔格罗姆和霍尔的观点被普遍认为是劳动经济学的一个基础性贡献。

（五）经济学方法

经济学中比较静态分析方法无处不在，其本质是研究经济环境变化时行为主体如何决策和均衡如何位移。例如，比较静态分析常被用来分析均衡的价格和数量如何应对需求和供给的冲击；研究商品、任务或工人之间的互补性问题；帮助建立各种博弈均衡的存在、研究匹配程序的稳定性、预测市场对信息的反应等。最常见的一般比较静态分析技术是基于希克斯和萨缪尔森的隐函数定理，这种方法通常依赖于凹性和可微性假设探究当外部参数改变时均衡如何演化。米尔格罗姆和西格尔运用新的数理方法将单调性（一个变量增加恒对应另一个变量增加）引入比较静态分析中，证明了与特定函数形式有关的命题可以很容易泛化，由此该方法在经济研究领域被广泛应用。现在该分析方法被称为单调比较静态分析。单调比较静态分析有助于将经济模型中的关键假设与其他假设区别开来，同时不改变比较静态分析的性质。因此，该方法可开发更多的经济学模型并提高经济学模型解释的准确程度。例如，该方法重新发展了包络定理及其含义，有效地分析了多数投票权中的孔多塞投票悖论和社会选择理论等。

六、简评

凭借优秀理论家的深刻思想、敏锐的洞察力以及深厚的数学功底，米尔格罗姆开创性地拓展了信息不对称和激励机制在众多经济学领域的研究，这些研究领域涵盖拍卖理论、博弈论、信息经济学、产业组织、组织理论、市场设计、金融领域等。米尔格罗姆引人注目的理论研究成果增加了人们对经济主体理性行为的理解，揭示了他对经济的运行机制有着深刻见解，并帮助他成功地将研究成果运用于实际并得到充分验证。

米尔格罗姆最著名和最具影响力的拍卖理论令他声誉鹊起，所创立的附加价值模型对拍卖理论做出了奠基性贡献。米尔格罗姆据此设计了同步增价多轮拍卖方案，有效地解决了困扰联邦通信委员会多年的无线电频谱牌照无效配置难题。同步增价多轮拍卖也是历史上首次在实践和理论上都合理的拍卖。米尔格罗姆对委托-代理理论也颇有建树。他探究了代理人的责任范围影响委托人最优激励结构的内在机理，研究发现委托人对代理人多维任务的最佳激励方案为动态的线性激励规则。米尔格罗姆是最早将博弈论运用于产业组织理论、制度的历史演变、组织理论、微观金融市场等研究领域中的领军人物之一，其分析为这些问题的合理解释提供了新的深刻见解。此外，米尔格罗姆重新审视了经济分析的基础，对数理经济学做出基础性贡献，开创了单调比较静态分析方法，使得一些经济模型的分析更为简洁敏锐。同时，米尔格罗姆对诸如市场设计等新的研究领域提供了贴近现实的分析框架，并成功地运用于现实。

(注和参考文献略)

霍兵，山东大学经济学院，感谢匿名审稿人的修改意见，文责自负。

原载《经济学动态》2019年第5期

保罗·米尔格罗姆对当代经济学的贡献

亲爱的凤凰网用户:

第三方浏览器推荐: