专栏名称: 中国经济学教育科研网
经济学术动态资料,经济思想交汇碰撞,经济政策解读聚焦,经济书籍品评荐读
目录
相关文章推荐
岚山发布  ·  起猛了!一夜之间,岚山变“花海”! ·  2 天前  
岚山发布  ·  起猛了!一夜之间,岚山变“花海”! ·  2 天前  
天玑-无极领域  ·  这几天,流行用Grok3 ... ·  2 天前  
GS权益虚拟卡卷数字终端  ·  天天白嫖外卖红包!这个公众号承包你一年的奶茶钱 ·  3 天前  
GS权益虚拟卡卷数字终端  ·  天天白嫖外卖红包!这个公众号承包你一年的奶茶钱 ·  3 天前  
天玑-无极领域  ·  奇怪,连续多人问:怎样用deepseek赚钱 ... ·  3 天前  
51好读  ›  专栏  ›  中国经济学教育科研网

菲利普·施特拉克对行为经济学和信息经济学的贡献——2024年度约翰·贝茨·克拉克奖得主学术贡献评介

中国经济学教育科研网  · 公众号  ·  · 2024-08-23 17:17

正文



菲利普·施特拉克对行为经济学和信息经济学的贡献

——2024年度约翰·贝茨·克拉克奖得主学术贡献评介

罗俊 汪晓辉

Philipp Strack
摘要 :菲利普·施特拉克巧妙地运用数学工具将与信息相关的概念模型化,并运用到动态环境下的学习和信息传递等模型中,刻画了个体决策的时间不一致性、学习偏误和过度自信等情景对决策的影响,显著推动了行为经济学的发展。其构建的用于刻画信息成本函数和隐私等概念的公理化方法,在理性疏忽、决策理论、序贯抽样的瓦尔德模型、动态信息获取模型和概率论等方向都具有广泛的应用,也代表了信息设计领域的研究前沿。其开发的主序化约束下的求极值点问题的方法可以分析很多机制设计领域的基本问题。本文通过梳理施特拉克关于信息、隐私和学习等概念的数理化构建与模型拓展,概述相关公理和方法在行为经济学、信息设计和机制设计等方向的应用。施特拉克的学术贡献不仅仅从技术方法论上为以上研究领域提供了新见解,而且还突破了相关研究领域的局限并拓展了研究边界。
关键词 :菲利普·施特拉克 行为经济学 机制设计 信息设计


菲利普·施特拉克(Philipp Strack)因对行为经济学和信息经济学的贡献被美国经济学联合会授予2024年度约翰·贝茨·克拉克奖。施特拉克于1985年出生在德国波恩,具有德国和希腊双重国籍和美国永久居民身份,于2009年和2010年先后获得波恩大学经济学硕士和数学硕士学位,并于2013年获得波恩大学经济学博士学位。博士毕业后曾在微软研究院新英格兰分部从事博士后研究,自2014年起在加州大学伯克利分校经济系担任助理教授,于2018年晋升经济学副教授。自2019年起任耶鲁大学副教授,并担任算法、数据和市场设计中心研究主任;2022年升任经济学教授并兼任耶鲁大学计算科学教授。施特拉克曾获得斯隆研究奖(经济学)(Sloan Fellowship in Economics,2019-2021)、德国商报(Handelsblatt)评选的最高产德国经济学家(2021)和Bodossaki杰出青年科学家奖(2023),并于2022年当选为计量经济学会会士。作为一位高产的学者,自2011年开始发表学术论文以来,施特拉克目前已经在《美国经济评论》等顶尖期刊发表41篇文章,完成16篇工作论文。

施特拉克的工作主要集中在信息概念的公理化表述及其相关应用方面。总体而言,其研究的是关于决策者在有限理性假设下如何收集信息、获取的信息和信息量大小如何影响决策等问题。比如,在决策和行为经济学方向,他考虑了动态环境下的学习和信息传递问题,构建模型描述了个体决策时的学习偏误;在信息经济学领域,他提出了一套新的公理化方法来刻画信息成本函数,并将隐私等概念形式化,得出的定理在理性疏忽(rational inattention)、决策理论、序贯抽样瓦尔德模型(sequential sampling Wald model)、动态信息获取模型和概率论等方向都具有广泛的应用;在机制设计领域,他运用极值点(extreme points)和主序化(majorization)方法提出了一种新的机制设计分析方法。下文分别从决策和行为经济学、信息经济学、机制设计和其他四个研究方向来介绍他的理论拓展和学术贡献。

一、决策和行为经济学

施特拉克考察了目前行为决策理论的局限性,主要研究了动态环境中学习和信息传递对行为决策的影响,从而推动了新一代行为经济学的发展。

(一)跨期决策

跨期决策是指个体在面对有限资源时,如何在短期利益和长期利益之间进行权衡和决策,反映了个体在当下对于不同时间点上的决策获得效用的相对价值的权衡,这在生活中的很多领域(如金钱、健康及环境等)都存在。新古典经济学家如萨缪尔森提出用指数贴现效用模型(exponential discounting model)来刻画跨期决策中常见的时间贴现现象。而行为经济学家则发现,实际的跨期决策会表现出时间不一致性(time inconsistency),即当决策者面对涉及“当下”的决策时表现得更加不耐心,特别是当个人无法完全预见其偏好变化时,这类注重当下的个人往往会拖延完成乏味的任务。为此,学者通过引入一个额外的现时偏误参数,对所有未来效用进行贴现,构建了能捕捉到个人对现时关注的双曲线贴现模型(hyperbolic discounting model)。

与此同时,行为经济学家引入(部分)“天真”(naive)的个体特征对这一框架进行了扩展,将人们分成有经验的个体(sophisticated agents)和没有经验的个体(naive agents)。有经验的个体能意识到,如果对跨期决策进行有效的规划,个体效用会提高;没有经验的人就有拖延完成乏味任务的倾向。既然过度拖延是双曲线贴现模型的一个可靠预测,那么利用任务完成时间的数据就可以识别时间不一致的偏好。以往的研究将在截止日期或接近截止日期完成任务的个体归类为时间不一致个体,或根据参数假设从完成时间来估算个体时间不一致的程度。在《从选择的时机来识别个体的现时偏误》(2021)一文中,施特拉克等提出,如果只能观察到任务的完成情况而观察不到完成任务的成本和收益时,外部观察者(称为分析师)是否可以推断出决策者的时间偏好不一致性?他们分析了以下模型:在每个时期,决策者都面临着是当天完成任务还是推迟完成任务的问题。分析师无法直接观测到完成任务的成本和收益,但知道决策者在不同时期的净收益的分布,且该分布在不同时间是相互独立的,且决策者具有时间可分的效用。此外,分析师可以观察到决策者的确切停止概率。因此,对于任何时间贴现上具有准双曲线偏好(由参数 β δ 表征)且在跨期决策中没有经验的决策者来说,以没有提前完成任务为条件,他们完成任务的概率在临近截止日期时会增加。反之,对于任何给定的偏好参数 β、δ 和(弱增加的)任务完成概率曲线,只要决策者是老练的或完全天真的,就存在一个能使其行为合理化的静态报酬分布。

在《错误理解自己》(2023)一文中,施特拉克等建立了一个代理人模型,其中的代理人会固执地低估其行为受不良动机的驱使的程度,并将其行为归因于其他因素,同时不断更新其对这些因素的看法。他们研究了该模型的一般特性,然后应用该框架解释了具备部分天真水平的个体的现期偏好新含义。在许多稳定的情况下,个体最终能很好地预测自己的行为。然而,不切实际的自我观(self-view)会使个体出现现时偏误。第一,通常情况下,该个体的行为总是比老练的代理人更具现时偏误。第二,当环境发生变化,比如对前瞻性行为的激励增加了,或者被置于一个新的但实际上与之前情形相同的环境中,该个体就会系统性地错误预测自己的反应。第三,即使对于物理上不具成瘾性的产品,该个体也会遵循以往经验中类似成瘾的消费动态,而这也是其没有预料到的。第四,与其他代理人的信念相比,该个体所持有的信念会在实际上逻辑并不相关的问题之间显示出令人费解的相关性。他们指出,之前的一些研究结果可能更符合其所设定的模型,而不符合目前广泛采用的学习模型。

(二)损失厌恶

卡尼曼和特沃斯基构建的前景理论(prospect theory)对传统的期望效用理论提出了挑战,并已成为行为经济学中最为重要的理论框架之一。前景理论基于个体决策的非理性行为描述了人们在面对风险时如何做出决策的问题。除概率加权外,前景理论的核心基石是参照依赖(reference dependence)和损失厌恶(loss aversion)。后续研究者又提出了决策者的参考点是如何由理性预期决定的理论框架。然而,许多与经济相关的结果并不是由孤立的个体决定的,而是由个体在策略互动中的相互作用决定的。

以往关于损失厌恶型博弈者的策略互动研究都是在特定环境中进行的,如秩序锦标赛和拍卖等。但这些研究没有考虑混合策略均衡的可能性,甚至常常将注意力局限于特定的纯策略均衡集,如对称均衡。而且,之前的文献对于损失厌恶型博弈者之间包罗万象的策略互动模式缺乏通用的解释。基于此,在《基于预期的损失规避与策略互动》(2017)一文中,施特拉克等将损失厌恶理论纳入博弈互动的一般框架中,对损失厌恶型博弈者之间的策略互动进行了全面分析。首先,将之前研究构建的均衡概念扩展到有限博弈,建立了一个连贯的分析框架,并解释了推导出这种均衡的方法。其次,描述了损失厌恶型博弈者的策略行为与标准期望效用理论下博弈者的策略行为有何不同。再次,分析了损失厌恶下的均衡博弈和均衡存在性问题。

(三)过度自信

行为经济学中的大量文献表明,个人在许多情况下对其特质或前景会抱有不切实际的积极信念。比如,具有自我现时偏误的吸烟者预测其很快会成功戒烟,但实际上反而吸得更多,或者一个带有隐性偏见的雇主认为自己会公平地对待每个应聘者,但实际上最后组成的团队是种族不平衡的。相关学者在关注过度自信的本质及其对经济互动的影响时着重研究:对于持有过度自信或其他偏差信念的个人来说,当信息来临时,他们是如何更新信念的。经典文献认为,学习是形成正确信念的条件,但近年来的研究认为形成过度自信信念的原因是有偏见的学习。

在《不切实际的期望和误导性的学习》(2018)一文中,施特拉克等研究了过度自信的个体如何更新其过度自信信念以及对其他决策相关变量的信念。该项研究的贡献在于证明:在弱条件下,代理人对基本要素的信念会收敛。此外,他们还发现了一类广泛的、具有重要经济意义的情况:当代理人高估自己的能力时,学习会导致信念进一步偏离真相,而当次优行动的损失很大时,这种效应会加剧。这一论点可以在团队环境中看到,过度自信会导致个体将次优结果归咎于他人。他们还对自我挫败式学习发生的环境进行了部分描述,并且表明,如果满足特定的不可识别性条件,决策者就会学会采取最优行动。与过度自信的代理人相反,缺乏自信的代理人的错误学习是自我限制的,因此反倒并不十分有害。他们所研究的这种决策情况在经济环境中其实很常见,包括授权、组织和公共政策选择过程等。

以往研究中歧视现象更多地体现为群体之间的歧视,或者说,在类似的情况下,与具有其他相同特征的多数群体的成员相比,少数群体的成员会受到区别对待。在过去的几十年里,经济学、社会学以及心理学采用实验的方法证明了歧视的存在,并结合社会认同理论对歧视在现实生活中的表现进行了研究。在《过度自信与偏见》(2019)一文中,施特拉克等进一步对以上核心思想进行了延伸,探讨了过度自信和学习会如何产生歧视和偏见,并提出在许多情况下应共同处理过度自信和偏见这两个不同的概念。他们假定行为主体对自己过于自信,从而解释了可观察到的社会信念的主要模式,并进而做出了一些有关歧视和偏见的推断。第一,行为主体比局外人更相信其所在的任何群体会受到歧视,这反映了广泛发现的以自我为中心的歧视现象。第二,行为主体与某个个体共享的群体成员越多,其对该个体的评价就越积极。这就解释了社会判断的一个最基本的事实——群体内偏见以及“合法化神话”(legitimizing myths),即通过认定特权群体的优越性来证明任意社会等级制度的合理性。第三,偏见的存在及其程度取决于行为主体在评估事件结果时是如何将社会划分为不同群体的,这就解释了为什么不应该提出一些带有种族色彩的问题,同时也提供了一个潜在的渠道来说明为什么国家建构(包括民族建构)政策可能是有效的。第四,向行为主体提供有关其自身的更准确信息(如其所属群体的身份信息)会增加其对他人的偏见。第五,行为主体容易产生替代偏见,这意味着引入一个新的外来群体会使行为主体产生对新群体的偏见,但会减少其对其他群体的偏见。第六,行为主体更倾向于认同同一群体中的人。此外,他们还解释了为什么过度自信的行为主体允许在评估结果中出现不自觉的歧视,即使行为主体最初并没有设想出现这种可能性。至此,施特拉克等在模型中论证了个体的过度自信及其在学习中不断的信念更新是如何形成针对群体的偏见或歧视的。

(四)学习

多臂老虎机问题是概率论中的一个经典问题,也属于强化学习的范畴。设想一个赌徒面前有 N 个老虎机,事先并不知道每台老虎机的真实盈利情况,那么他会如何根据每次玩老虎机的结果来选择下次玩哪台或者是停止赌博,以便最大化其总收益。在商业中,多臂老虎机问题有着广泛的应用。比如,在推荐系统中有 N 个物品,企业事先不知道用户对 N 个物品的反应,需要每次推荐某个物品给用户,从而最大化用户价值(比如促成用户的购买)。

在《当收益是私人信息时的策略性实验》(2015)一文中,施特拉克等考虑的是两个博弈者面临完全相同的离散时间老虎机赌博问题,分别有一个安全臂(老虎机操纵杆)和一个风险臂。在任何时期,风险臂要么成功要么失败。当报酬为公开信息时,随之而来的搭便车问题会非常严重。而当报酬为私人信息且参与者可以通过廉价谈话进行交流时,给定参与者足够乐观的先验信念,其所达成的社会福利最优的博弈策略集合可以实现完美贝叶斯均衡。只要每期的成功概率不是太高,这些结果就可以推广到两个以上的参与者。特别是,在泊松过程的跳跃时间里成功发生了,而且整个决策周期长度足够短时,就会出现以上的情况。

在《在网络重复互动中学习》(2024)一文中,施特拉克等研究了长期存在的理性决策者如何在社会网络中学习。在每个时期,每个决策者在观察了周围人过去的行动后都会收到一个私人信号,并选择一个其收益只取决于状态的行动。由于均衡行动取决于高阶信念,因此很难描述其行为特征。不过,他们的研究表明,无论网络的规模和形状、效用函数以及决策者的耐心如何,任何均衡状态下的学习速度都会有一个上限(常数),而这个常数只取决于私人信号的分布。

(五)神经科学模型

行为经济学理论的核心问题是:人们的决策行为是否理性?哪些因素导致了人们的决策行为不理性?经典漂移—扩散模型(DDM)认为,人们的行为决策背后往往存在一个信息收集的过程,当收集到的信息超过某个阈值就做出决策。因此,该理论模型描述的决策行为属于个体存在一定价值倾向时稳定而又快速的决策,而背后对应的正是基于价值的决策理论(value-based decision)。值得注意的是,最初的漂移—扩散模型只适用于二元决策任务,即只存在两个备选项时的决策任务,经过数十年的发展,该理论模型用于解释行为决策的优良性已经得到了很好的验证。

在《速度、准确性和选择的最佳时机》(2018)一文中,施特拉克等研究了早期决策在序贯信息获取(sequential information acquisition)的经典环境中何时更有可能正确的问题。他们将二元决策中的选择概率和决策时间的联合分布建模为最优顺序采样问题的解。其中,决策者不确定每项行动的效用,并为收集信息支付单位时间内的恒定成本。研究结果表明,如果行为主体的先验信念是正确的,那么当行为主体选择快速决策时,其选择更有可能是正确的。这比经典的漂移—扩散模型更符合所观察到的决策时间与选择概率之间的相关性,因为在经典模型中,决策者知晓各种选择之间的效用差异。

在漂移—扩散模型中,决策者会不断积累证据,直到该过程触及停止边界的上限或下限,然后停止并选择与该边界相对应的备选方案,从而可以解释观察到的选择和反应时间模式。在《检验漂移—扩散模型》(2020)一文中,施特拉克等提供了该理论模型的识别和特征定理,证明了参数的唯一性,并确定了哪些数据集符合哪种形式的漂移—扩散模型。此外,他们基于有限数据集,使用样条估计法(spline estimation)对该理论模型进行了统计检验。这些结果确定了该理论模型的经验内容,并为研究人员提供了一种能够了解该理论模型何时适用的方法。施特拉克等通过纳入报酬的不确定性扩展了漂移—扩散模型,并考虑了对观察结果的选择,还提出了针对该理论模型的新统计检验方法,这为经济学、心理学和神经科学建立了一个研究选择时机的新基准,也为新古典经济学理论与行为经济学理论以及实证工作之间架起了桥梁。

二、信息经济学:新的信息建模框架与思想

信息经济学主要研究信息在决策者做决策时所发挥的作用。施特拉克对信息经济学最重要的贡献在于,用一个统一的公理化框架来刻画信息成本问题,并以此为基础来刻画隐私、信息更新以及信息结构等相关概念。

(一)信息获取成本函数

在信息经济学中,学者普遍认为信息是稀缺和有价值的,而且信息的收集分析和利用是有成本的,如何刻画信息结构,并为其设定合理的成本函数是决策理论的重要议题。信息获取的成本和所获的信息量有关,文献中用库尔贝克—莱布勒散度(Kullback‑ Leibler divergence)、互信息(mutual information)和香农熵(Shannon entropy)等概念来度量信息量的大小。在《信息成本:恒定边际成本情形》(2023)一文中,施特拉克等基于诺贝尔奖得主西姆斯(Christopher A. Sims)的理性疏忽理论和经典的序贯抽样瓦尔德模型,提出了最大对数似然比信息获取成本(LLR)函数。理性疏忽理论基于香农熵的概念来度量信息获取过程中的信息成本,其假定信息获取过程中n个独立的实验成本是次可加性(sub‑ additive)的,但施特拉克等提出的LLR函数认为实验成本是可加性的(additive),可以作为香农熵度量方法的替代方案,并给出了一个更加简洁优雅的信息成本结构公理化表述。其中包括三个公理:(1)单调性公理,即信息更精确的实验成本更高。(2)独立实验成本的可加性公理,即每个独立实验的总成本是单个实验成本的总和;其经济含义是,收集20个顾客关于产品质量的信息所付出的成本等于收集10个顾客所付出成本的两倍。(3)稀释性公理,即具有0.5的概率成功的一个实验的成本等于具有1的概率成功的实验的成本的一半。

施特拉克等对信息成本的公理化表述将对信息经济学的理论以及更多的应用领域产生重大影响。比如,当决策者在观察一个漂移依赖于状态的一维信息扩散过程时,该信息成本与预期观测时间是成比例的,这种成本结构也是满足他们在《瓦尔德问题及序贯抽样与静态信息成本的关系》(2018)一文中提出的几个公理。在货币经济学和金融学领域,学者长期依赖基于香农熵的信息成本函数设定,但其存在众所周知的局限性,而施特拉克等对信息成本的表述可以弥补这些局限性。另外,如果将信息成本与经济属性联系起来,对于研究信息选择和现在迅速发展的数据市场也是非常有帮助的。

(二)信息结构和隐私保护

在很多经济环境中,哪些信息可以使用或披露是有限制的。比如,由于法律、法规或其他方面的限制,种族、性别和性取向等特征信息在许多情况下都受到保护。银行决定是否贷款给某一个体时,《平等信贷机会法案》会限制银行使用诸如种族、性别或年龄等“受保护的个人特征”信息对贷款人进行歧视。在《隐私保护信号》(2024)一文中,施特拉克等对信息的隐私保护给出了一个统一的分析框架。基于布莱克韦尔(1951)的等价实验比较框架,他们提出信息可以作为状态的一个信号,而隐私集代表不能被披露的信息,可以定义为事件的集合。因此具有隐私保护的信号满足如下条件:当隐私集合中的任何信号实现时,后验概率等于它的先验概率,或者说,受隐私保护的信号不会揭示属于隐私集事件的任何信息。运用数学语言可以描述为:隐私集总是可以用一个定义在状态空间的随机变量 θ 来表示,当且仅当 s 独立于状态 θ 时,信号 s 具有隐私保护功能;当且仅当信号是重新排序的分位数信号的乱码(garbling)时,信号是隐私保护的。这些信号相当于耦合,这意味着最优隐私保护信号的解和最优传输问题的解是一样的。

施特拉克等通过这种巧妙的数学技巧刻画了信息结构和隐私保护概念,为信息经济学相关的研究提供了一个全新的视角。他们还同时刻画了任意状态空间下隐私集合的所有隐私保护信号,包括全隐私保护信号、条件显示信号、分位数信号、重新排序分位数信号、非占优的隐私保护信号和最优的隐私保护信号等,其结论在算法设计中的统计歧视和公平性、拍卖中敏感信息的泄露、垄断定价和价格歧视中都有很好的应用前景。

1. 统计歧视和算法公平

在计算科学中,关于算法公平的法律研究文献正在关注如何规制决策时产生的统计歧视。算法公平中最普遍的标准是,要求决策者做的决策和受保护的特征没有相关性。以银行贷款为例,施特拉克等引入一个通用的设定,假定一个决策者以观察到( θ,y,z )的协变量组合来决定是否给某个贷款人放贷, θ 表示受保护的特征(如种族或性取向), y 表示材料相关特征(如征信历史或犯罪记录), z 表示其他所有可观察的特征(如邮政编码)。一个算法(或统计模型)就以协变量组合( θ,y,z )为输入并输出一个和结果 γ 相关的信号 s ,由于受保护的特征 θ 可能和结果 γ 相关,自然和信号 s 也相关,就可以利用前面的隐私保护结构得出的定理来描述可能会出现的统计歧视。施特拉克等的结论为决策者指明一种方法:对数据进行预处理,使其独立于受保护的特征,便有可能使应用于该数据的任何算法避免产生统计偏见的推测。

2. 拍卖中的最优隐私保护披露

在很多商业环境中,披露用户的一些隐私信息受到了严重质疑,比如谷歌或其他广告公司就因为将诸如宗教信仰、种族、病史等用户的敏感信息披露给广告商而饱受争议。施特拉克等将其隐私保护信号结论应用于出版商通过二级价格拍卖方式将用户的信息出售给多个广告商的情形。出版商可以决定出售给广告商的用户信息数量,每个广告商可以观察到关于自身价值的一个信号,但一些受保护的信息不能披露给广告商,施特拉克等给出了一个最优的对称信息结构。《隐私保护信号》一文中的结论和贝格曼等(2022)文章中的结论一起,完整地刻画了受隐私约束拍卖中最优的信息披露机制。

3. 买卖双方的信息与价格歧视

信息技术的进步增加了交易前买卖双方的信息披露,比如通过产品评价和平台的产品推荐,能使买家获得更多的产品信息和更好地了解产品的价值。卖家可以通过收集或购买能体现买家偏好的购买历史和特征数据来获得买家的价值信息。买方和卖方之间的信息结构可以从很多方面决定双方的激励,从而决定福利结果。一方面,买家掌握的信息让其在做出购买决策时更加知情,但同时也改变了需求弹性,进而改变了卖方的定价策略。另一方面,卖家掌握买家的信息能够让卖家实行价格歧视或攫取更多的剩余。而且,买家和卖家掌握的信息之间的相关性可以进一步影响价格歧视的程度和信息租金。

从买家的角度看,如果买家关于产品的信息和卖家知道买家所具有的信息是一样的,卖家可以实行完美价格歧视;如果卖家知道买家关于产品的信息比买家要少,则卖家只能实行部分价格歧视且会让买家保留部分租金。但是当买家信息和卖家信息具有某种程度的相关性,且如果买方的后验期望值是他们对卖方信号信念的充分统计量,则卖家可以使用克勒梅—麦克利恩机制(1988)攫取(几乎)所有的剩余;而如果买家没有任何关于产品的信息,则卖家没有必要实行价格歧视,只需制定统一的标价就可以攫取所有的剩余。在《利用买家信息打击价格歧视》(2024b)一文中,施特拉克等指出,如果买家的信号独立于卖家的信号,也就是在买家信号是隐私保护的情况下,克勒梅—麦克利恩机制和麦卡菲—雷尼(1992)机制下的剩余攫取是不可行的,此时卖家最优的定价机制就是制定单一的标价。而随着卖家的信号变得更有信息量时,卖家的利润将逐渐变大。但是由于法律的保护,很多买家的私人信息无法被卖家用来进行价格歧视,《隐私保护信号》一文中的结论也可以用来刻画防止垄断者实行价格歧视的市场细分条件。

三、新的机制设计分析方法

由诺贝尔经济学奖得主罗杰·迈尔森(Roger B. Myerson)提出的迈尔森最优拍卖理论的正确性特别依赖三个假设:单物品、估值分布已知、不同买家的估值独立。但该条件在很多复杂的环境下是不成立的,比如在网络经济下,买家之间对商品的估值是相关的。因此,机制设计领域还有很多未探索的新方向。在《极值点和主序化:经济应用》(2021)一文中,施特拉克等综合了求极值点和主序化方法,将主序化视为优化问题的一个约束,为机制设计构建了一种新的分析方法。他们证明许多著名的机制设计和决策问题都有一个共同的基本结构:从一组单调函数中选择一个函数,使得给定的泛函最大化,而这些单调函数之间具有主序化关系,即欧氏空间中向量之间的偏序关系。欧氏空间中向量或可积函数之间的偏序表示一个函数相对于另一个函数的“可变性”的比较,最初在研究经济不平等或不确定性下的选择理论时被引入经济学中,诸如均值保留展形(mean preserving spread)、范-洛伦兹不等式(Fan- Lorentz inequality)和二阶随机占优(second- order stochastic dominance)等概念都与之密切相关。

(一)收益最大化的排名物品拍卖模型

在收益最大化的排名物品拍卖模型中,临时分位数分配机制(interim quantile allocation)如果是非递减的,则它是一个贝叶斯激励相容机制(BIC)。出价最高的人获得的最高质量的协调分配机制(assortative allocation)也是贝叶斯激励相容机制,且可以引致临时分位数分配机制。在该拍卖模型中,收益最大化问题便可转化为求均值保留展形轨道的极值点问题,并且马上可以由范—洛伦兹定理给出最优的配置条件。但如果虚拟价值函数是非递增的,其他的极值点可能是最优的。施特拉克等有关极值点和主序化的定理指出,对于任何对称的贝叶斯激励相容机制,都存在一个等价的、对称的优势策略激励相容机制(DIC),使所有代理人产生相同的临时效用,并产生相同的社会剩余。

(二)匹配竞赛

在排名物品拍卖中,如果代理人和奖励都是连接统的,每个代理人都提交一个报价,然后拍卖者根据报价来匹配奖励,代理人的预期效用最大化可以由协调匹配方案得到,但此时代理人肯定会浪费资源,比如信号显示成本。如果报价是相互独立的,另外一种可行的资源配置方案是随机匹配,且实施随机匹配方案是没有成本的。施特拉克等给出了匹配方案是可行且激励相容的条件:(1)如果代理人的类型分布F是凸的,每种类型的代理人都偏好随机匹配方案;(2)如果类型分布F具有递增(递减)的失败率时,随机匹配(协调匹配)可以最大化代理人的预期效用,且如果类型分布F具有递增的失败率时,协调匹配方案可以最大化设计者的收益。

(三)最优委托模型

最优委托模型是指:世界的状态 θ 是在[0,1]之间具有密度函数f的分布F,状态的实现值是代理人的私人信息,行动空间是实数集。代理人在状态 θ 下选择行动 a 的效用为 U A θ,a)=- θ-a 2 ,委托人的效用为 Up θ,a )=-[ γ ( θ )- a ] 2 , [ γ :0,1 ] →ℝ。科瓦奇和米洛瓦诺夫(2009)在平均行动函数的单调性、确定方差函数的包络条件和方差非负这三个约束条件下给出了激励相容机制,而施特拉克等给出的条件同时包含这三个约束条件,并将问题简化为线性最大化问题,即只需求解主序化约束下的平均行动函数的最优化问题。与收入等价拍卖的结果相似,激励相容的委托机制只取决于平均行动函数的实现值。

(四)具有后验均值偏好的劝说模型

在Kolotilin(2018)和Dworczak & Martini(2019)的劝说问题中,状态变量 ω 是[0,1] 之间的一个连续分布F,信号发送者可以向不知情的接收者披露关于状态的信息。发送者选择信号 π ,信号是基于状态的条件概率。根据贝叶斯规则,每个信号产生一个后验概率分布和后验分布均值。接收者观察到信号和信号的实现值,然后根据后验分布均衡来选择最优的行动 x 。任何的信号都是先验概率的一个乱码,因此,任何信号 π 和先验概率分布F都是后验概率均值 的均值保留展形,即 ≻F。此时信号发送者的最优化问题就基于接收者的后验均值信念选择最优分布。发送方对定义在后验均值上的目标函数进行优化问题的结论就可以由施特拉克等有关极值点和主序化的定理得出。







请到「今天看啥」查看全文