picture from Internet
解析文章首发于唧唧堂网站www.jijitang.com
解析作者 | 唧唧堂经济学研究小组:
维垣
;审校编辑 |
悠悠 糖糖
论文基本信息:
本文是针对论文《声誉和不完全信息(Reputation and Incomplete Information)》的一篇解析。该论文于1982年发表于Journal of Economic Theory (JET),与同时期的几篇其他论文一道,开启了声誉(reputation)这一全新的的领域。从此,信息经济学的解释力大大增强。本文作者是David Kreps和Robert Wilson,是“Gang of Four”声誉三部曲中最核心的著作,被引量高达4231次。
相关解析:
JET声誉三部曲之一—有限重复囚徒困境中的理性合作
回顾
在上篇解析中,笔者对该论文的研究问题进行了阐述,并详尽地解释了Kreps和Wilson构建他们所提出的序列均衡的思路,此处不再赘述。详细内容请参考《JET声誉三部曲之二——声誉和不完全信息(上):均衡构建》。本篇解析将主要关注文中两个重要的均衡精炼过程。
为了方便阐述,此处仅完整给出该序列均衡的内容
信念系统
1. p_N = δ
2. 若新进者n+1在回合n+1没有进入,则p_n = p_{n+1}
3. 若新进者n+1在回合n+1进入,并且垄断者选择价格战,并且p_{n+1}>0,则
4. 若新进者n+1在回合n+1进入,并且要么垄断者选择默许,要么p_{n+1} = 0,则p_n = 0。
策略组合
1. 强的垄断者总是在新进者进入的时候价格战。
2. 弱的垄断者的行动取决于n和p_n:如果n = 1(最后一回合),弱垄断者一定默许;如果n > 1且p_n ≥ b^{n-1},弱垄断者选择价格战;如果n > 1且p_n < b^{n-1},弱垄断者选择混合策略——以下列概率选择价格战,以其互补概率选择默许
值得注意的是,当p_n = 0时弱垄断者价格战的概率为0;当p_n = b^{n-1}时,弱垄断者价格战的概率为1。
3. 新进者:如果p_n > b^n,新进者n不进入;如果p_n < b^n,新进者n进入。如果p_n = b^n,新进者n使用混合策略——不进入的概率为1/a。
精炼一:
是完美贝叶斯均衡(PBE),也是序列均衡(SE)
本部分将给出证明
该策略组合和信念系统是序列均衡的大致思路
。要证明该策略组合和信念系统是序列均衡,必须证明其信念系统处处一致,且策略组合是序列理性的。证明了该策略组合和信念系统是序列均衡,则该策略组合和信念系统自然是完美贝叶斯均衡。
1. 信念系统处处一致
在序列均衡中,均衡路径上的信息集需要被贝叶斯定理唯一确定,而均衡路径外的信息集需要由其附近混合策略产生的信息集的极限而确定。我们先讨论均衡路径上的情况(记为情况1)。
情况1.1
:在回合n新进者没有进入;或p_n ≥ b^{n-1},垄断者对进入发动价格战(根据均衡策略组合);或p_n = 0,垄断者默许。
则:
信息集不会更新
。根据贝叶斯定理,在这三种情况中p_{n-1} = p_n。
情况1.2
:0 < p_n < b^{n-1},垄断者有默许或价格战的可能。如果该垄断者在回合n发动价格战,则根据贝叶斯定理
如果该垄断者默许,则根据贝叶斯定理,p_{n-1} = 0。
至此,我们已经验证了在平衡路径上的信念确实一致。接下来,我们讨论平衡路径外的情况(记为情况2)。
情况2.1
:p_n ≥ b^{n-1},且垄断者对进入默许(本来该价格战)。考虑此时的一个完全混合策略——弱垄断者以概率q(m)默许,新进者在回合n-1的信念p(m)。令q(m) = 1 - 1/(m+1)。当m有限时,情况2.1所描述的这个信息集会出现,且出现概率为p_n • q(m)。因此,p(m)由贝叶斯定理给出如下
即,
当m趋近于无穷时,q(m)和p(m)均趋近于 0
,且这个收敛数列由贝叶斯定理给出。
情况2.2
:p_n = 0,且弱垄断者进行价格战(本来该默许)。此时
p_{n-1} = 0
,证法与2.1相同,此处不再赘述。
至此,平衡路径外的信念也一致。综上所述,在该均衡中信念系统处处一致。
值得注意的是,平衡路径外的信息集可以被赋予其他的信念,然而其他的信念大多无法满足策略组合序列理性,除了一些看起来不太合理的情况(比如强垄断者在弱垄断者一定价格战时有概率地默许,以在一定程度上将自己与弱垄断者区分开来)。
2. 策略组合序列理性
新进者和强垄断者的序列理性非常直观。此处仅证明弱垄断者的序列理性。设弱垄断者从回合n到回合1的总期望收益是一个关于p_n的函数,v_n(p_n),其形式如下(有限时间的贝尔曼价值函数)
在此情景中,我们的思路是通过归纳法总结其性质,从回合1(最后一回合)开始解关于该价值函数的优化问题。很明显,弱垄断者在进入时一定默许。因此如果p_1 > b,v_1(p_1) = a;如果p_1 < b,v_1(p_1) = 0;如果p_1 = b,v_1(p_1) = 1/a • a = 1。
注意到当总回合数大于1时,在任何回合出现默许行为都会使得该回合的v = 0。同时观察到均衡路径上,p_n < b^{n-1}出现在最后几回合。随着不断倒推,会出现p_n ≥ b^{n-1}的情况。于是,我们开始正式归纳过程:
i. 在回合2,均衡路径上p_2 = b^2 < b。如果弱垄断者对进入使用混合策略,则v_2(p_2) = (1-1/a)(α(-1+1/a•a)+(1-α)•0 ) + 1/a•a = 1 > 0(纯策略默许或价格战的收益)。因此弱垄断者采用混合策略确实是对进入的最优反应。
ii. 在回合n,假设混合策略仍然是弱垄断者的最优反应,也就是说纯策略默许或发动价格战都会使得v_n(p_n) = 0,而混合策略使得v_n(p_n) = 1。那么,在回合n+1,假设弱垄断者价格战,则回合n新进者信念p_n = b^n。这进而会导致新进者n使用混合策略并以1/a的概率不进入。除此之外,因为p_n = b^n < b^{n-1},如果出现进入,根据之前对回合n的假设,v_n(p_n) = 1(与回合n+1默的价值相同)。因此在回合n+1,v_{n+1}(p_{n+1})为1,即弱垄断者在n+1回合采用混合策略仍是最优的。
iii. 令k=2,由归纳法可知ii对所有使用混合策略的回合n都成立。设采用混合策略的回合编号上限为k,即
iv. 对于弱垄断者对进入使用纯策略(价格战)的最后一回合(即回合k+1),根据定义必有p_{k+1} ≥ b^{k}。若p_{k+1} = b^{k},均衡路径上新进者k+1不会进入。而且不管新进者k+1是否进入,新进者k的信念一定变为p_k = b^k。则v_{k+1}(p_{k+1}) = a + 1/a • a – α(1-1/a) > 0。因此,弱垄断者在回合k+1对进入发动价格战确实使得价值函数最大化。
v. 假设在均衡路径上弱垄断者对于回合k+m (m>1)的进入使用纯策略(价格战)。根据定义,必有p_{k+m} = δ> b^{k+m}。考虑回合k+m+1,其必然满足p_{k+m+1} = δ> b^{k+m+1}。价值函数v_{k+m+1}(p_{k+m+1}) > a > 0,弱垄断者在回合k+m+1对进入发动价格战确实使得价值函数最大化。
至此,我们已经证明情况3中弱垄断者的价值函数处处取最大值,从而情况3下弱垄断者的策略组合序列理性。
综上所述,
该策略组合和信念系统是序列均衡
,也是完美贝叶斯均衡。
案例图示:
此情景中,均衡路径上的k为4
精炼二:
合理的序列均衡
命题:
如果δ≠ b^n,n = 1,2,…,N,且如果对于任意信息集,
一个新的价格战比默许带来的对强垄断者的后验信念高
(p_n(F) > p_n(A)),则上述给出的那个均衡是唯一的。
证明思路:
1. 强垄断者的价值函数是一个关于p_n的单增函数,因此强垄断者一定会对任何进入发起价格战。
2. 弱垄断者的价值函数对于n ≥ k是一个关于p_n的单增函数,因此在n≥k时弱垄断者一定会对任何进入发起价格战。在那之后,根据价值函数的性质,弱垄断者会越来越少地发起价格战以恰好将下一个新进者的信念“匹配”到p_n = b^n上,以尽可能得到最大价值(1)。
3. 如果在回合n有进入,并且垄断者发动价格战,那么新进者n-1必须在回合n-1混合,且不进入的概率为1/a。
讨论
1. Milgrom和Roberts (1982)指出,就算每个新进者都知道他们所面对的垄断者是弱的,只要这不是共识(即他们不知道别的新进者也知道垄断者是弱的),则最终的均衡中仍然会有显著的
声誉效应
(因为他们仍然害怕弱垄断者会发动价格战以对那些不知道垄断者类型的新进者维持声誉;而另一方面,弱垄断者其实知道所有新进者都知道他是弱的,但是他会通过发动价格战来装作在对付那些“不知道垄断者类型的新进者”,以在新进者群体中维持一个模糊的信念)。值得注意的是,Milgrom和Roberts的假设比本文的要更加宽松。该文章解析可以参考《JET声誉三部曲之三——掠夺、声誉和市场进入威慑》。
2. 本文发现,将N个新进者换成一个新进者N次进入,效果完全一样,均衡完全一样。
2. 本文还考虑了一个垄断者和一个新进者构成的博弈中双边不完全信息的情况。在这种情况中,
“强新进者”这类玩家被引入博弈
。作者分别讨论了离散回合和连续回合的情况,下面是这两种情况的状态空间示意图:
回合数离散
回合数连续
在两幅图中,q_n均表示垄断者对“强新进者”的信念,而p_n同之前一样是新进者对强垄断者的信念。两幅图各自被其均衡路径上的信念关系划分成了两部分。直观而言,任何“示弱”的行为(默许或不进入)都会被对方是“真弱”,从而对方的信念直接降为零,而之后只能获得完全信息下的均衡收益;相对地,任何(均衡路径上的)“强硬”行为却无法使对方认为是“真强”,而只能恰好将对方的信念“送到”均衡路径上,即图中的分解线。
另外,作者在探讨回合连续的重复博弈时发现,弱垄断者会全程对新进行为发起价格战,因为任何一个“现时理性”的行为只能带给他测度为0的现时收益,并且付出正测度的成本。从而在回合连续的重复博弈中存在(唯一合理的)混同均衡。笔者认为此处的讨论虽然模型性质优良,但不太具有现时意义。将现时收益的测度模拟为0并不合理,而应该至少持续一段测度;此外,折现系数在回合连续的重复博弈中应该扮演重要角色。
参考文献:
Koçkesen Levent (2016): "Extensive Form Games III," lecture note of Microeconomics II, Koç University.