这年头地上掉100块钱我都担心是讹人,不捡!但早上睁开眼微信群里有红包,手一抖就抢了,打开一看:0.01元
拼手气抢红包真的只是靠人品,靠运气?NO NO NO图样图森破,看看金融学教授们是怎么分析并且得出惊人结论的!
>>以下内容经授权转载自公众号思考者iThink(ID:iThink_1)作者:易行健 边文龙
微信自发明以来风靡华人世界,并扩展到其他国家与地区,让以前难以联系上的朋友、亲戚和同行均能够非常便捷地联系上,使用微信的用户手机上少则几个群,多则上百个群。腾讯自推出微信后又推出了微信红包,2015年微信红包成为当年春晚最别样的节目,根据微信官方提供的数据显示,除夕当日微信红包收发总量达到10.1亿次,从20点到初一凌晨零点48分这一段时间内,春晚微信摇一摇互动总量达到110亿次,微信红包给腾讯的互联网金融发展带来不可估量的洪荒之力,当然也给微信用户带来了娱乐。伴随着微信红包的迅速普及,腾讯的股价也不断攀升,比如2014年1月27日,“微信红包”正式诞生,2014年1月29日,腾讯股价上涨5.77%,当天即收获540亿港元市值的特大“红包”,并重回历史高位。
根据我们一般的理解,应该每次抢红包的金额是随机分配的,也就是说在红包总金额和红包个数给定的前提下,每位群成员抢到的红包金额的期望值相等。非常有意思的是谢宇教授(普林斯顿大学教授、北京大学“长江学者”讲座教授和“千人计划”讲座教授、美国国家科学院院士、美国艺术与科学院院士、台湾“中央”研究院院士)在北大授课期间做了一个“领红包与教授共进午餐”的实验,得出一个非常有趣的结论“领红包金额可能并非完全随机,而是与用户经历有一定的关联”。
下面我们首先简述一下该实验以及结果:红包实验共进行10次,每次发放的总金额固定为5元,每次的红包个数在27-32个之间。由于领取红包的学生为27人。每次红包领取活动中每位参与者得到的金额,是该实验关注的因变量。而该实验的核心解释变量是用户经历,也就是从注册微信账号之日起至2016年8月1日这中间经历的时间(计量单位为月)。此外,该实验还将“领取红包时是否使用的是苹果设备”作为控制变量。
该实验的结论表明:普通的最小二乘法与分位数回归结果均表明无论是否加入控制变量,“用户经历”平方项的系数都显著为负,而“用户经历”项的系数都显著为正。也就是说,红包金额与用户经历之间的关系可以用一个开口向下的抛物线去拟合,这条抛物线的对称轴都落在31-38个月之间,与之前图1的拟合曲线得出来的转折点在35个月附近也是吻合的。总结起来,领取的红包金额与用户经历之间存在先增后减的关系。对于使用微信账号时间较短的用户,其在红包领取活动中得到的金额随着其用户经历的增加而增加;但在经过一个拐点之后,随着用户经历的增加,其在红包领取活动中得到的金额会减少。
其次该实验使用了logistic回归去分别估计用户经历对于出现这两种情况的可能性的影响。结果表明,用户经历对于领到极端低值的可能性没有显著影响;但对于领到极端高值的可能性存在显著性影响,而且影响的模式同样是先增后减,可以拟合为一条开口向下的抛物线;转折点的位置也落在35个月附近。因此,该实验小组推测,在微信群聊中发放多个微信红包的情形下,各个红包的金额并非完全随机分配。但是由于微信红包背后的程序未知,所以“我们”只能够注意到这一现象;其原因可能需要从腾讯公司的程序设计中寻找。
该实验引发了以下两个问题:第一个问题是该实验结果的可靠性和稳健性如何?第二个问题是假设该实验结果基本可靠,那么问题可能出在哪个地方?
在统计学领域,有一条重要的定理有效地推动了理论计量经济学的发展:X和Y相互独立是X与Y条件均值独立的充分条件,X与Y条件均值独立又是X与Y之间线性无关的充分条件。该实验设计的这个微信红包的实验,也很好地体现了这条定理的逆否命题:如果我们发现分配金额(Y)条件于某个X(用户经验)的均值是X的函数(计量结果发现统计上具有显著性),则说明Y和X之间不是独立的,即分配金额并不是随机分配的,而是和用户经验有关。
在我们看来,该实验设计在以下两个方面有进一步改进的空间:
尤其注意:每次领微信红包的顺序
第一,选取的X(用户经验)可能并不是一个很好的解释变量。这项建议主要基于对计算机程序实现“随机分配”的思考。由计算机产生的“随机数”,其实只是“伪随机数”(pseudo random number),因为它仍然来自确定性的序列(由递推公式产生)。以Stata为例,它产生随机数的方式可以用以下公式表示:
其中,mod表示余数。根据每一个余数的值,计算机程序可以进一步分配一个比例,用这个比例乘以红包总金额,即为每个人能够抢到的金额。基于上述原理,我们认为需要尤其注意每次领取微信红包的顺序(每次微信红包发放后可以查询)。根据我们的观察和几个相关领域的学者群反馈,我们认为这个顺序很有可能是相对稳定的,即前一次微信红包发放时抢在前面的人在随后的红包发放中仍然排在前面,并且抢到红包的顺序和金额也可能有相关性。
有几个因素可能造成上述现象:
(一)人们对微信红包的热情。热情高的人每次抢红包时都会集中精力,更容易排到前面;
(二)对微信红包应用的熟悉度。对这个应用越熟悉的用户,越容易抢到前面。
(三)移动运营商的网速。假设中国移动的网速比中国联通快,那么使用中国移动网络的同学在其他条件不变的情形下更容易抢到前面。
(四)是否有辅助应用的帮助。安装了辅助应用(比如“红包神器”)的同学更容易抢到前面。如果参与人每次抢红包的顺序相对固定,则恰好与“伪随机数”产生的余数一一对应,导致的后果就是抢到较大金额的同学会集中在某个范围内。更为关键的是,每次领取微信红包的顺序与用户经验可能是高度相关的,在一定的区间内,随着用户经验的增长,对微信红包的应用更为熟悉,深知抢红包带来的“快感”,越容易抢到前面。因此,用户经验的系数在统计上显著的结果很可能体现的是更为深层次的结果:分配金额与抢红包的顺序显著相关,而这个相关性是由计算机程序生成随机数的方法决定的。基于上述逻辑,我们建议在回归中控制每次抢红包的参与人的顺序,并观察对应的“用户经验”是否仍然显著。
建议进一步扩大样本:
第二,样本的数量。我们注意到,参与人只有27位,虽然微信红包的实验重复进行了10次,相当于用Bootstrap的方法增加了样本容量,但总共的观察值也只有270个。更为重要的是,基于我们前面的逻辑,每次抢红包的参与人的顺序可能是比较稳定的,造成了10次实验之间是高度相关的,无法满足基本回归中独立同分布的假设。此外,扩大样本容量能够显著增加每次抢红包的顺序的波动性,增加回归结果的可信性。因此,我们建议进一步扩大样本,观察最初的发现是否仍然成立。
不过该实验至少提出了一个很好的问题,并且至少表明红包金额大小与微信用户使用微信时间长短之间存在非线性的关系,当然这一结果的可靠性和稳健性还需要进一步检验。那么接下来可能需要扩大样本数量来进行该项实验,并且考虑更多的控制变量来进一步证实“微信群聊中发放多个微信红包的情形下,各个红包的金额是否完全随机分配”。如果腾讯研究院能够提供大数据给谢宇教授实验小组或腾讯研究院能够自己来验证,那就更好了,假设在现有技术与数据框架下依然得到“微信群聊中发放多个微信红包的情形下,各个红包的金额并非完全随机分配”这一结论,那么需要怀疑微信红包产生随机数的技术是否存在bug或更深层次的原因了。
注:本评论仅代表个人想法,与作者所在单位没有任何关系,写作时受到多个学者群和朋友群讨论的启发,这里不再一一致谢。
>>以上内容经授权转载自公众号思考者iThink(ID:iThink_1)作者:易行健 边文龙