如何将好友同质性的影响从社交关系的影响中剥离出去?最严谨科学的方式是随机分组实验,并确保每组用户中,成为好友的用户的“同质性”在同一水平——这很难在现实中操作。
王翀教授的研究另辟蹊径,利用记录了用户间何时建立好友关系以及何时发表评论的实证数据,识别出剔除同质性影响后的“社交推动”作用。
这项研究基于来自豆瓣的数据,利用豆瓣后台记录的数据,研究者们采集了自2008年2月到8月期间存在线上社交关系的豆瓣用户(用户信息已做脱敏处理),共有286140人、200万对好友。
本项研究主要针对这些用户对书籍的评分(5分制)进行数据分析,即便缩小到书籍范围,豆瓣网仍提供了海量数据:33605名用户针对20480本书贡献了171588条评分。每一对好友关系、每一条点评,都有精确的时间记录。
研究者构建了一个因变量为“用户i对图书j的评分”的回归公式,在这个公式中,自变量包括:
• i的全部豆瓣好友在豆瓣上对这本书的公开评分,取平均值
• i与全部好友建立好友关系与i发表评分的时间先后顺序,即:要么i先和这些人建立好友关系,之后好友发表对书籍的评分,i在此影响下发表评分;要么i的非好友发表了对书籍的评分,然后i发表了评分(i可能看到了别人的评分也可能没看到),最后i和这些人建立好友关系(简化起见,假设只有这两种情况)
• 上面两个自变量的数学乘积,用来衡量两个变量的交互作用
在这个公式中,用户i对图书j的评分作为因变量存在,即代表我们假设i对书籍的评分发生在好友评分之后。这一假设无碍于实证数据的获取和分析,因为在现实中,总有用户是在好友之后发表评分,我们总能找到符合上述条件的用户。
这个实验机制之所以能剔除好友同质性的影响,关键在于豆瓣的数据库中,既能找到“先建立好友关系-好友发表评分-用户i发表评分”的数据,又能找到“陌生人发表评分-用户i发表评分-用户i和他们建立好友关系”的案例。如果豆瓣好友间仅存在品味相近的情况而没有社交关系的压力存在,那么不论前一种情形还是后一种情形,用户i的评分与他的好友们的评分的差值应该是相同的。如果社交关系确实给用户i施加了一定影响,促使i给出和好友接近的评分,那么前一种情况下,i的评分应该比后一种情况更接近于好友评分。
这项发生在真实社交网络环境里的准实验,数据验证了研究者们的假设:
社交影响用户点评的现象确实存在。用户在与他人建立好友关系后的点评,比未与他人建立好友关系时点评,更容易受到已点评好友的影响。即便考虑到好友同质性的存在,社交压力也在同质性的基础上进一步发挥作用,促使好友间的评分趋同。