1、powerwall可以描述Facebook用户行为一组特性的经验分布
本研究发现,Facebook用户行为的12个特征都可以通过Power Wall进行描述。作者使用R2来评估模型的拟合优度:R2越接近1,模型越适合数据。图4显示了D-12数据集中六个特征的优势比分布及其线性近似。所有R2>0.97,这表明模型具有很好的适用性。所有特征及参数近似的综合列表如表5所示。
2、不管时间间隔或用户数量是多少,斜率参数ρ非常接近于1
在图5中,作者绘制了D-12数据集中捕获的2012年所有12个特征的R2和斜率ρ。近似性相当强,斜率一直接近于1。实际上,对于这三年的所有12个特征,除了仅自己可见的帖子(F9),R2的总和始终在0.95以上。这种普遍性表明,PowerWall是通过Facebook墙观察用户行为的良好模型。此外,PowerWall优势比的斜率始终在0.9-1.3的范围内,且每个特征ρ值保持不变,令人惊讶。图6显示了总体分布(F1)的这种稳定性。在左图上,我们看到三年来三个不同数据集中ρ和R2的稳定性。对这一点感兴趣,我们希望通过查看每周间隔来进一步测试。在右图上,将数据集D-12的4个月持续时间分为每周间隔,并绘制帖子总数(F1)特征的R2和斜率ρ。
3、一些用户行为令人惊讶
初步证据表明,一些facebook用户行为与PowerWall模型存在偏差,而此偏差通常是由奇怪的、往往是类似机器人的行为造成的。一些特征的R2值为0.97或更高,但用户墙的两个功能链接类型帖子(F7)和状态类型帖子(F9)具有较低的拟合度0.94。在进一步检查他们的PowerWall优势比时,作者注意到尾部数据有偏离行为。这是令人惊讶的,因为其余的数据很好地符合PowerWall模式的预期。
作者对具有更加惊人的用户行为进行了一个彻底特定调查,发现异常值来源于5类用户。作者将他们分别称为‘Insomniac’ outlier、‘Flip-flopper-1’ outlier、 ‘Flip-flopper-2’ outlier 、‘Gamer-1’ outlier 、 ‘Gamer-2’ outlier。以正常用户的数据值为参照,一般正常用户都有固定的睡眠时间以及发帖子行为中没有任何周期性。但是5类特殊用户违背了这两种特性。调查研究者发现特殊用户都会在睡眠时间内的某一时间段被唤醒,或是在某一时间段内有周期性的发帖子。经过调查这些帖子都是由第三方应用程序自动生成的。
Facebook的应用程序是由第三方开发的,是提高facebook用户体验的一种方式。用户在使用应用程序之前向应用程序授予权限,而一个此类权限允许应用程序以用户身份在固定时间段内在用户及其朋友的facebook墙上发布帖子。除非用户删除该应用程序,否则帖子将周期性的生成。
正常用户的指标如下图所示:
5类用户的具体情况如下所示:
注:1a-4a指的是用户每天发的status posts 的帖子量
1b-4b用于检测用户日常发布帖子行为中存在的任何周期性
1c-4c用于观察用户一天中发帖子最活跃的时间段。同样可以推算用户的睡眠时间。
1d-4d用于观察用户每小时(x轴)和每天(y轴)发帖子的数量