picture from Internet
本文是针对论文《智能手机中收集的行为模式数据预测人的个性(Predicting personality from patterns of behavior collected with smartphones)》的一篇论文解析,该论文于2020年07月发表于《美国科学院院报(Proceedings of the National Academy of Sciences of the United States of America)》。该研究作者包括Clemens Stachl等人。
研究背景和问题提出
来自网络社交平台的数字痕迹(“digital footprints”)能够反映人们的心理特征。
而这些特征,如大五人格,已经被证实能够预测人们的健康、政治倾向、恋爱关系、购物行为等生活和工作中的很多方面。这类数据已被证实有巨大价值,这为研究者研究人格特征提供了便利,同时也使个人隐私产生的威胁。而智能手机对个人隐私的威胁要比网络社交平台更大,它能够很容易的收集比网络社交平台更加广泛、细致的日常行为信息(如,位置、通讯记录、消费记录、媒体观看记录等)。而且很多App存在基于有限的权限(设备识别码,访问权限等)巧妙地获取完全超出必要的用户行为信息的不良行为。但智能手机用户却意识不到、也无力阻止个人隐私的泄露。
虽然一些研究提出了使用智能手机产生的行为数据与个性特征存在联系的观点。但这些研究存在不足:1.仅关注单一类型或类似的行为;2)小样本研究;3)仅研究泛泛的人格特征,不做更具体的探索;4)采用粗糙的对人格分类,而不是精细的回归预测连续的人格变化;5)倾向于高估模型性能;6)不开放数据和材料,难以重现结果;7)无法确定预测模型中变量的相对影响。
为弥补这些不足,
我们结合大五人格测试结果,使用智能手机传感器收集大量样本的不同类别的行为数据,使用线性和非线性回归模型(弹性网络、随机森林),以及机器学习等方法,这个研究主要探索三个问题。
1.个体的大五人格特质水平是否能够被通过智能手机收集6种不同类别的行为信息预测。
2.哪种行为数据更能够预测哪些人格特质。
3.每类行为数据的平均预测力如何。
研究方法
被试:
数据来自三个独立的研究,共招募743名志愿者参加研究。
数据收集流程:
大五人格维度:
采用德文版大五人格结构量表BFSI量表,评估大五人格,包括开放性、尽责性、外向性、亲和性、情绪稳定性五个维度。
智能手机使用情况的数据主要为最近30天手机记录的使用数据(25,347,089个日志事件)。原始数据以带时间戳的事件日志形式记录。包括电话、联系方式、短信、GPS等,但姓名、号码、信息内容、电话内容没有被记录。数据按特征被分为六类:1)app使用信息(游戏使用的时长);2)音乐消费(播放歌曲的平均时长);3)交流和社交行为(平均每天呼出电话数量);4)行为轨迹;5)解锁次数;6)高级别类行为(白天和夜晚的活动)
数据分析:
首先,整理数据后使用稳定的估计器对数据进行计算并分为6类;之后使用内部交叉验证循环的方式对数据进行预处理和调整,并采用外部交叉验证的方法做无偏模型评估。然后,对模型的预测性能做评价,并比较随机森林和基线模型的R2测量,比较预测模型的效果。
结果:
1. 所有的行为类别都在一定程度上能够预测个体特质分数(对大五人格的预测率达57%)。然而,社交行为(、APP使用的相关行为显示出是模型中最具显著性的因素。
2.使用线性混合模型分析发现:交流和社交行为(β= 0.027, 95%置信区间[.026, .028]),对维度和层面的预测性最高;app使用次之(β =.014,95%置信区间[.013, .015]);之后是高级别类行为(β= .013, 95%置信区间[.012, .014])、手机活动((β = .006, 95%置信区间[.005, .007])、音乐(β=.001, 95%置信区间[.000, .002])。移动的行为模式是预测大五人格效果最低的。
研究结论
1. 从智能手机传感器和日志中检测到的个人日常行为信息可以用来推断出他们的五大人格特征维度。
2. 特定的行为模式信息是关于大五人格特质的独特信息。
3. 模型能够在广义的维度水平和狭隘的层面预测开放性、尽责性、外向性这三个人格维度。
研究展望及意义
行为信息很容易被智能手机的日志中获得,更重要的是,人格的广泛和特异性能够被这些数据预测。然而,除了从信息获得人们个性的估计外,当使用更多传感器时(照相机、视频)时,预计可以获得更加准确的信息。如果将这些信息与购物历史、社会媒体的数字足迹相结合也能获得更准确的预测。
此外,不可低估个人手机使用记录泄露所带来的潜在负面影响。目前已经存在一些商业行为,其目的就是获取人们在使用应用程序时生成的行为数据。但仅有少数国家对数据的保护有法律明文规定,多数国家在个人信息安全上的法规是空白的。
最后,这个领域的工作需要机器学习、人机交互、和心理学交叉领域的研究。大规模的智能手机行为数据能够为政策制定者提供有用的信息。此外,要理解复杂的社会系统,同时保护智能手机用户的隐私,就必须采用更先进的技术和方法。此外,本研究公开了数据、材料和其他资源。
参考文献:
Stachl, Clemens, Au, Quay, Schoedel, Ramona, Gosling, Samuel D., Harari, Gabriella M., Buschek, Daniel, . . . Bühner, Markus. (2020). Predicting personality from patterns of behavior collected with smartphones. Proceedings of the National Academy of Sciences, 117(30), 17680-17687. doi: 10.1073/pnas.1920484117
解析作者:CHUNS