专栏名称: 唧唧堂
唧唧堂学术管理分享平台,更好的学术阅读与写作!
51好读  ›  专栏  ›  唧唧堂

PNAS:社交媒体预测的人格特质和价值观可以帮助人们找到理想的工作 | 唧唧堂论文解析

唧唧堂  · 公众号  ·  · 2020-02-16 23:03

正文


picture from Internet

解析文章首发于唧唧堂网站www.jijitang.com
解析作者 | 唧唧堂心理学写作小组: 团子 ;审校编辑 | 悠悠


本文是针对论文《Social media-predicted personality traits and values can help match people to their ideal jobs》的一篇论文解析,该论文于2019年12月发表于《美国科学院院报(PNAS)》期刊上。本研究作者包括Margaret L. Kerna, Paul X. McCarthy, Deepanjan Chakrabarty, 和Marian-Andrei Rizoiu。


研究背景与问题提出


长期以来,学者和实践者一致认为,当一个人的个性特征与职业保持一致时,工作可以带来更多的快乐,并且这对于个人和社会来说都是有益的。然而目前最关键的问题是 如何使个人与合适的职业相匹配 ?为解决这一问题,本研究提出一种 新方法 ,通过将机器学习的方法应用于在线社交媒体(如Twitter)所提供的公开语言信息,自动评估用户的人格特征,并绘制出不同职业的人格剖面图,为个体推荐符合其人格特征的职业,从而实现社交媒体将人们与理想的职业匹配。


研究方法和结果


个性数字指纹与职业的匹配


研究假设,每个职业都有一个独特的人格剖面,即相似职业用户(如计算机程序员和科学家)会有相似的数字指纹,而不同职业用户(如计算机程序员和运动员)会有不同的数字指纹。为此,研究者首先手动整理了 9个职业共1035名用户 的数据,同时使用 IBM Watson个性洞察系统 (Personality Insights system)将用户的大五人格特质分数作为个性数字指纹。然后将同一职业的用户分组在一起,创建9个职业的大五人格特质散点图(图1A)。


图1A  9类职业用户的大五人格特质散点图


如图所示,软件程序员、科学明星和顶尖化学研究人员具有更高的开放性(深蓝色圆点表示),同时具有较低宜人性和责任心(黄色和橙色圆点表示),而网球运动员则具有较低的开放性,具有较高的宜人性和责任心。建筑师、女未来主义者和首席信息官则具有更高的开放性、情绪更稳定,更低的宜人性,而图书馆员和医生则呈现出混合特征剖面。


为进一步探索同一职业内部相似性的证据,研究者在GitHub上确定621名开源软件开发人员。通过使用生产力(用GitHub上发布和提交的帖子数量表示)和同行影响力(用他们的粉丝数量表示)对用户的影响级别进行分组:顶级贡献者,拥有超过500个帖子和超过1000个关注者;有影响力的贡献者,拥有200-500个帖子和超过1000个关注者;主流贡献者,拥有帖子0-200个,少于1000名追随者。对3个程序员组、网球专业人士和128279名用户的大五人格特质中位数进行了比较(图1B)。


图1B  软件开发者、职业网球运动员以及128279名用户平均值的大五人格特质比较



除了情绪稳定性得分相近,所有GitHub贡献者的剖面(蓝色条)和网球运动员的剖面(橙色条)在其他四个特征得分上是相反的。GitHub贡献者具有高开放性,低责任心、外倾性和宜人性,而网球运动员具有低开放性,高责任心、外倾性和宜人性。 对于顶级贡献者(深蓝色条)来说,其模式更为极端,而主流贡献者与总样本的模式相似。


基于心理特征绘制职业地图


为了给职业地图和职业预测提供一个更加稳健的数字指纹, 此次除了使用大五人格特质外,还添加了5个基本价值观,共同来代表用户的个性数字指纹。使用K-中心点聚类算法(PAM)划分出20个集群,构建出一个职业地图 (图2)。职业地图直观描绘出从数据中自动发现的20个中心点,而其他职业则聚集在这些中心点周围。图2中放大了2个集群,用以查看每个集群中的具体职业。


自动聚类产生的职业类别组合大多数与美国标准职业分类一致,但是也有一些职业出现在备选集群中。例如,护士经理与竞选者和票房经理聚集在一起,并非属于医疗集群。根据工作所需的技能,这种一致性是具有一定意义的:与竞选者和票房经理类似,护士经理必须与许多内部和外部人员合作,管理客户关系,并应对紧张时期的高压力。这样的不同分类可能捕获到职业的演变。


图2  职业地图


从个性数字指纹中预测职业


职业地图表明个性数字指纹能聚类成特定的职业集群。然而,地图的效用取决于如何准确地确定一个人的职业。对此,研究选择了10个用户最多的职业(每个职业955人)。通过训练一种机器学习算法,使用10次交叉验证,测试了5个分类器的个人职业预测准确度。然后将预测与观察到的职业进行比较,作为每个预测的正确概率。


图3A描绘出每个分类器的预测准确性。所有分类器的分类准确率都在70%以上,这表明,用户的职业确实可以从他们的个性数字指纹中成功地预测出来。与使用价值观的预测相比,使用大5预测得到的结果略为准确。使用这两组特征和来预测的准确率提高了近10%。


图3A  5个分类器预测的准确性


此外还分析了预测失败的案例。 图3B为混淆矩阵,它包含10行(表示预测值)和10列(表示实际职业)。单元格表示混淆率或观察到的职业与预测的职业相差多少倍;颜色越深表示混淆程度越大。


结果发现,校长与主管这两者容易出现混淆;数据科学家与软件工程师容易出现混淆。这是因为校长与主管、数据科学家与软件工程师这两对之间都需要相似的技巧。此外,校长与教师的混淆更常见,但混效率又并不对称。因为大多数校长在某些时候是教师,但只有一些教师能成为校长。


图3B  混淆矩阵


研究意义


首先,分析方法不是依赖自我报告评估,而是提供了一种替代方法。其次,研究结果证明了基于非认知人格特质和价值观创建职业能力地图的潜在价值。再者,聚集在一起的职业可能提供新兴工作的迹象,地图可以根据个人的个性揭示哪些新兴职业与正在消失的职业保持一致,从而可以为个人匹配新的职业。


不足与展望


本研究使用的样本由讲英语的Twitter用户组成,他们将自己的职业填写在个人资料中,并提供足够的语言数据,这种结果模式很难推广到更广泛的人群中。尽管如此,结果仍然表明将数据分析方法应用于社交媒体数据以进行实际应用的价值。类似的方法可以应用于其他平台。例如,可以开发一种服务,在服务中汇总跨多个站点的帖子,然后使用此处提供的方法来识别潜在的且合适的职业。


参考文献

Kern, M. L., McCarthy, P. X., Chakrabarty, D., & Rizoiu, M. (2019). Social media-predicted personality traits and values can help match people to their ideal jobs. Proceedings of the National Academy of Sciences of the United States of America, 116(52), 26459-26464.




解析作者: 团子


点击“阅读原文”,查阅更多作者在唧唧堂的论文解析







请到「今天看啥」查看全文