专栏名称: 量化研究方法
以量化之思想认识世界,体会量化之美。
目录
相关文章推荐
河北卫视  ·  河北卫视《每周要情》第2024046期 ·  3 天前  
河北卫视  ·  《走遍河北》特别策划:依保租房 托安居梦 ·  5 天前  
51好读  ›  专栏  ›  量化研究方法

读书会第三期|《计算社会学》

量化研究方法  · 公众号  ·  · 2024-03-16 18:55

正文

前两期读书分享会的成功举办,不仅为同学们打开了书籍分享与交流的空间,也营造了良好的阅读氛围。11月15日下午,人文学院“暨南社会学读书会”第三期在贾小双老师的主持下顺利开展。本期读书会的分享书目是《计算社会学》,由2023级社会学研究生吴昊和黎焰欣同学进行主讲。


认真读一本书
  book   

《计算社会学》





1




黎焰欣同学首先简要介绍了本书的作者马修·萨尔加尼克。马修·萨尔加尼克是普林斯顿大学的社会学教授,他的研究领域广泛且深入,涵盖了计算社会科学和社交网络等多个方面。《计算社会学》作为他的畅销书之一屡获殊荣,其本人也被学界誉为“纯粹的计算社会学家”。本书的写作背景为我们当前所处的大数据时代,在这个时代中,我们大量的信息被政府、企业等机构以数字化的形式获取及储存,然而,面对海量的数据,社会科学研究者应该如何利用?理论范式如何与大数据间搭建起有效的联系?这是未来社会科学研究亟待推进的方向,也是本书重点讲述的内容。全书共七个章节,在前两章中,作者先对大数据的特征与研究价值进行总结,为后文提供方向性的概括和指引。其后,作者重点介绍了大数据时代下如何开展调查研究、实验研究以及大规模协作,生动案例与专业理论相结合的叙述方式既引人入胜又“干货满满”。最后,作为大数据时代下社会科学研究的热点话题,道德伦理问题也纳入了本书的讨论范围,作者认为,在道德义务论所关注的过程以及结果主义者关注的结果之间,共同道德准则和标准的制定尤为关键,在此基础上,社会科学研究者应采取基于原则的思维方式平衡大数据研究的利弊以更好地开展大数据研究。

随后,吴昊同学分享了本书的重要章节,即大数据时代下的调查研究。从传统的社区实地调查到上世纪70年代广泛使用的电话调查,再到如今计算机管理下的调查,数字技术的变革为调查研究人员创造了越来越多的机会,使他们能利用大数据资源放大调查数据的价值,以更低的成本、更快的速度搜集数据,并提出不同类型的问题。在作者看来,尽管大数据调查起步较晚且提升空间广阔,但研究者仍需顺应技术和社会的发展变化,在汲取前两个时代的智慧的基础下学习大数据调查研究方法。在具体介绍研究方法前,作者先总结了调查研究在前两个时代发展起来的调查误差总框架,并认为该框架对于数字时代的调查研究仍有重要的指导意义。紧接着,作者以数字时代下“概率抽样”方法的实践困境为引,分析了“非概率抽样”方法在发展中不断凸显的优势,并用“Xbox样本预测美国大选结果”为例进行深入探讨。在本章的后半部分中,作者以生动有趣的研究实例分享了几种主要的大数据调查研究方法,包括将研究融入被调查者日常生活的生态瞬时评估法、调查问题形式的开放度极高的维基调查法,以及使问题回答过程更愉快的游戏化方法,多方面、多维度地展现了大数据调查方法的魅力。除此之外,作者还提到了两种将传统调查数据与大数据资源结合的方法,包括丰富型提问和扩充型提问。在这两种方法中,两种数据互为增加与补充,使研究内容更丰富、视角更多元。

与调查研究以并非有意地、系统地改变世界的情况下进行数据采集不同,开展实验会系统性地干预世界,以创造出最适合因果关系问题的数据。在模拟时代,社会科学研究者们囿于诸多混杂因素,只能从现有数据中寻找数据所呈现出的相关性,而在数字时代,研究者们不仅可以开展大规模实验,还能利用数字实验的特殊性提高效度,评估处理效应的异质性,以对实验原理进行更为透彻的分析。在本章中,作者首先基于维基百科的“谷仓之星”实验说明了实验的基本逻辑。接着,作者阐述了实验的两个维度,即实验室—实地实验以及模拟—数字实验,并认为在大规模范围内,数字实地实验使研究者能将实验室实验对实验过程的严格控制和实地实验更自然的实验环境相结合,极大地丰富社会科学研究的维度。随后,作者介绍了进行实验设计的三个重要概念:效度、处理效应的异质性和原理,并为研究者提供了几种自行开展或与有能力的公司合作开展实验的主要策略及建议,使研究者能对数百万计的研究对象进行干预时,明确作为研究者的责任所在。

数字时代不仅创造了新的实验方式,也使许多新的协作形式成为可能。在具体讲述本章内容前,作者先向读者抛出了一个问题:有哪些重大的科学问题,尤其是我们无法单独解决的问题,是现在通过协作能够解决的?当前,科研协作已成常态,然而数字时代使我们能够接触数量更多、更多样化的人,能与全世界能够上网的数十亿人进行协作。这就犹如将100名研究助理与10万名熟练的协作者相比,后者的优势是巨大且明显的。大规模协作项目具体有三种类型,包括人本计算、公开募集和分布式数据采集。以人本计算项目为例,其解决的是宏大问题,但通过将问题分解、问题发布与问题整合三个环节,就能实现那些凭一己之力无法完成的研究。对此,作者以星系动物园(Galaxy Zoo)这一经典的人本计算实验为例,讲述了研究者如何利用10万名志愿者协助天文学家对100万个星系进行了分类,该实验在保证分类准确度有所保障的前提下还发现了全新的星系,侧面展现了大规模协作在社会科学研究中的广阔前景。








2



同时,贾小双老师也基于自身丰富的计算社会学学习和研究经验,为同学们分享了她对计算社会学的理解。计算社会学包含两大研究范式。其一是大数据分析范式,即从互联网、物联网等一大数据生产源中获得规模大、时空跨度大、来源多、范围广、多元化的人类真实互动的资料,并使用机器学习等方法对数据进行提取、挖掘和分析,从而验证或者构建社会理论。《计算社会学》这本书便是从大数据分析范式角度来对计算社会学进行介绍。大数据时代,除数据之外,本书未详细展开的用于数据分析和数据再生产的“算法”也是大数据研究的重要议题。其中,算法是否产生“过滤气泡”“信息茧房”“回音壁”效应是学者争论的焦点。小双老师围绕这一问题分享了一项关于算法推送异质性的研究——《透视算法黑箱:数字平台的算法规制与信息推送异质性》(刘河庆,2023)。该研究针对“算法是否不断迎合个体喜好而过度推送特定类型的信息,从而将用户锁定在单一、狭窄的过滤气泡之中”这一问题,展开了一项在线实验,通过设置若干虚拟账号与数字平台进行长时间真实互动,以尝试真正进入算法的政治化空间,分析算法规制对用户信息获取异质性的影响。研究发现,数字时代算法规制的高度复杂化、精细化和隐蔽化:仅从主题上来看,算法增加了个体获得多样化主题信息的机会,但进一步深入到推荐信息的语义层面,算法强化了过滤气泡效应,出现信息推送的窄化和固化,用户只被推送特定语义维度的信息。

计算社会学的另一大范式是基于多主体模型(Agent-based Models)进行复杂系统建模的社会模拟范式,研究者借助计算机模拟仿真建模,通过模拟微观个体间、个体与环境间的互动对其涌现的宏观社会现象进行分析和研究,这是计算社会学早期的研究范式,在本书中并未涉及。因此,为拓展同学们对于计算社会学的认知,小双老师分享了她所开展的基于社会模拟范式的研究——基于多主体仿真的受访者驱动抽样方法评估 。受访者驱动抽样(Respondent-driven Sampling,RDS)是一种针对隐藏人口(如非法移民,性少数群体等)的一种抽样方法,由于隐藏人口总体分布未知,且难以接触,难以使用概率抽样法进行抽样,而RDS基于隐藏人口的社交网络,以类似滚雪球的方式进行抽样。这种基于网络的非概率抽样可能会受到隐藏人口网络结构的影响,但这一假设很难在现实中进行验证,因此她使用多主体仿真建模(Agent-based Modeling,ABM)的方法建构出不同结构下的隐藏人口社交网络,并模拟RDS的抽样过程,通过分析不同网络结构下的样本构成来分析网络结构对RDS抽样结果的影响。

随着老师和同学们精彩的分享与讨论,读书会在不知不觉中已接近尾声。诚然,由于融合了计算机领域的学科背景,本书涉及的知识略显复杂与晦涩,但在本书最后一页作者写道:社会研究的未来将是社会科学与数据科学的结合,这提醒着作为社会学研究者的我们,需顺应时代发展潮流,以前沿视野提升思维活跃度,用数据方法增强科学洞察力,不断丰富学科能力,以“计算社会学”为窗,打开我们学术研究之路更多的可能性。