图源:MIT Technology Review。https://www.technologyreview.com/2019/04/29/135578/ai-researchers-want-to-study-ai-the-same-way-social-scientists-study-humans/集智俱乐部联合美国东北大学博士后研究员杨凯程、密歇根大学安娜堡分校博士候选人裴嘉欣,宾夕法尼亚大学沃顿商学院人力资本分析研究组博士后研究员吴雨桐、即将入职芝加哥大学心理学系的助理教授白雪纯子,共同发起「大语言模型与计算社会科学」读书会,于3月24日起每周日晚上20:00-22:00探究大语言模型、生成式AI对计算社会科学领域带来的新思想新价值。
以大模型为代表的人工智能技术正在深刻地改变我们的社会和生活,从自动语法纠正,到虚拟伴侣,再到公共政策的决断,人工智能技术已经被广泛地应用到了我们生活的方方面面。在一次次被新的技术能力所惊艳的同时,我们也往往会自然而然地产生许许多多的问题。比如,大模型会像人一样思考吗?我们多大程度上可以信任AI生成的内容?AI会改变人们日常交流的方式吗?如果你在生活中有过类似的困惑,希望了解到更多关于人工智能与社会相关的前沿话题,又或者你是一个研究人员,希望了解到更多将人工智能和自己的研究方向结合的方式,欢迎参加本次读书会。我们会基于人工智能,心理学,传播学,管理学等多个学科的最新研究,和你一起去思考和探究这些和我们生活息息相关的问题。我们也许无法回答目前所有的问题,但是希望这个读书会可以成为一个引子,引领你去思考更多关于AI&Society相关的问题。
在计算社会科学读书会第一季、第二季中,我们主要从计算社会科学的方法以及几个大的分支展开。过去一年中人工智能技术的蓬勃发展为计算社会科学研究带来了全新的问题,机遇和挑战。本次读书会就围绕人工智能技术和计算社会科学之间的交叉展开,涉及到传播学,心理学,管理学,计算机科学等多个学科。通过本次读书会的学习,我们希望你能够了解到关于人工智能和计算社会科学方面最前沿的研究话题,和其他志同道合的朋友进行深入的探索和交流,并且获得更多研究的思路和兴趣。
计算社会科学作为一个跨学科前沿领域,与复杂科学密切相关。它以社会经济复杂系统为主要研究对象,采用大数据、人工智能等综合方法来研究社会现象,并寻求从海量人类行为数据中挖掘模式,建立预测模型与理论。面对多层次(从个体到群体)、非线性、动态的社会系统,复杂科学提供了一系列研究方法,包括动力系统、网络分析、多主体建模等。而随着以大语言模型为代表的人工智能技术大幅提升,传统的复杂系统研究方法也正在快速革新,进一步推动计算社会科学领域的范式转换。
裴嘉欣是密歇根大学安娜堡分校信息科学博士候选人,研究方向为计算社会科学和自然语言处理,致力于构建新的自然语言处理模型来分析大规模人类行为,相关成果发表于ACL, EMNLP, WWW等会议。个人主页:https://jiaxin-pei.github.io/。吴雨桐是宾夕法尼亚大学沃顿商学院人力资本分析研究组博士后研究员。博士毕业于美国西北大学媒介、技术与社会项目。她目前的研究方向是远程工作和混合工作模式对团队、组织、以及劳动力市场的影响。白雪纯子是普林斯顿大学心理学系的博士候选人,同时隶属于公共与国际事务学院、认知科学项目以及统计与机器学习中心。她研究动态社会心智,即个体决策过程与社会现象在社会认知领域的相互作用。她当前的工作探索社会刻板印象的心理学起源。白雪纯子将于2024年7月加入芝加哥大学心理学系担任助理教授。个人主页:https://www.xuechunzibai.com/。杨凯程,美国东北大学博士后研究员,研究领域为计算社会科学,致力于解决社交媒体上的机器人和虚假信息传播问题,以及研究生成式人工智能在这些领域中的滥用和应用。研究成果曾被包括 CNN,BBC,The New York Times 在内的众多知名媒体报道。个人主页:https://www.kaichengyang.me。本季读书会运营负责人介绍:
汪馨玥,密歇根州立大学硕士,兴趣领域:计算社会科学,媒介神经科学,复杂科学。个人主页:
https://xinyuewang.website/。
报名方式
- 第二步:填写信息后,付费299元。支付方式可选微信、支付宝两种。如需用支付宝支付,请在PC端进入读书会页面报名支付:https://pattern.swarma.org/study_group/40
- 第三步:添加负责人微信,拉入对应主题的读书会社区(微信群)。
本读书会可开发票,请联系相关负责人沟通详情。
本读书会适合参与的对象
- 跨学科研究者:那些在人工智能、心理学、传播学、管理学、计算机科学等领域工作或研究的学者和专业人士,对探索AI技术与社会科学相结合时的新问题、新机遇和新挑战充满热情。
- 科研工作者:一线的科研人员,特别是那些对探索人工智能(AI)与社会科学交叉应用感兴趣的学者。这包括但不限于研究人工智能在社会科学领域中的模型、方法以及其对社会行为、决策过程、经济模式、政策分析等方面的应用。科研工作者通过参与读书会,可以深化对AI在社会科学领域内的理解,并探讨如何将这些技术应用于自己的研究中,以解决社会科学问题,提高研究的效率和质量。
- 深度探讨者:对读书会讨论的主题和文献充满热情、愿意深入挖掘每一个话题的参与者。我们欢迎参与者贡献和分享有洞察力的文献、研究成果和创新的研究主题,希望通过与其他参与者的交流和讨论,共同发现新知识、新视角和新方法。
- 学术成长者:对于处于学术旅程任何阶段的参与者,可以通过参与读书会的讨论和活动,获取新的知识、技能和视角,拓宽学术视野,进行跨学科交流,与其他参与者共同成长。
本季读书会是一个为对AI与社会科学交叉领域感兴趣的人们提供的学习和交流平台,我们期待着每一位充满好奇心和探索精神的朋友的加入,共同探讨人工智能如何与社会科学相结合,共同成长。
本读书会谢绝参与的对象
为确保专业性和讨论的聚焦,本读书会谢绝脱离读书会主题和复杂科学的空泛的、哲学和思辨式讨论;不提倡过度引申在社会、人文、管理、政治、经济等应用层面的讨论。我们将对参与人员进行筛选,如果出现讨论内容不符合要求、经提醒无效者,会被移除群聊并对未参与部分退费。一切解释权归集智俱乐部所有。
运行模式
本季读书会涉及4个模块,按暂定框架贯次展开,也会根据实际情况进行调整;
每周进行线上会议,由 1-2 名读书会成员以PPT讲解的形式领读相关论文,与会者可以广泛参与讨论,会后可以获得视频回放持续学习。
举办时间
- 从 2024 年 3 月 24 日开始,北京时间每周日晚上 20:00-22:00,持续时间预计10 周。我们也会对每次分享的内容进行录制,剪辑后发布在集智斑图网站上,供读书会成员回看,因此报名的成员可以根据自己的时间自由安排学习时间。
- 自活动举办后任一时间均可加入,在活动结束后加入将无法享受直播权益,其他权益不变。
参与方式
此次读书会为线上闭门读书会,采用的会议软件是腾讯会议(请提前下载安装)。在扫码完成报名并添加负责人微信后,负责人会将您拉入交流社区(微信群),入群后告知具体的会议号码。
加入社区后可以获得的资源
- 交互式播放器高效回看:快速定位主讲人提到的术语、论文、大纲、讨论等重要时间点
- 高质量的主题微信社群:硕博比例超过80%的成员微信社区,闭门夜谈和交流
- 超多学习资源随手可得:从不同尺度记录主题下的路径、词条、前沿解读、算法、学者等
- 参与社区内容共创任务:读书会笔记、百科词条、公众号文章、论文解读分享等不同难度共创任务,在学习中贡献,在付出中收获。
- 共享追踪主题前沿进展:在群内和公众号分享最新进展,领域论文速递
参与共创任务,共建学术社区
- 诺奖之后的复杂科学:18位学者勾勒未来20年复杂系统研究图景
- 众里寻一:从复杂性中探索普适规律
- 多主体智能综述:社会互动启发的人工智能进化
- 涌现:21世纪科学的统一主题
- 梅拉妮·米歇尔Science刊文:AI能否自主学习世界模型?
- 模块化认知:演化如何自下而上涌现出智能?
- AI何以涌现:复杂适应系统视角的ChatGPT和大语言模型
- 当机器学习遇见拓扑:拓扑数据分析与拓扑深度学习
- 探索“AI 大统一理论”:科学启发的机器学习理论
PS:具体参与方式可以加入读书会后查看对应的共创任务列表,领取任务,与运营负责人沟通详情,上述规则的最终解释权归集智俱乐部所有。
阅读材料较长,为了更好的阅读体验,建议您前往集智斑图沉浸式阅读,并可收藏感兴趣的论文。
Human-AI interaction
AI Help and influences human communications
Jess Hohenstein, Rene F. Kizilcec, Dominic DiFranzo, et al. Artificial intelligence in communication impacts language and social relationships. scientific reports, 2023, 13(1): 1-9.
这篇论文研究了人工智能对于人际交流的影响,为我们理解技术与社会互动之间的关系提供了有益的见解。本文有针对性地研究算法生成的回复建议(“智能回复”),发现使用这类算法回复可以提高人们的沟通效率、增加积极情感语言的使用,并且能够进一步提高对方对于谈话人的感知。。
Liu, R., Yen, H., Marjieh, R., Griffiths, T. L., & Krishna, R. (2023). Improving interpersonal communication by simulating audiences with language models. arXiv preprint arXiv:2311.00687.
这篇论文的核心问题是如何使用大语言模型来模拟不同听众从而改善人们之间的人际交流。论文的核心贡献在于提出了一种通过模拟听众来生成回复的方法,以增强沟通效率和改善人际感知。此外,该研究还为改进自然语言处理模型在人际沟通中的应用提供了有益的思路和启示。
Improving and understanding Human-AI interaction
Wu, T., Terry, M., & Cai, C. J. (2022, April). Ai chains: Transparent and controllable human-ai interaction by chaining large language model prompts. In Proceedings of the 2022 CHI conference on human factors in computing systems (pp. 1-22).
该论文提出了将大型语言模型(LLM)步骤串联起来的概念,以解决LLM在复杂任务中的局限性,并开发了交互式系统进行链式处理。研究表明,链式处理不仅提高了任务结果的质量,还增强了系统的透明度、可控性和合作感。
Xie, Yutong, et al. "A prompt log analysis of text-to-image generation systems." Proceedings of the ACM Web Conference 2023. 2023.
该论文对大规模文本到图像生成系统的提示日志进行了首次全面分析,类似于对Web搜索引擎查询日志的分析,发现了用户信息需求的独特模式和行为差异,并提出了改进文本到图像生成系统的具体建议。
Zhou, K., Hwang, J. D., Ren, X., & Sap, M. (2024). Relying on the Unreliable: The Impact of Language Models' Reluctance to Express Uncertainty.
该研究调查了语言模型如何通过自然语言表达其回复的不确定性以及用户对不确定性的反应,发现语言模型通常无法有效表达不确定性,用户也很难区分自信和不确定的回复,这突显了人工智能与人类交互中的安全问题,并提出了设计建议和缓解策略。
AI for Social Research
AI 会彻底改变社会科学研究吗?
以 ChatGPT 为代表的生成式 AI 为社会科学的研究带来了很多机遇和可能。在过去的一年多里,我们一方面能看到很多以 AI 代替研究对象或者研究工具的新尝试,另一方面来自学界的反对声也不绝于耳。本次读书会,我们将围绕这个主题阅读相关文献并展开讨论。
因为大语言模型能够如同人类一般进行交流,并对各种提问做出不同的回答,不少研究者开始探究用 AI 来替代传统社会科学研究中的研究对象的可能,并产生了不少积极的发现。另一方面也有不少学者基于各种原因对此种尝试表示反对。那么,计算社会科学学者是否应该顺应这一趋势,使用 AI 替代研究对象呢?如果答案是确定的,那么应该构造一个怎样的新范式呢?如果答案是否定的,那么理由是什么?下面是一些相关研究:
Ruoxi Xu, Yingfei Sun, Mengjie Ren, et al. AI for social science and social science of AI: A Survey. arXiv:2401.11839, 2024 https://arxiv.org/pdf/2401.11839.pdf
这是一篇综述性论文,探讨了人工智能(AI)与社会科学交叉领域的相关问题。通过将AI视为社会实体进行研究,以更好地理解AI在社会中的角色和影响,旨在探讨AI技术在社会科学研究中的应用,以及将AI作为社会实体进行研究的社会科学视角。
Argyle, L. P., Busby, E. C., Fulda, N., Gubler, J. R., Rytting, C., & Wingate, D. (2023). Out of one, many: Using language models to simulate human samples. Political Analysis, 31(3), 337-351. https://doi.org/10.1017/pan.2023.2
本文是使用生成式 AI 代替人类样本的代表性工作,并提出了“硅基样本”的概念。注意此工作开始于 ChatGPT 发布之前,所以使用了 GPT-3 模型。此外也推荐阅读 Kevin Munger 对此类研究的回应:I strongly feel that this is an insult to life itself (https://kevinmunger.substack.com/p/i-strongly-feel-that-this-is-an-insult)
Agnew, W., Bergman, A. S., Chien, J., Díaz, M., El-Sayed, S., Pittman, J., ... & McKee, K. R. (2024). The illusion of artificial inclusion. arXiv preprint arXiv:2401.08572. https://arxiv.org/abs/2401.08572
本文回顾了现有文献中关于使用 AI 来代替研究中人类参与者的工作,列举讨论了这一方法的优点以及存在的问题。
Wang, A., Morgenstern, J., & Dickerson, J. P. (2024). Large language models cannot replace human participants because they cannot portray identity groups. arXiv preprint arXiv:2402.01908. https://arxiv.org/abs/2402.01908
这篇文章论证了大型语言模型无法替代人类参与者进行计算社会科学、用户测试、标注任务等领域的工作。
除了使用 AI 来替代研究对象以外,过去一年的另一大趋势是将大模型视作数据标注工具,进而替代人工。一方面,不少结果都显示大模型具备超出以往机器学习工具并接近人类的表现,另一方面,这一尝试也面对诸多挑战。那么,大模型给计算社会科学研究带来了怎样的新可能呢?学者们又该如何有效地使用这一强大的新工具呢?下面是一些相关研究:
Gilardi, F., Alizadeh, M., & Kubli, M. (2023). ChatGPT outperforms crowd-workers for text-annotation tasks. PNAS, 120 (30) e2305016120. https://doi.org/10.1073/pnas.2305016120
本文使用 ChatGPT 进行文本数据标注,并和 MTurk 的人工标注进行了对比,发现 ChatGPT 标注的结果更好并且费用更低。
- Pezeshkpour, P., & Hruschka, E. (2023). Large language models sensitivity to the order of options in multiple-choice questions. arXiv preprint arXiv:2308.11483. https://arxiv.org/abs/2308.11483本文发现大语言模型在回答多选题时,答案的顺序会影响结果。。
- Törnberg, P. (2024). Best Practices for Text Annotation with Large Language Models. arXiv preprint arXiv:2402.05129. https://arxiv.org/abs/2402.05129
本文从社会科学研究者的视角提供了一系列使用大语言模型进行文本数据标注的建议。
参考阅读:
Kim, J., & Lee, B. (2023). AI-Augmented Surveys: Leveraging Large Language Models for Opinion Prediction in Nationally Representative Surveys. arXiv preprint arXiv:2305.09620. https://arxiv.org/abs/2305.09620
Ziems, C., Held, W., Shaikh, O., Chen, J., Zhang, Z., & Yang, D. (2023). Can Large Language Models Transform Computational Social Science?. arXiv preprint arXiv:2305.03514. https://arxiv.org/abs/2305.03514
Tan, Z., Beigi, A., Wang, S., Guo, R., Bhattacharjee, A., Jiang, B., ... & Liu, H. (2024). Large Language Models for Data Annotation: A Survey. arXiv preprint arXiv:2402.13446. https://arxiv.org/abs/2402.13446
Lin, H., Luo, Z., Wang, B., Yang, R., & Ma, J. (2024). GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse. arXiv preprint arXiv:2401.01523. https://arxiv.org/abs/2401.01523
Tang, Y., Bi, J., Xu, S., Song, L., Liang, S., Wang, T., ... & Xu, C. (2023). Video understanding with large language models: A survey. arXiv preprint arXiv:2312.17432. https://arxiv.org/abs/2312.17432
- Veselovsky, V., Ribeiro, M. H., Cozzolino, P., Gordon, A., Rothschild, D., & West, R. (2023). Prevalence and prevention of large language model use in crowd work. arXiv preprint arXiv:2310.15683. https://arxiv.org/abs/2310.15683
生成式AI会如何改变信息媒介?
生成式 AI 的出现会从根本上改变人类的信息系统。本次读书会,我们将着眼于社交媒体和虚假信息传播问题,一起阅读相关文献,以便理解生成式 AI 技术已经带来的影响,并试图去展望信息媒介未来的发展方向。
相较于传统媒体(如电视、广播),社交媒体(如微博、Twitter)可以将个体直接连接,并形成一个巨大且复杂的社交网络,使得丰富的信息可以高速传播。此外,一些社交媒体平台也引入了诸如热搜(微博)和推荐信息流(抖音)等算法驱动的信息聚合机制,进一步影响着用户所能获取的信息。而生成式 AI 的出现可能会从各个角度对社交媒体进行改造。由于这些 AI 模型具备强大的内容生成能力,并可以根据用户的喜好进行有针对性的调整,其大范围应用和滥用可能会瓦解现有的社交网络。而最新的文献也表明生成式 AI 模型具备强大的信息总结和推荐能力,可能会进一步影响信息媒介系统中信息的分发。这里我们通过阅读一些相关文献来对此话题进行展望和讨论:
Ayers, J. W., Poliak, A., Dredze, M., Leas, E. C., Zhu, Z., Kelley, J. B., ... & Smith, D. M. (2023). Comparing physician and artificial intelligence chatbot responses to patient questions posted to a public social media forum. JAMA internal medicine. https://doi.org/10.1001/jamainternmed.2023.1838
本文使用 ChatGPT 对社交媒体平台上的医疗问题进行回答,并将其结果与人类医生的回答进行对比,发现 ChatGPT 能够提供高质量的回答。
Yang, K. C., & Menczer, F. (2023). Anatomy of an AI-powered malicious social botnet. arXiv preprint arXiv:2307.16336. https://arxiv.org/abs/2307.16336
本文分析研究了首例由 ChatGPT 驱动的恶意社交机器人账号网络。
Liu, D., Yang, B., Du, H., Greene, D., Lawlor, A., Dong, R., & Li, I. (2023). RecPrompt: A Prompt Tuning Framework for News Recommendation Using Large Language Models. arXiv preprint arXiv:2312.10463. https://arxiv.org/abs/2312.10463
本文提供了一个使用大语言模型进行新闻推荐的框架。
大语言模型的出现也为虚假信息传播问题带来了新的挑战和机遇。一方面,恶意份子可以使用这些工具快速、大量地生成高质量的虚假信息,而这一可能性给很多国家的群众带来了极大的焦虑。另一方面,最近的研究也指出大语言模型可以被用来识别这些信息并进行辟谣,可能会成为我们对抗虚假信息问题的新工具。这里我们通过阅读相关文献来从不同角度对这一问题进行探讨:
Giovanni Spitale et al., AI model GPT-3 (dis)informs us better than humans.Sci. Adv.9,eadh1850(2023). https://doi.org/10.1126/sciadv.adh1850
本文通过实验的方式发现 GPT-3 模型可以生成可信的虚假信息。
Hanley, H. W., & Durumeric, Z. (2023). Machine-Made Media: Monitoring the Mobilization of Machine-Generated Articles on Misinformation and Mainstream News Websites. arXiv preprint arXiv:2305.09820. https://arxiv.org/abs/2305.09820
本文通过对大量新闻网站内容的分析发现,AI 生成的内容尤其是虚假信息的数量在 ChatGPT 发布以后增长迅速。
Simon, F. M., Altay, S., & Mercier, H. (2023). Misinformation reloaded? Fears about the impact of generative AI on misinformation are overblown. Harvard Kennedy School Misinformation Review, 4(5). https://misinforeview.hks.harvard.edu/article/misinformation-reloaded-fears-about-the-impact-of-generative-ai-on-misinformation-are-overblown/
本文试图论证人们可能过分担心生成式 AI 对于虚假信息问题带来的影响。
DeVerna, M. R., Yan, H. Y., Yang, K. C., & Menczer, F. (2023). Fact-checking information generated by a large language model can decrease news discernment.. arXiv preprint arXiv:2308.10800. https://arxiv.org/abs/2308.10800
本文通过实验的方式测试了 ChatGPT 作为辟谣工具的效果,发现其虽然能在很大程度上识别出虚假信息,但对于实验参与者的影响并不总是正面的。
参考阅读:
Hosseinmardi, H., Ghasemian, A., Rivera-Lanas, M., Horta Ribeiro, M., West, R., & Watts, D. J. (2024). Causally estimating the effect of YouTube’s recommender system using counterfactual bots. Proceedings of the National Academy of Sciences, 121(8), e2313377121. https://doi.org/10.1073/pnas.2313377121