专栏名称: Databri AI
创始人刘强出版过专著「推荐系统:算法、案例与大模型」、「构建企业级推荐系统」等。Databri AI聚焦金融、传统行业的数智化转型,提供咨询、培训、项目实施解决方案。过去3年服务过中国银联、中国移动、中盐、招商银行、广发银行等大客户。
目录
相关文章推荐
军武次位面  ·  深度解析:中国机器狗是如何赶超美国的? ·  3 天前  
苏州新闻  ·  西藏地震已致53人遇难,西部战区迅速行动 ·  4 天前  
51好读  ›  专栏  ›  Databri AI

「大模型智能体」21| 虚拟社会与模拟人生

Databri AI  · 公众号  ·  · 2024-09-05 12:40

正文

你好,我是刘强。


本课程是关于大模型智能体的实战课程,包括原理、算法、应用场景、代码实战案例等,下表是本次课程的大纲。本课是第21节,讲解智能体的社会模拟。本课约1w字,阅读时长45min。



以下是本次课程的正文:




我们在第9课中讲解了多智能体协同,通过多个智能体的对抗和协作,通常可以解决单个智能体很难解决或者做得不好的事情。第9课更多是从智能能力增补、提升维度进行讲解的。本课我们赋予智能体一定的人格、个性,通过将智能体进行拟人化,希望通过多个智能体之间进行协作,来模拟人类社会行为,目的是更好地进行社会学实践,通过在智能体模拟的虚拟社会中找到跟人类社会的共同点并发现一些潜在的“社会规律”,从而可以更好地指导个人、组织、机构进行社会实践活动(比如社会治理、法律规范、政策制定等)。本课我们从智能体拟人化的3种表现形式、构建模拟环境、社会模拟、真实案例这4个维度来展开。

21.1 智能体的拟人化

LLM的最新进展提供了类人智能新的可能。人的个性是通过社会化产生和塑造的,智能体也表现出一种通过与群体和环境的互动而发展起来的个性特质。被广泛接受的人格定义是指塑造行为的认知、情感和性格特征。接下来我们从这3个维度来观察智能体的拟人化。

21.1.1 认知能力

认知能力指的是人们通过思考、判断和解决问题来获取知识和理解的心理过程。最近的研究开始借助认知心理学的方法,探讨由大型语言模型(LLM)驱动的智能体在社会行为中的表现。这些研究运用了经典的心理学实验,通常用于判断和决策方面的研究,来测试这些智能体的表现。特别是LLM 已经通过“认知反射测试”(CRT)来评估,这个测试是用来判断它们是否能超越直觉进行深入思考。研究发现,基于 LLM 的智能体在某些情况下展现出类似于人类认知水平的智能表现。我们在第7课讲解的智能体的思考和规划,就是认知能力的一种具体体现形式。

21.1.2 情绪智能

情绪和认知能力不同,情绪涉及我们的主观感受和情绪状态,比如快乐、悲伤、恐惧和愤怒。随着大型语言模型(LLMs)技术的进步,智能系统不仅能够处理复杂的推理和认知任务,还表现出了对情绪的细腻理解。

最近的研究开始关注 LLM 的情绪智力(EI),即它们识别、解释和理解情绪的能力。当用情绪智力的标准来评估时,LLM 的情感和价值观与人类相似。此外,LLM 可以准确识别用户的情绪,甚至表现出一定的同理心。更高级的智能体还可以调节自己的情绪,适应用户的情绪反应,从而提供情感支持,这有助于情感人工智能(EAI)的发展。

LLM 在情绪智力方面的潜力越来越大,这是实现通用人工智能(AGI)的一个重要步骤。Bates 等人(参考文献1)还研究了情感建模在创建更真实、更可信的智能体中的重要性。通过发展和整合社交情感技能,基于 LLM 的智能体可能能够进行更自然的互动。

我们在前面课程中提到的GPT-4o的实时对话,智能体能够以模拟人类的语速、语气、情绪来跟用户实时互动,这就是智能体情绪智能的一种外在表现。

21.1.3 人格特质

虽然认知能力关乎思维和判断,情感涉及我们的感受和情绪体验,但“人格”这个概念通常更集中于个体独特的性格模式。为了更好地理解 LLM(大型语言模型)在个性方面的表现,研究人员使用了像“五大人格特质”和“迈尔斯-布里格斯类型指标(MBTI)”这样的框架。这些框架为我们提供了关于基于 LLM 的智能体所表现出的人格特征的重要见解。同时,研究还分析了这些智能体中可能存在的负面人格特征,揭示了它们在角色塑造上的复杂性和多样性。

最近的研究还探索了如何在基于 LLM 的智能体中创建个性化的角色。通过技术上的优化,用户可以定制这些智能体的个性,使其符合预期的性格特征和行为模式。一种常见的方法是“提示工程”,即通过简洁的指令描述所需的性格、兴趣或其他属性,这些提示帮助引导智能体的反应与角色描述相符。此外,研究人员还利用包含丰富人格数据的数据集,对 LLM 进行训练和微调,从而使这些智能体能够展现出独特的个性。

这一系列进展意味着,LLM 不仅能够理解和表达情绪,还可以根据需求呈现不同的人格特质,使得它们在与人类互动时更加自然和真实。我们在第3课中讲解的角色扮演,就是通过将智能体角色化,赋予智能体一定的人格特质。

21.2 模拟环境构建

在社会模拟中,社会不仅由单个的智能体组成,还包括智能体生活、感知和行动的环境。环境影响着智能体接收到的信息、可以采取的行动以及它们之间的互动方式。与此同时,智能体通过自己的行为和决策也会对环境产生影响。如图21-1所示,对于一个智能体来说,环境可以包括其他智能体、人类以及外部因素。环境为智能体提供了必要的资源和刺激。

在这一小节,我们将探讨几种不同类型的环境,包括基于文本的环境、虚拟沙箱环境和真实世界环境,了解它们各自的特点、优势以及可能的局限性。

图21-1:模拟智能体社会的框架。整个框架分为两部分:智能体和环境。从图中我们可以观察到:(1)左边:在个体层面,主体表现出计划、推理和反思等内化行为。它还显示了涉及认知、情感和性格的内在人格特征。(2) 中间:一个智能体和其他智能体可以组成团体并表现出团体行为,如合作。(3) 右:环境,无论是虚拟的还是真实的,都包含人类行为者和所有可用资源。对于单个智能体,其他智能体也是环境的一部分。(4) 智能体具有通过感知和行动与环境互动的能力。

21.2.1 文本环境

由于 LLM(大型语言模型)主要通过语言进行输入和输出,因此基于文本的环境成为这些智能体最自然的操作平台。这类环境是由自然语言描述构成的,不涉及其他形式的输入。智能体在这种文本世界中,通过文字来感知、推理并采取行动。

在基于文本的环境中,信息和资源通常以两种主要形式呈现:自然文本和结构化文本。自然文本使用描述性语言来传递信息,比如人物对话或场景描绘。例如,一个简单的场景可能是:“你站在一座白色房子的西边,前门有木板,门上还有一个信箱。”在这种情况下,物体的属性和位置都是通过文字描述的。另一方面,结构化文本则采用标准化格式,如技术文档或超文本。技术文档(比如JSON、XML等)通过固定模板提供关于工具使用的细节,而超文本则是通过网页或图表等将复杂信息压缩成易于理解的格式,方便智能体使用。

基于文本的环境为不同目标提供了一个灵活的框架。文本能够轻松适应多种任务,例如交互式对话和基于文本的游戏。在互动交流平台(如 CAMEL)中,文本用来描述任务、引入角色并帮助解决问题。在基于文本的游戏中,场景中的所有元素,如地点、物品、角色和动作,都是通过文字来描绘的。智能体通过输入文本命令来执行移动或使用工具等操作,同时还可以通过文字表达情感和感受,使交流更加自然。

这种文本环境不仅让智能体能够轻松应对各种任务,还为其与人类的互动增添了更多的灵活性和表现力。文本的劣势也非常明显:描述不够精确,不够直观,非常抽象。下面2种环境可以部分解决文本环境中的问题,还可以跟文本进行配合使用。

21.2.2 沙箱环境

虚拟沙箱环境为智能体提供了一个可视化且灵活的平台,帮助它们在模拟中更接近现实世界。相比于基于文本的环境,虚拟沙箱通过图形化的方式展示模拟的场景,让用户可以“看到”智能体的行动和互动。虚拟沙箱有两个主要特点:

  • 可视化:不同于纯文字描述的环境,虚拟沙箱通过视觉呈现出模拟场景。这个视觉效果可以是简单的 2D 界面,也可以是复杂的 3D 模型,取决于模拟的需求。例如,在“生成智能体(参考文献2)”的视角中,你可以看到详细的地图展示整个环境,并且每个智能体的行动都可以实时追踪。此外,通过图形化的符号,比如表情符号,直观地表示智能体的状态和动作。
  • 可扩展性:虚拟沙箱可以扩展出不同的场景和复杂的互动。智能体不仅可以在虚拟世界中移动,还可以操控环境中的物体,建造建筑物和设备,甚至创建虚拟城镇。像《我的世界》这样的游戏就提供了一个无限地形的 3D 世界,允许玩家自由建造。同样地,在这些虚拟环境中,还可以定义智能体之间的关系、互动规则和社会规范,帮助模拟复杂的社会行为。通过可扩展的设计,智能体可以适应不同的环境和行为模式,使模拟更贴近人类的偏好和行为。
这种虚拟沙箱环境让模拟更为直观,并能快速搭建不同的社会场景,帮助智能体更好地在虚拟世界中学习和互动。

21.2.3 真实世界

正如前面提到的,基于文本的环境在模拟动态环境方面有一定的局限性,而虚拟沙箱虽然可以进行模块化的模拟,但缺乏真实世界的体验。相比之下,物理环境是真实世界中的场景,包含实际的物体和空间。例如,在一个家庭的物理环境中,盘子等物品占据了真实的桌面空间。这种真实的环境要复杂得多,对基于 LLM(大型语言模型)的智能体来说,也带来了新的挑战:

  • 感官感知和处理:物理环境提供了丰富的感官输入,包括视觉、听觉和空间感知。这使得互动更加真实和沉浸式,但同时也增加了感知的复杂性。智能体需要处理这些感官信息,才能正确理解周围的环境并做出相应的反应。
  • 运动控制:与虚拟环境不同,物理空间对智能体的行动有现实中的限制。基于 LLM 的智能体生成的动作必须适应真实世界的环境。举个例子,如果一个智能体在工厂操作机械臂,它需要精准控制抓取动作,避免损坏物体。同时,智能体还需要在物理空间中移动,避开障碍物,并实时调整动作路径。

总的来说,要让智能体在真实世界中有效互动,它们需要进行专门的训练,以掌握从虚拟环境转移到现实环境的能力。这种自适应性是智能体在物理环境中成功操作的关键。

21.3 智能体社会模拟

在这部分中,“社会模拟”指的是一个动态的系统,其中智能体在一个明确设定的环境中进行复杂的互动。最近的研究主要集中在两个方向:一是探索基于 LLM 的智能体如何展现集体智慧,二是利用这些智能体来加速社会科学领域的发现。此外,还有一些研究通过模拟社会情境来生成数据,帮助研究那些罕见但复杂的人际关系问题。

基于之前的讨论,本节将介绍这些智能体社会的关键特点和运行机制,探讨我们可以从这些虚拟社会现象中学到什么,最后讨论其中可能存在的伦理和社会风险。

21.3.1 智能体社会的特性

社会模拟可以分为宏观和微观两个层面。宏观层面的模拟,也叫基于系统的模拟,侧重于整个社会系统的状态和运作方式。而微观层面的模拟,也叫基于智能体的模拟或多智能体系统(MAS),则通过对个体智能体的行为进行建模来间接模拟整个社会。随着基于 LLM(大型语言模型)的智能体的发展,微观层面的模拟最近受到了更多关注。

在本小节中,我们将“智能体社会”定义为一个开放、持续、具有场景性并且有组织的框架,智能体在这个框架中相互作用。这些特性共同塑造了模拟社会的运行方式。接下来,我们将逐一讨论这些特性,看看它们如何影响模拟社会的运作。

1. 开放性:模拟社会的一个重要特征就是它的开放性。智能体可以随时进入或退出这个环境,而不会影响整个社会的运作。环境也可以灵活扩展,添加或移除虚拟或现实世界中的资源和工具。另外,人类也可以通过扮演智能体的角色或作为这些智能体的“指导者”参与其中。这种开放性让模拟社会变得更加复杂,模糊了模拟和现实的界限。

2. 持续性:我们期望模拟社会能够持续运作。虽然每个智能体在每个时间段都自主行动,但整个社会的组织结构会一直存在,不会因为某个智能体的短暂行为而改变。这种持续性让智能体的决策和行为可以随着时间累积,形成一个不断发展的社会环境,类似于现实中的社会轨迹。

3. 场景性:模拟社会强调智能体在特定环境中的活动。这个环境可以是人为设计的或自动生成的,智能体在其中有效地进行行为和互动。智能体能够感知自己在环境中的位置,并了解周围的物体,这种感知能力帮助他们与环境进行更主动和更情境化的互动。

4. 有组织性:模拟社会遵循一个精心设计的规则框架,就像现实世界有自然规律一样。在这个框架中,智能体和环境都按照预定义的规则运作,智能体的行为受到限制,环境中的物体也只能在特定状态之间转换。这个有组织的框架保证了模拟社会的连贯性和可理解性,让整个模拟社会能够像现实社会一样有序发展。

通过这些特性,智能体社会不仅能够反映出现实世界的复杂性,还能通过模拟展示社会如何随着时间发展和变化。

21.3.2 智能体社会价值体现

在了解了智能体社会的基本运作方式后,我们进一步探讨这些虚拟社会中出现的社会现象。社会科学一直致力于研究个人、群体及其复杂互动,而基于 LLM 的智能体让我们能够更深入地观察虚拟社会的运行,从而发现新的见解。

1. 促进合作:社会模拟为我们提供了如何组织高效合作的新思路,甚至有可能改善现实世界中的管理方式。研究表明,在模拟社会中,不同背景和能力的智能体可以结合各自的优势,帮助解决复杂的问题,比如软件开发或顾问咨询。多样化的团队能够更有效地预防错误,提升团队的适应性。此外,通过智能体间的频繁互动和讨论,团队能够纠正个体错误,避免错误的思维方式主导整个团队。

2. 有效的沟通:在这样复杂的合作环境中,良好的沟通尤为重要。例如,MetaGPT 通过标准化操作程序来设计沟通方式,验证了这一方法的有效性。另一项研究发现,智能体甚至能通过自发对话合作组织活动,比如一起策划情人节派对。这展示了智能体在模拟社会中自发协作的潜力。

3. 社交网络传播:模拟社会不仅可以模仿现实世界中的情况,还能够帮助我们预测社会进程的发展。传统的研究方法依赖时间序列数据,而基于智能体的模拟提供了更可解释和内生的视角。比如,模拟中,智能体之间的关系可以通过中介建立,随后信息开始在这些关系网络中传播。研究人员还可以观察到信息传播背后的情绪变化,这同样适用于文化传播和传染病的传播研究。通过使用智能体来模拟个人行为并监测其变化,研究人员能够更深入理解这些复杂的传播现象。

4. 伦理决策和博弈论:模拟社会为研究复杂的决策过程提供了平台,尤其是那些涉及伦理和道德原则的决策。例如,在狼人游戏或谋杀悬疑游戏中,研究人员观察了智能体如何处理欺骗、信任等问题。这些决策场景与博弈论中的道德困境密切相关,比如个人利益与集体利益的平衡。通过这些模拟,研究人员可以更好地理解智能体如何优先考虑诚实、合作和公平等价值观,甚至帮助我们思考这些道德原则如何随着时间演变。

5. 政策制定和优化:基于 LLM 的智能体极大地改变了我们研究复杂社会系统的方式。在虚拟社会中,研究人员可以配置拥有不同经济偏好或政治观点的智能体,来模拟不同的经济和政治系统。这种模拟为政策制定者提供了宝贵的见解,帮助他们制定有利于社会繁荣的政策。此外,面对环境问题,我们还可以模拟资源开采、污染等情境,以预测不同政策的潜在影响,从而制定更有效的解决方案。

通过这些研究,模拟社会不仅让我们更深入地了解社会现象,还为现实世界中的决策提供了数据支持和新思路。

21.3.3 智能体社会的风险

基于 LLM(大型语言模型)的智能体驱动的模拟社会,给许多领域带来了重要的启发,从工业工程到科学研究都有它们的身影。然而,这类模拟也带来了不少需要认真对待的伦理和社会风险。

1. 意想不到的社会危害:模拟社会可能会引发一些我们没有预料到的社会问题,甚至可能引发公众的强烈反应。例如,模拟中可能出现歧视、孤立、欺凌等问题,或者在更大范围内出现压迫、奴役或对抗。这些不道德的行为甚至可能被一些别有用心的人利用,将这些虚拟实验的后果带入现实世界。因此,在开发这些模拟时,必须制定严格的道德规范和监管措施。否则,即使是很小的设计或编程失误,也可能导致严重后果,从心理上的不适到现实中的伤害。