专栏名称: 将门创投

将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。

Talk预告｜上海交通大学庞祥鹤：大模型社会模拟器MATRIX，价值对齐胜过GPT4

将门创投 · 公众号 · 科技创业 · 2024-07-23 08:22

主要观点总结

本文介绍了在TechBeat人工智能社区的第611期线上Talk中，上海交通大学博士生庞祥鹤将分享关于大模型社会模拟器MATRIX的研究。该模拟器能够模拟语言模型答案的社会影响，并允许语言模型在模拟社会中自我评估并修正行为。这项研究已入选ICML 2024 SpotlightTalk，并与GPT4进行了对比，表现出超越GPT4的性能。

关键观点总结

关键观点1: 大模型社会模拟器MATRIX的介绍

庞祥鹤将介绍他搭建的社会模拟器MATRIX，该模拟器能够模拟语言模型答案的社会影响，并允许语言模型在模拟社会中自我评估并修正行为。

关键观点2: 社会模拟器MATRIX的价值

社会模拟器MATRIX的价值在于确保大语言模型与人类价值观对齐，这对于语言模型的安全性至关重要。

关键观点3: 社会模拟器MATRIX的理论分析和实验结果

理论分析表明，社会场景模拟能够生成更具针对性和相关性的反思，从而超越基于预定义规则的Constitutional AI，产生更加对齐的回答。实验结果显示，社会模拟加持的13B模型在针对有害问题的回答上超越了GPT-4。

关键观点4: Talk的内容和大纲

Talk将包括大语言模型对齐介绍、社会模拟器MATRIX的介绍、基于社会模拟的自我对齐方案、相关实验以及嘉宾介绍等环节。

关键观点5: TechBeat人工智能社区的简介

TechBeat人工智能社区是一个荟聚全球华人AI精英的学习成长社区，旨在提供AI前沿知识的学习、分享和交流的平台。

正文

本期为 TechBeat人工智能社区 第 611 期线上Talk。

北京时间 7 月24日 (周三)20:00， 上海交通大学博士生 庞祥鹤 的Talk将准时在TechBeat人工智能社区开播！

他与大家分享的主题是: “ 大模型社会模拟器MATRIX，价值对齐胜过GPT4 ” ，届时他将向大家介绍一种能够模拟语言模型答案的社会影响，并允许语言模型在模拟社会中自我评估并修正行为的社会模拟器MATRIX。 该工作已入选ICML 2024 Spotlight

Talk·信息

▼

主题：大模型社会模拟器MATRIX，价值对齐胜过GPT4

嘉宾：上海交通大学 · 博士生 - 庞祥鹤

时间：北京时间 7 月24日(周三)20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

长按识别二维码，一键预约TALK！

Talk·介绍

▼

确保大语言模型与人类价值观对齐对于其安全性至关重要。然而，现有的基于人类反馈的强化学习（RLHF）方法存在标注成本高、优化困难等问题。本研究依靠大语言模型的角色扮演能力，搭建了社会模拟器MATRIX，能够模拟语言模型答案的社会影响，允许语言模型在模拟社会中自我评估并修正行为。理论分析表明，社会场景模拟能够生成更具针对性和相关性的反思，从而超越基于预定义规则的Constitutional AI，产生更加对齐的回答。实验结果显示，针对有害问题的回答，社会模拟加持的13B模型不仅能够超越多种基线方法，且在真人测评上超越了GPT-4。

Talk大纲

1、大语言模型对齐介绍

2、社会模拟器MATRIX

3、基于社会模拟的自我对齐方案

4、相关实验

Talk·预习资料

▼

项目名称：

Self-Alignment of Large Language Models via Monopolylogue-based Social Scene Simulation

论文链接：

https://arxiv.org/abs/2402.05699

项目链接：

https://shuotang123.github.io/MATRIX/