专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
目录
相关文章推荐
PikeTalk  ·  “再见,UFCS!”小米悄然退出快充联盟群聊 ·  18 小时前  
PikeTalk  ·  “再见,UFCS!”小米悄然退出快充联盟群聊 ·  18 小时前  
起点锂电  ·  新能安/多氟多/蓝京/中比/东磁/比克/锂威 ... ·  2 天前  
起点锂电  ·  新能安/多氟多/蓝京/中比/东磁/比克/锂威 ... ·  2 天前  
上海科创汇  ·  申报|静安区2024年度新引进高新技术企业奖励 ·  2 天前  
python自留地  ·  2月5日,奇安信安全智能体深度接入DeepS ... ·  2 天前  
python自留地  ·  2月5日,奇安信安全智能体深度接入DeepS ... ·  2 天前  
成都日报  ·  中航成飞正式登陆资本市场 ·  2 天前  
成都日报  ·  中航成飞正式登陆资本市场 ·  2 天前  
51好读  ›  专栏  ›  将门创投

Talk预告|上海交通大学庞祥鹤:大模型社会模拟器MATRIX,价值对齐胜过GPT4

将门创投  · 公众号  · 科技创业  · 2024-07-23 08:22

主要观点总结

本文介绍了在TechBeat人工智能社区的第611期线上Talk中,上海交通大学博士生庞祥鹤将分享关于大模型社会模拟器MATRIX的研究。该模拟器能够模拟语言模型答案的社会影响,并允许语言模型在模拟社会中自我评估并修正行为。这项研究已入选ICML 2024 SpotlightTalk,并与GPT4进行了对比,表现出超越GPT4的性能。

关键观点总结

关键观点1: 大模型社会模拟器MATRIX的介绍

庞祥鹤将介绍他搭建的社会模拟器MATRIX,该模拟器能够模拟语言模型答案的社会影响,并允许语言模型在模拟社会中自我评估并修正行为。

关键观点2: 社会模拟器MATRIX的价值

社会模拟器MATRIX的价值在于确保大语言模型与人类价值观对齐,这对于语言模型的安全性至关重要。

关键观点3: 社会模拟器MATRIX的理论分析和实验结果

理论分析表明,社会场景模拟能够生成更具针对性和相关性的反思,从而超越基于预定义规则的Constitutional AI,产生更加对齐的回答。实验结果显示,社会模拟加持的13B模型在针对有害问题的回答上超越了GPT-4。

关键观点4: Talk的内容和大纲

Talk将包括大语言模型对齐介绍、社会模拟器MATRIX的介绍、基于社会模拟的自我对齐方案、相关实验以及嘉宾介绍等环节。

关键观点5: TechBeat人工智能社区的简介

TechBeat人工智能社区是一个荟聚全球华人AI精英的学习成长社区,旨在提供AI前沿知识的学习、分享和交流的平台。


正文

本期为 TechBeat人工智能社区 611 线上Talk。

北京时间 7 月24日 (周三)20:00, 上海交通大学博士生 庞祥鹤 的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: 大模型社会模拟器MATRIX,价值对齐胜过GPT4 届时他将向大家介绍一种 能够模拟语言模型答案的社会影响,并 允许语言模型在模拟社会中自我评估并修正行为的社会模拟器MATRIX。 该工作已入选ICML 2024 Spotlight
Talk·信息
主题:大模型社会模拟器MATRIX,价值对齐胜过GPT4
嘉宾:上海交通大学 · 博士生 - 庞祥鹤
时间:北京时间 7 月24日(周三)20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/

长按识别二维码,一键预约TALK!


Talk·介绍
确保大语言模型与人类价值观对齐对于其安全性至关重要。然而,现有的基于人类反馈的强化学习(RLHF)方法存在标注成本高、优化困难等问题。本研究依靠大语言模型的角色扮演能力,搭建了社会模拟器MATRIX,能够模拟语言模型答案的社会影响,允许语言模型在模拟社会中自我评估并修正行为。理论分析表明,社会场景模拟能够生成更具针对性和相关性的反思,从而超越基于预定义规则的Constitutional AI,产生更加对齐的回答。实验结果显示,针对有害问题的回答,社会模拟加持的13B模型不仅能够超越多种基线方法,且在真人测评上超越了GPT-4。

Talk大纲

1、大语言模型对齐介绍

2、社会模拟器MATRIX

3、基于社会模拟的自我对齐方案

4、相关实验

Talk·预习资料

项目名称:

Self-Alignment of Large Language Models via Monopolylogue-based Social Scene Simulation

论文链接:

https://arxiv.org/abs/2402.05699

项目链接:

https://shuotang123.github.io/MATRIX/



Talk·提问交流

在Talk界面下的 【交流区】 参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

庞祥鹤 ‍‍‍‍‍‍‍‍‍

上海交通大学 · 博士生

庞祥鹤,上海交通大学二年级博士生,主要研究方向为大语言模型对齐以及多智能体协作,曾在ICML,IROS等会议发文。

个人主页:

https://www.techbeat.net/grzytrkj?id=40885


长按识别二维码,一键预约TALK!








请到「今天看啥」查看全文


推荐文章
成都日报  ·  中航成飞正式登陆资本市场
2 天前
成都日报  ·  中航成飞正式登陆资本市场
2 天前
人称T客  ·  云计算下半场 哪些会成为关注点
8 年前
Python开发者  ·  Flask 插件系列 - Flask-SQLAlchemy
8 年前
古墨社  ·  突然间懂了(很现实)
7 年前