专栏名称: 将门创投

将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。

Talk预告｜NUS余昭辰&PKU张子翔：大模型推理与多模态扩散模型的协同作用

将门创投 · 公众号 · 科技创业 · 2024-11-20 08:22

正文

本期为 TechBeat人工智能社区 第 641 期线上Talk。

北京时间 11 月21日 (周四)20:00， 新加坡国立大学硕 士生 余昭辰 & 北京大学硕士生 张子翔 的Talk将准时在TechBeat人工智能社区开播！

他们与大家分享的主题是: “ 大模型推理与多模态扩散模型的协同作用 ” ，届时他们将分享课题组在优化大语言模型处理复杂推理任务能力上的最新研究成果，以及如何与扩散模型协同生成多物体三维场景的创新方法。

Talk·信息

▼

主题：大模型推理与多模态扩散模型的协同作用

嘉宾：新加坡国立大学 · 硕士生 - 余昭辰 & 北京大学 · 硕士生 - 张子翔

时间：北京时间 11 月21日(周四)20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

长按识别二维码，一键预约TALK！

Talk·介绍

▼

近年来，大语言模型（LLMs）如GPT-4、PaLM和LLaMA在各种推理任务中展现了令人惊叹的性能。然而，尽管这些模型在规模和性能上不断提升，它们在处理复杂推理任务时仍面临一定的挑战。

本次讲座将介绍我们课题组在优化大语言模型处理复杂推理任务能力上的最新研究成果，以及如何与扩散模型协同生成多物体三维场景的创新方法。

Talk大纲

1.增强大语言模型推理的思维缓存方法--Buffer of Thought

2.提升大语言模型推理及纠错能力的跨模型微调框架--SuperCorrect

3.大语言模型和扩散模型协同生成多物体3D场景--Semantic-SDS

Talk·预习资料

▼

论文链接：

https://arxiv.org/abs/2406.04271

项目主页：

https://github.com/YangLing0818/buffer-of-thought-llm

论文链接：

https://arxiv.org/abs/2410.09008

项目主页：

https://github.com/YangLing0818/SuperCorrect-llm

论文链接：

https://arxiv.org/abs/2410.09009

项目主页：

https://github.com/YangLing0818/SemanticSDS-3D

Talk·提问交流

▼

在Talk界面下的 【交流区】 参与互动！留下你的打call🤟和问题🙋，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

▼

余昭辰

新加坡国立大学 · 硕士生

余昭辰，本科毕业于北京理工大学，新加坡国立大学硕士在读，北京大学数据与智能实验室（PKU-DAIR）实习生，研究方向为扩散模型与大模型，已在ICLR、ICML、NeurIPS 等顶会上一作发表多篇论文，担任NeurIPS，ICLR, AISTATS等顶会审稿人。

个人主页:

https://www.techbeat.net/grzytrkj?id=4=38118

张子翔

北京大学 · 硕士生

张子翔，2025年入学的北京大学硕士研究生，本科就读于北京理工大学，专业成绩排名第一，两次获得国家奖学金；主要关注扩散模型、可控视觉生成、可控3D生成等领域。