本期为
TechBeat人工智能社区
第
641
期
线上Talk。
北京时间
11
月21日
(周四)20:00,
新加坡国立大学硕
士生
余昭辰
&
北京大学硕士生
张子翔
的Talk将准时在TechBeat人工智能社区开播!
他们与大家分享的主题
是:
“
大模型推理与多模态扩散模型的协同作用
”
,
届时他们
将
分享
课题组在优化大语言模型处理复杂推理任务能力上的最新研究成果,以及如何与扩散模型协同生成多物体三维场景的创新方法。
嘉宾:新加坡国立大学 · 硕士生 - 余昭辰 & 北京大学 · 硕士生 - 张子翔
长按识别二维码,一键预约TALK!
近年来,大语言模型(LLMs)如GPT-4、PaLM和LLaMA在各种推理任务中展现了令人惊叹的性能。然而,尽管这些模型在规模和性能上不断提升,它们在处理复杂推理任务时仍面临一定的挑战。
本次讲座将介绍我们课题组在优化大语言模型处理复杂推理任务能力上的最新研究成果,以及如何与扩散模型协同生成多物体三维场景的创新方法。
1.增强大语言模型推理的思维缓存方法--Buffer of Thought
2.提升大语言模型推理及纠错能力的跨模型微调框架--SuperCorrect
3.大语言模型和扩散模型协同生成多物体3D场景--Semantic-SDS
Talk·预习资料
▼
论文链接:
https://arxiv.org/abs/2406.04271
项目主页:
https://github.com/YangLing0818/buffer-of-thought-llm
论文链接:
https://arxiv.org/abs/2410.09008
项目主页:
https://github.com/YangLing0818/SuperCorrect-llm
论文链接:
https://arxiv.org/abs/2410.09009
项目主页:
https://github.com/YangLing0818/SemanticSDS-3D
Talk·提问交流
▼
在Talk界面下的
【交流区】
参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
余昭辰,本科毕业于北京理工大学,新加坡国立大学硕士在读,北京大学数据与智能实验室(PKU-DAIR)实习生,研究方向为扩散模型与大模型,已在ICLR、ICML、NeurIPS 等顶会上一作发表多篇论文,担任NeurIPS,ICLR, AISTATS等顶会审稿人。
个人主页:
https://www.techbeat.net/grzytrkj?id=4=38118
张子翔,2025年入学的北京大学硕士研究生,本科就读于北京理工大学,专业成绩排名第一,两次获得国家奖学金;主要关注扩散模型、可控视觉生成、可控3D生成等领域。