本期为TechBeat人工智能社区第641期线上Talk。
北京时间11月21日(周四)20:00,新加坡国立大学硕士生余昭辰 & 北京大学硕士生张子翔的Talk将准时在TechBeat人工智能社区开播!他们与大家分享的主题是: “大模型推理与多模态扩散模型的协同作用”,届时他们将分享课题组在优化大语言模型处理复杂推理任务能力上的最新研究成果,以及如何与扩散模型协同生成多物体三维场景的创新方法。嘉宾:新加坡国立大学 · 硕士生 - 余昭辰 & 北京大学 · 硕士生 - 张子翔 长按识别二维码,一键预约TALK!
近年来,大语言模型(LLMs)如GPT-4、PaLM和LLaMA在各种推理任务中展现了令人惊叹的性能。然而,尽管这些模型在规模和性能上不断提升,它们在处理复杂推理任务时仍面临一定的挑战。
本次讲座将介绍我们课题组在优化大语言模型处理复杂推理任务能力上的最新研究成果,以及如何与扩散模型协同生成多物体三维场景的创新方法。1.增强大语言模型推理的思维缓存方法--Buffer of Thought2.提升大语言模型推理及纠错能力的跨模型微调框架--SuperCorrect
3.大语言模型和扩散模型协同生成多物体3D场景--Semantic-SDS
Talk·预习资料
▼
论文链接:
https://arxiv.org/abs/2406.04271
项目主页:
https://github.com/YangLing0818/buffer-of-thought-llm
论文链接:
https://arxiv.org/abs/2410.09008
项目主页:
https://github.com/YangLing0818/SuperCorrect-llm
论文链接:
https://arxiv.org/abs/2410.09009
项目主页:
https://github.com/YangLing0818/SemanticSDS-3D
Talk·提问交流
▼
在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!余昭辰,本科毕业于北京理工大学,新加坡国立大学硕士在读,北京大学数据与智能实验室(PKU-DAIR)实习生,研究方向为扩散模型与大模型,已在ICLR、ICML、NeurIPS 等顶会上一作发表多篇论文,担任NeurIPS,ICLR, AISTATS等顶会审稿人。个人主页:
https://www.techbeat.net/grzytrkj?id=4=38118
张子翔,2025年入学的北京大学硕士研究生,本科就读于北京理工大学,专业成绩排名第一,两次获得国家奖学金;主要关注扩散模型、可控视觉生成、可控3D生成等领域。个人主页:
https://www.techbeat.net/grzytrkj?id=42594
长按识别二维码,一键预约TALK!
如果你也想成为讲者
▼
单人Talk | 团队专场 | 录播or直播 | 闭门交流
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区