专栏名称: 将门创投

将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。

Talk预告｜卡内基梅隆大学岳翔&清华大学童雨轩：解密大模型长链推理

将门创投 · 公众号 · 科技创业 · 2025-03-05 08:22

正文

本期为 TechBeat人工智能社区 第 666 期线上Talk。

北京时间 3 月6日 (周四)20:00， 卡内基梅隆大学博士后研究员 岳翔 & 清华大学本科生 童雨轩 的Talk将准时在TechBeat人工智能社区开播！

他们与大家分享的主题是: “解密大模型长链推理” ，届时他们将介绍团队在理解和提升大语言模型推理能力方面的最新研究进展。

Talk·信息

▼

主题：解密大模型长链推理

嘉宾：卡内基梅隆大学 · 博士后研究员 - 岳翔 & 清华大学 · 本科生 - 童雨轩

时间：北京时间 3 月6日(周四)20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

长按识别二维码，一键预约TALK！

Talk·介绍

▼

大语言模型（LLMs）近年来取得了显著进展，但在解决复杂任务的推理能力方面仍面临诸多挑战。在本次报告中，我们将介绍我们在理解和提升大语言模型推理能力方面的最新研究进展。首先，我们将探讨我们对长链式思维（Chain-of-Thought, CoT）推理复杂性的深入研究，并分析监督微调（Supervised Fine-Tuning, SFT）和强化学习（Reinforcement Learning, RL）中影响LLM推理能力的关键因素。我们还将讨论LLM推理在未来仍需面对的挑战。

Talk大纲

1. 影响大模型长链式思维复杂推理的因素到底有哪些？

2. 强化学习当中哪些设置起到了关键作用？

3. 仅依靠监督微调是否能够起到提升推理的效果？

4. 未来的大模型复杂推理又面临什么样的挑战？

Talk·预习资料

▼

论文链接：

https://arxiv.org/abs/2502.03373

Talk·提问交流

▼

在Talk界面下的 【交流区】 参与互动！留下你的打call🤟和问题🙋，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

▼

岳翔

卡内基梅隆大学 · 博士后研究员 ‍‍‍

岳翔是卡内基梅隆大学（CMU）的博士后研究员。他于2023年在俄亥俄州立大学（OSU）获得博士学位。其研究重点是理解和增强大语言模型（LLMs）的推理能力，并在该领域做出了诸如 MMMU和 MAmmoTH 等贡献。他的研究成果曾获得CVPR 2024 和 ACL 2023 的最佳论文提名。

个人主页:

https://www.techbeat.net/grzytrkj?id=43981 ‍‍‍‍

童雨轩

清华大学 · 本科生

大四本科生，曾于清华大学知识工程实验室（THUKEG），香港科技大学自然语言处理实验室（HKUST-NLP），卡耐基梅隆大学语言技术研究所（CMU-LTI）等机构实习，致力于构建能够处理长上下文复杂推理的人工智能系统。曾于 NeurIPS 发表论文 2 篇，其中第一作者 1 篇，谷歌学术引用量达 440。

个人主页:

https://www.techbeat.net/grzytrkj?id=43991

长按识别二维码，一键预约TALK！

Talk预告｜卡内基梅隆大学岳翔&清华大学童雨轩：解密大模型长链推理

正文

请到「今天看啥」查看全文