专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
目录
相关文章推荐
沾益掌中传播  ·  曲靖警用机器狗“上岗”→ ·  7 小时前  
沾益掌中传播  ·  曲靖警用机器狗“上岗”→ ·  7 小时前  
碳索储能  ·  300MW/300MWh!中城大有山西繁峙共 ... ·  昨天  
今晚报  ·  微信终于“瘦”了!网友:太实用 ·  2 天前  
今晚报  ·  微信终于“瘦”了!网友:太实用 ·  2 天前  
大众新闻-大众日报  ·  突然宣布:大裁员 ·  2 天前  
企业专利观察  ·  InterDigital宣布与一家中国手机厂 ... ·  3 天前  
企业专利观察  ·  InterDigital宣布与一家中国手机厂 ... ·  3 天前  
51好读  ›  专栏  ›  将门创投

Talk预告|清华大学张进:LEPA - 如何让大模型自己优化与利用计划?

将门创投  · 公众号  · 科技创业  · 2025-02-26 08:22

正文

本期为 TechBeat人工智能社区 664 线上Talk。

北京时间 2 月27日 (周四)20:00, 清华大学博士生 张进 的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是: “LEPA - 如何让大模型自己优化与利用计划?” ,届时他将分享如何让大模型学会自己规划并解决问题。

Talk·信息
主题:LEPA - 如何让大模型自己优化与利用计划?
嘉宾:清华大学 · 博士生 - 张进
时间:北京时间 2 月27日(周四)20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/

长按识别二维码,一键预约TALK!


Talk·介绍
人类在解决复杂问题时会通过分层式的结构,即先决定大体规划,再执行具体步骤的方式来更高效地解决问题。然而,现有的大模型缺乏该能力。本次分享我将介绍如何让大模型学会自己规划并解决问题。
Talk大纲
1. 背景:为什么需要后训练中的自训练(self-training),以及现有self-training方法的问题是是么

2. 思想:为什么是规划?好处是什么?

3. 方法:如何实现大模型对规划生成与利用能力的自我训练?

4. 相关工作:与之前工作的关系和改进点是什么?

5. 实验:方法表现如何?

6. 总结:贡献是什么?

Talk·预习资料

论文链接:

https://openreview.net/forum?id=KmmNb7631I


Talk·提问交流

在Talk界面下的 【交流区】 参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

张进 ‍‍‍‍‍‍‍‍‍‍‍

清华大学 · 博士生 ‍‍‍
张进,清华大学交叉信息研究院五年级博士生,导师为高阳老师,研究方向为迁移强化学习。2024年5月开始在月之暗面公司alignment组实习。

个人主页:

https://www.techbeat.net/grzytrkj?id=43783 ‍‍‍‍



长按识别二维码,一键预约TALK!


-The End-







请到「今天看啥」查看全文