专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
目录
相关文章推荐
能源电力说  ·  远不止储能!特斯拉上海储能超级工厂投产 ·  2 天前  
能源电力说  ·  远不止储能!特斯拉上海储能超级工厂投产 ·  2 天前  
经济日报  ·  又一国际巨头将“一拆三” ·  3 天前  
经济日报  ·  又一国际巨头将“一拆三” ·  3 天前  
51好读  ›  专栏  ›  将门创投

Talk预告|CMU LTI 于子淳:MATES - 基于模型感知数据选择的高效预训练

将门创投  · 公众号  · 科技创业  · 2025-02-11 08:39

正文

本期为 TechBeat人工智能社区 660 线上Talk。

北京时间 2 月12日 (周三)20:00, CMU LTI博士生 于子淳 的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是: “MATES - 基于模型感知数据选择的高效预训练” ,届时他将介绍基于模型感知的数据选择方法MATES。

Talk·信息
主题:MATES - 基于模型感知数据选择的高效预训练
嘉宾:CMU LTI · 博士生 - 于子淳
时间:北京时间 2 月12日(周三)20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/

长按识别二维码,一键预约TALK!


Talk·介绍
有效的数据选择能显著提升模型的预训练效率。在本次Talk中,我会介绍基于模型感知的数据选择方法MATES,即基于影响函数来动态追踪模型的数据偏好,并训练一个小的数据影响模型来高效地为预训练模型选择其最需要的数据。MATES将预训练效率提升了超过两倍,并在公开的数据选择评测榜单DCLM上取得了第一的位置。
Talk大纲
1. 背景 - 预训练数据选择的重要性和意义

2. 动机与问题 - 比较当前数据选择方法的优劣势,引出我们需要基于模型感知的数据选择方法

3. 解决方案 - MATES的主要贡献,更准确的影响函数计算以及如何用小的数据影响模型来拟合影响函数

4. 实验结果和分析 - DCLM榜单以及可视化结果

5. 结论和未来展望 - 总结MATES的主要发现和未来的拓展工作


Talk·预习资料

论文链接:

https://arxiv.org/abs/2406.06046

代码链接:

https://github.com/cxcscmu/MATES



Talk·提问交流

在Talk界面下的 【交流区】 参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

于子淳 ‍‍‍‍‍‍‍‍‍‍‍

CMU LTI · 博士生 ‍‍‍
CM U LTI博士二年级的于子淳,导师是熊辰炎教授,本科毕业于清华大学。目前的研究方向是基于数据选择的高效预训练以及影响函数。相关研究成果已经发表在NeurIPS,ACL等会议。

个人主页:

https://www.techbeat.net/grzytrkj?id=43606 ‍‍‍‍



长按识别二维码,一键预约TALK!







请到「今天看啥」查看全文