专栏名称: DataFunSummit
DataFun社区旗下账号,专注于分享大数据、人工智能领域行业峰会信息和嘉宾演讲内容,定期提供资料合集下载。
目录
相关文章推荐
哲学王  ·  钱穆:读这五类书,做高境界的人 ·  昨天  
正商阅读  ·  生活最好的状态:人静、物简、心安 ·  3 天前  
正商阅读  ·  生活最好的状态:人静、物简、心安 ·  3 天前  
哲学园  ·  计算力学(因果态理论) ·  3 天前  
慧田哲学  ·  红军长征原始记录,无删减 ·  4 天前  
51好读  ›  专栏  ›  DataFunSummit

最新推荐策略与大模型创新应用实践

DataFunSummit  · 公众号  ·  · 2024-06-09 22:20

正文

大模型推荐有哪些成功的落地经验?

稀疏大 模型训练推理如 何优化?

荐系统的 特征工程如何做?

多源序列建模怎么搞?

融合排序的多目标寻优怎么玩?

6月22日,邀请您参加DataFunSummit2024: 推荐系统架构峰会 ,共同探讨大模型时代,推荐系统的前沿技术与最新落地经验,感兴趣的小伙伴欢迎 识别二维码免费报名 ,收看直播:

扫码免费报名,收看直播

峰会日程

部分议题展示

袁镱 腾讯 专家工程师

个人介绍:袁镱博士,腾讯公司专家工程师,负责无量系统和一念LLM等机器学习训练和推理框架研发。

演讲题目:大语言模型推理加速

演讲提纲:

1. 基本逻辑:大语言模型推理基本逻辑和常规深度学习推理的差异

2. 性能瓶颈分析:大语言模型推理特定的性能瓶颈

3. 性能优化:业界主要的优化方法,结合腾讯开源的一念LLM分析推理系统的技术选型

听众收益:

1. 系统地了解大语言模型推理的基本逻辑和优化方法

2. 在一个简单的分析框架下,了解当前多种多样的方法是在哪些维度上优化


李健 京东 算法应用工程师

个人介绍:17年加入京东广告研发部,在算法架构方向深耕7年,先后参与了两代京东广告模型系统的架构建设。主导了大规模稀疏模型训练&推理等能力建设,助力多项算法创新落地,并多次获得京东零售级别奖项。目前作为广告算法架构方向架构师,带领团队建设新一代广告异构算法架构体系。

演讲题目:京东广告稀疏大模型训练与推理GPU优化实践

演讲提纲:从京东广告算法场景出发,介绍稀疏大模型训练&推理的GPU吞吐优化实践,具体包括:

1. 京东广告推荐场景介绍

2. 京东广告训练场景GPU优化实践

3. 京东广告推理场景GPU优化实践

听众收益:

1. 高并发、低延时场景如何高效利用GPU资源?

2. CPU与GPU异构资源场景如何分别最大化计算资源利用率?

3. 推荐领域大模型如何优化IO吞吐?


程孟力 阿里云 高级算法专家

个人介绍:主要负责图像OCR,推荐排序算法,多模态相关的模型研发和效率优化工作。

演讲题目:EasyRec推荐算法训练推理优化

演讲提纲:

1. EasyRec推荐算法框架

2. EasyRec训练优化

3. EasyRec推理优化

听众收益:

1. 了解推荐算法中常见的训练和推理优化技巧

2. 了解EasyRec算法框架的使用方法

3. 了解EasyRecProcessor的使用方法

扫码免费报名,收看直播


陈玉祥 陌陌 算法工程专家

个人介绍: 15年吉林大学计算机学院本科毕业,曾在去哪儿网,负责过机票事业部的机票搜索报价、售后服务系统研发。先后在陌陌,负责过推荐系统的推荐引擎研发和推荐模型训练与推理系统研发。目前是陌陌的机器学习平台负责人,希望打造高效的机器学习系统。

演讲题目:HugeCTR 在陌陌推荐系统的实践

演讲提纲:

1. 推荐系统在陌陌的应用

2. 推荐系统模型训练挑战

3. HugeCTR 与陌陌实践

4. 总结讨论 & OneMoreThing

听众收益:

1. 推荐系统模型特点

2. 高性能推荐系统模型训练方法

刘国强 阿里云 高级开发工程师

个人介绍:浙江大学计算机学院硕士,阿里云计算平台事业部-人工智能平台(PAI)高级开发工程师。

演讲题目:智能时代的数据炼金术:从特征工程到组件化建模

演讲提纲:

1. 特征工程构建流程

2. 组件化建模分享

听众收益:

1. 如何构建特征工程,降低特征工程复杂度,支持跨平台,减少工作量,保证一致性。

2. 如何灵活搭建模型,实现组件复用,提升迭代效率。


曾鸣堃 小红书 训推计算引擎负责人

个人介绍:小红书训推计算引擎负责人,17年毕业于中国科学技术大学,目前负责搜广推场景下的模型训练和推理引擎侧研发工作。

演讲题目:小红书训推异构引擎的设计与应用

演讲提纲:

1. 训推一体的异构引擎实践

2. 面向未来的 HPC 训练框架

3. AI 编译器小红书的实践

扫码免费报名,收看直播


王原 淘天集团 算法专家

个人介绍: 博士,美国纽约大学,18年毕业加入阿里巴巴,先后负责淘宝“关注”信息流和日销超10亿元的私域商品搜索推荐算法。

演讲题目:无需等待:电商领域重排模型在线学习可以先于用户反馈

Do Not Wait: Learning Re-Ranking Model Without User Feedback At Serving Time in E-Commerce

演讲提纲:推荐系统在电子商务中得到了广泛的应用,重排序模型在该领域发挥着越来越重要的作用,它显式利用了宝贝间的影响并决定着最终的推荐列表。在线学习方法不断使用最新的可用样本更新已部署的模型,以捕获电子商务中底层数据分布的变化。然而,传统在线学习方法强依赖真实用户反馈,在电商领域中,核心的购买反馈可能会延迟数小时甚至数天,从而导致模型增强的滞后。

我们提出了一种用于重排模型的新颖在线学习方案,该方案可以作为传统在线学习方法的有效补充,我们称其为LAST(Learning At Serving Time)。LAST使用代理模型提供重排模型改进所需的指导性信号,以此规避对用户反馈的强依赖。收到在线请求后,LAST首先进行在线探索,寻找到模型参数改进并应用该改进后,再生成推荐结果。值得注意的是,LAST的模型改进是即抛型的。一个改进通过拟合当前请求的上下文来提升当前请求的推荐效果。完成当前请求后,该请求的模型改进将被立刻丢弃。这有助于防止错误传播并稳定在线学习过程,因为代理模型的预测可能不准确。最重要的是,作为基于反馈的在线学习方法的补充,LAST可以无缝集成到现有的在线学习系统中,以创建更具适应性和响应性的推荐体验。离线和在线的综合实验证实,LAST 优于最先进的重排序模型。

听众收益:

1. 没有在线工程支持,重排模型是否可以在线训练?

2. 重排模型在线更新是否可以先于用户反馈?

3. 如何将重排模型的训练与适配做到request粒度?


徐传宇 阿里1688 算法专家

个人介绍:19年研究生毕业入职阿里,曾负责首图个性化和销量预测等工作。目前负责首页为你推荐场景算法全链路工作。

演讲题目:推荐级联全链路去偏

演讲提纲:在线模型需要从亿级商品中筛选出topK商品,而离线训练集的曝光商品仅有几百万,离在线存在巨大的GAP。需要我们从全链路对齐消偏,发挥算法最大的效能。

听众收益:

1. 如何通过重构转化概率范式,消除主链路样本选择偏差。

2. 如何引入评估器,构造反事实信号,获得最优序列。


唐燕琳 奇虎360 资深算法专家

个人介绍:毕业于浙江大学,在奇虎360负责广告算法相关工作,专注于智能创意、商品推荐和oCPX效果广告等算法方向。

演讲题目: 从Bert到LLM:360广告推荐业务中语言模型的应用探索

演讲提纲:本次分享主要介绍了语言模型助力下推荐系统的发展进化,以及在广告推荐场景下的应用探索。具体内容包括:

1. 广告推荐业务的需求

2. 语言模型如何助力推荐系统,分为3大类方案

3. 根据业务背景和语言模型的进化,逐步进行应用方案演进

4. 总结和展望

听众收益:

1. 了解语言模型在推荐系统中应用方案的演进和对比

2. 在广告业务中如何利用语言模型训练范式实现跨域推荐

3. 使用语言模型训练范式用户行为的稀疏性如何解决

扫码免费报名,收看直播


王文杰 新加坡国立大学 研究员

个人介绍:王文杰,新加坡国立大学研究员,主要研究方向为推荐系统、大模型和因果推理。2023年从新加坡国立大学获得博士学位,师从Chua Tat-Seng教授。 曾在SIGIR, KDD, WWW, WSDM, ACMMM和TOIS等高水平会议和期刊上发表论文30余篇,担任SIGIR、WWW、TPAMI、TOIS等会议和期刊的审稿人。曾获ACM MM 2019最佳论文候选、谷歌博士奖学金、NUS 院长奖学金等。

演讲题目:大模型推荐系统的构建和对齐

演讲提纲:最近大语言模型LLMs用于推荐任务(称为LLM4Rec)引起了广泛的关注,包括利用LLMs进行生成式物品排序,以及探索适用于多种开放式推荐任务的通用型LLM4Rec。这些发展可能改变传统推荐模式,提供更多未来研究的可能性。在本次报告中,我们将简要回顾LLM4Rec的发展,介绍推荐系统如何从LLMs中受益。此外,我们将讨论这一新兴领域的关键挑战和未解决的问题,例如可信推荐、效率和模型重训练等问题。最后,我们将总结以往工作中的重要结论,并展望未来的研究方向。

听众收益:

1. 如何让大模型理解推荐任务?

2. 如何提高大模型推荐训练效率?

3. 如何实现可信推荐大模型对齐?

4. 推荐智能体的未来发展?


演讲嘉宾:程引 快手 资深算法专家

个人介绍:上海交通大学博士。在滴滴出行、BizReach、 Smartnews 长期从事推荐算法工作,目前在快手从事直播推荐的工作。

演讲题目:融合排序的多目标寻优

演讲提纲:

1. 推荐系统的融合排序公式简介

2. 迭代融合公式面临的挑战和难点

3. 贝叶斯自动寻优技术

4. 融合公式自动寻优工具与应用

听众收益:

1. 融合公式如何设计

2. 融合公式如何调参

3. 业务多目标如何权衡

苏睿龙 小红书 应用模型算法负责人

个人介绍:小红书应用模型算法负责人,15年毕业于上海交通大学计算机系APEX实验室,师从俞勇教授,研究方向为推荐系统。前国内顶尖围棋AI团队核心成员,曾在云栖大会打败人类围棋世界冠军,担任过欢聚时代直播和短视频方向 Tech Lead 。在推荐、AI、广告等方面深耕多年,尤其在内容推荐领域有着丰富的实战经验。曾任小红书主站推荐召回负责人,兼任商城&直播推荐技术负责人,现负责通过应用模型算法支持社区主站推荐和信息流广告全链路模型优化,支持社区搜索模型迭代,推动多模态技术在推荐、广告和交易的应用。

演讲题目:小红书去中心化内容分发技术

演讲提纲:

1. 推荐系统常见的中心化分发问题的原因分析

2. 小红书对去中心化分发的问题拆解

3. 小红书去中心化分发的技术实践和未来方向

听众收益:

1. 如何分析中心化分发的系统瓶颈

2. 如何将中心化分发问题拆解到系统的各个模块

3. 优化中心化分发问题的一些可行技术

扫码免费报名,收看直播


钟灵 阿里云 高级算法专家

个人介绍:阿里云高级算法专家,具有多年搜索推荐场景的算法和工程实践经验,为上百家阿里云客户提供场景优化建议和效果优化。负责PAI-REC推荐和FeatureStore特征平台,帮助开发者和企业用户更好的使用云上产品,做好大规模的AI训练和推理服务,解决业务问题。

演讲题目:推荐系统降本增效探索实践

演讲提纲:本演讲将阐述在降本增效的时代,如何通过工程化手段提升推荐系统建设效率,并分享真实业务案例。主要内容包括:

1. 通过推荐算法定制、特征工程精细化控制特征、降低开发成本,

2. 通过组件化的模型搭建加快新的推荐模型的实验,

3. 通过模型训练优化和推理性能优化来降低离线训练和在线服务的成本

4. 通过实验AB平台加快迭代速度

5. 通过特征平台简化特征管理

听众收益:

1. 开源的推荐引擎和算法框架,帮助用户快速搭建推荐系统

2. 免费的特征管理平台

3. A/B算法迭代经验

4. 性能优化经验


赵单栋 小红书 实验平台Leader

个人介绍:当下在小红书负责实验平台。之前在谷歌做过DS,统计学PhD。

演讲题目:推荐业务在AB方向的挑战

演讲提纲:

1. 小红书AB实验框架

2. 实验难点:

· 流量精度不足

· 读数口径不统一

· 结果可复现性不高

听众收益:

1. 怎么汇报团队整体收益

2. 怎么把北极星指标拆解到 Actionable 实验决策指标当中来

3. 怎么高效率地做实验迭代


苟延杰 腾讯 高级算法研究员

个人介绍:本硕毕业于四川大学。2022年加入腾讯,负责预训练相关技术在游戏推荐领域的落地,提升游戏体验、商业化等效果。曾在KDD、EMNLP等顶会发表多篇论文。

演讲题目: 腾讯游戏推荐中的预训练大模型与冷启动

演讲提纲:精准感知游戏玩家兴趣,对提升游戏各个领域的个性化推荐水平至关重要。腾讯游戏用户数量庞大、玩家行为复杂,用户的兴趣变迁就沉淀在用户自身的数据当中。如何深刻挖掘游戏数据,是当下核心的数据命题之一。我们将预训练技术应用到游戏数据上,生成通用表征并结合生成式推荐,在多个游戏推荐场景上完成了技术落地。本次分享的主要内容包括:







请到「今天看啥」查看全文