专栏名称: DataFunSummit
DataFun社区旗下账号,专注于分享大数据、人工智能领域行业峰会信息和嘉宾演讲内容,定期提供资料合集下载。
目录
相关文章推荐
最英国  ·  英区留子们快来拿工作offer:求职辅导太给 ... ·  15 小时前  
龙船风电网  ·  利好海上风电!英国推出新计划 ·  2 天前  
龙船风电网  ·  利好海上风电!英国推出新计划 ·  2 天前  
51好读  ›  专栏  ›  DataFunSummit

LLM+冷启动:前沿探索及应用!

DataFunSummit  · 公众号  ·  · 2024-06-16 18:00

正文

大模型推荐有哪些成功的落地经验?

稀疏大 模型训练推理如 何优化?

荐系统的 特征工程如何做?

多源序列建模怎么搞?

融合排序的多目标寻优怎么玩?

6月22日,邀请您参加DataFunSummit2024: 推荐系统架构峰会 ,共同探讨大模型时代,推荐系统的前沿技术与最新落地经验,感兴趣的小伙伴欢迎 识别二维码免费报名 ,收看直播:

扫码免费报名,收看直播

"冷启动对于真实的推荐系统来说是一个挑战,无论是召回、粗排还是精排,往往都过度依赖系统记录的用户与商品的交互行为数据,而新用户/新商品的行为数据是很少的,这就会导致新用户的兴趣可能无法被准确建模,新商品获得的展示机会偏少,久而久之推荐系统的马太效应和哈利波特现象也会越来越严重。同时,新用户和新商品的满足对于平台的生态建设和长期收益来说都是至关重要的。

在本次推荐冷启动的分论坛,我们邀请了来自腾讯、阿里、网易等相关推荐领域的资深同学进行一次分享和讨论,围绕如何基于深度学习和LLM等技术在冷启动方向进行落地展开,主题覆盖了电商、游戏和音乐等领域中的推荐场景,希望能提升大家对工业级推荐系统中冷启动问题的认知,给大家带来一些新的启发。"

—— 余瑶 阿里飞猪高级算法专家

" 在常规推荐系统算法和系统双优化的范式下,一线公司针对单个任务或单个业务的效果挖掘几乎达到极限。近几年业界开始普遍关注多种信息的萃取融合,产生了 ESMM,MMOE,STAN 等系列工作,但是目前的整体效果和实践难度仍然差强人意。我们将持续关注这个重要而困难的方向。

在本次演讲中,我们将深入探讨网易云音乐如何通过多场景多任务统一建模实现高效的歌曲推荐系统。我们将详细分析这一过程中面临的难点与挑战,特别是双翘翘(跷跷板)问题,并分享网易云音乐在解决这些问题上的创新策略和实践经验。同时,我们还将探讨统一建模的落地应用与未来发展趋势,为听众提供宝贵的行业洞察和技术启示。"

——肖玄基 前 Shopee 内容电商算法负责人

联合出品人: 余瑶 阿里飞猪 高级算法专家

个人介绍:余瑶,阿里飞猪高级算法专家。本科毕业于华中科技大学,硕士毕业于浙江大学。先后在百度大搜和阿里巴巴飞猪事业部从事搜索、推荐、营销与经营决策相关的算法研发工作。对推荐系统、因果推断、时序预测等算法有丰富的算法经验,在www、cikm、kdd等会议发表多篇文章。

联合出品人:肖玄基 前Shopee 内容电商算法负责人

个人介绍:毕业于中科院软件所,之前在Shopee负责电商直播为主的内容电商算法,曾在腾讯,阿里,百分点工作过。主要研发方向包括推荐,内容生态,用户增长,营销等。


苟延杰 腾讯 高级算法研究员

个人介绍:本硕毕业于四川大学。2022年加入腾讯,负责预训练相关技术在游戏推荐领域的落地,提升游戏体验、商业化等效果。曾在KDD、EMNLP等顶会发表多篇论文。

演讲题目: 腾讯游戏推荐中的预训练大模型与冷启动

演讲提纲:精准感知游戏玩家兴趣,对提升游戏各个领域的个性化推荐水平至关重要。腾讯游戏用户数量庞大、玩家行为复杂,用户的兴趣变迁就沉淀在用户自身的数据当中。如何深刻挖掘游戏数据,是当下核心的数据命题之一。我们将预训练技术应用到游戏数据上,生成通用表征并结合生成式推荐,在多个游戏推荐场景上完成了技术落地。本次分享的主要内容包括:

1. 游戏推荐系统演进介绍

2. 游戏用户通用表征:强大的特征抽取器

3. 游戏生成式推荐:更高质量的推荐决策

听众收益:

1. 如何结合数据特点生成用户通用表征?

2. 如何结合多行为进行生成式推荐?

3. 预训练技术如何缓解冷启问题?


周佳良 阿里闲鱼 推荐算法专家

个人介绍:本科毕业于北京航空航天大学电子信息工程学院,硕士毕业于浙江大学信电学院。曾就职于拼多多推荐算法组做Rank方向,目前在阿里巴巴闲鱼推荐算法部门,负责精排模型、重排和流量机制等,阿里在职期间和同事共同一作在WWW2024(CCFA)发表一篇关于C2C推荐的工作并作为Oral Paper:MetaSplit: Meta-Split Network for Limited-Stock Product Recommendation。

演讲题目:基于闲鱼特色的C2C孤品推荐模型探索

演讲提纲:闲鱼团队提出了一种名为MetaSplit的网络,用于解决C2C平台中浅库存商品(孤品)的推荐问题。传统推荐模型在处理这类商品时因交互数据稀疏而困难,MetaSplit通过序列拆分、元学习网络和辅助Loss提升模型对孤品Emb的建模能力,并在商品下架后仍能够保持更新。此外,还探讨了用户、商品近邻扩展方法,通过图像和文本相似性提高孤品建模准确性。「MetaSplit」+「近邻扩展」方案已在闲鱼首猜取得显著收益并推全,尤其对新品和浅库存商品的提升更加显著。关于孤品序列建模的工作已被WWW24接收并作为Oral Paper:MetaSplit: Meta-Split Network for Limited-Stock Product Recommendation, arxiv地址:

https://arxiv.org/abs/2403.06747

听众收益:

1. 什么是C2C平台的孤品推荐问题?

2. 如何更好地建模孤品的表征?

3. 如何通过近邻扩展提升模型对孤品的预估能力?


江益靓/詹建州 腾讯音乐 天琴实验室高级研究员/数据科学中心高级算法工程师

个人介绍:

江益靓 ,腾讯音乐天琴实验室高级研究员,硕士毕业于复旦大学,主要负责智能歌唱评价与音乐信息检索技术的研发与应用。参与多项MIR技术的落地,推动音频内容理解技术应用在全民K歌、酷狗唱唱、QQ音乐多个场景发挥业务价值。致力于用音乐科技帮助用户更好地享受音乐。

詹建州 , 腾讯音乐数据科学中心高级算法工程师, 硕士毕业于汕头大学数据挖掘方向, 曾任职于滴滴网约车MPT, 21年加入腾讯QQ音乐, 主要负责歌曲/歌单投放算法, 歌曲生态推荐算法, 歌曲自动播放推荐算法, 致力于让更多的用户发现好音乐, 享受音乐带来的乐趣。

演讲题目:音频表征大模型在音乐冷启的应用

演讲提纲:本次分享主要围绕音频表征大模型在QQ音乐与全民K歌上歌曲投放与推荐的实践探索心得展开。

一、音频表征大模型

1. 音频表征背景与应用

2. 音频表征发展与现状







请到「今天看啥」查看全文