重排模型是否可以自主在线训练?
召回侧如何引入多源序列信息?
6月22日,邀请您参加DataFunSummit2024:
推荐系统架构峰会-算法创新论坛
,共同探讨推荐系统最新的算法应用思路,感兴趣的小伙伴欢迎
识别二维码免费报名
,收看直播:
扫码免费报名
出品人:
文亮 奇虎360
资深算法专家
个人介绍:2016年硕士毕业于电子科技大学信息与软件工程,《推荐系统技术原理与实践》作者,拥有超过8年的模型优化经验,硕士期间发表5篇论文,其中3篇被EI收录。在大模型方向拥有丰富的技术背景,参与过千亿大模型训练和优化。目前主要负责大模型后训练,COT优化以及通用技能优化。
王原 淘天集团 算法专家
个人介绍:博士,美国纽约大学,18年毕业加入阿里巴巴,先后负责淘宝“关注”信息流和日销超10亿元的私域商品搜索推荐算法。
演讲题目:无需等待:电商领域重排模型在线学习可以先于用户反馈
Do Not Wait: Learning Re-Ranking Model Without User Feedback At Serving Time in E-Commerce
演讲提纲:推荐系统在电子商务中得到了广泛的应用,重排序模型在该领域发挥着越来越重要的作用,它显式利用了宝贝间的影响并决定着最终的推荐列表。在线学习方法不断使用最新的可用样本更新已部署的模型,以捕获电子商务中底层数据分布的变化。然而,传统在线学习方法强依赖真实用户反馈,在电商领域中,核心的购买反馈可能会延迟数小时甚至数天,从而导致模型增强的滞后。
我们提出了一种用于重排模型的新颖在线学习方案,该方案可以作为传统在线学习方法的有效补充,我们称其为LAST(Learning At Serving Time)。LAST使用代理模型提供重排模型改进所需的指导性信号,以此规避对用户反馈的强依赖。收到在线请求后,LAST首先进行在线探索,寻找到模型参数改进并应用该改进后,再生成推荐结果。值得注意的是,LAST的模型改进是即抛型的。一个改进通过拟合当前请求的上下文来提升当前请求的推荐效果。完成当前请求后,该请求的模型改进将被立刻丢弃。这有助于防止错误传播并稳定在线学习过程,因为代理模型的预测可能不准确。最重要的是,作为基于反馈的在线学习方法的补充,LAST可以无缝集成到现有的在线学习系统中,以创建更具适应性和响应性的推荐体验。离线和在线的综合实验证实,LAST 优于最先进的重排序模型。
听众收益:
1. 没有在线工程支持,重排模型是否可以在线训练?
2. 重排模型在线更新是否可以先于用户反馈?
3. 如何将重排模型的训练与适配做到request粒度?
陈立国 奇虎360 高级算法专家
个人介绍:毕业于中国科学院大学,硕士学历,18年入职360,目前负责图文、视频等多个入口流推荐场景优化工作。
演讲题目:多源序列信息使用以及目标一致性优化
演讲提纲:主要介绍在序列建模过程中遇到的一些问题,分析产生的原因以及针对性的解法,包括多源序列融合问题、召回阶段如何保证目标一致性问题等。
1. 为什么将序列作为继续优化的方向。
2. 位置信息的使用以及遇到的问题。
3. 召回侧如何针对性引入数据,如何解决融合导致的信息丢失。
4. 如何做到端到端,并提升目标一致性。
听众收益:
1. 如何在复杂场景中理解用户行为?