专栏名称: DataFunTalk

专注于大数据、人工智能领域的知识分享平台。

「深度」学习计算广告，我为什么从推荐系统转向计算广告？

DataFunTalk · 公众号 · 科技创业科技自媒体 · 2024-11-09 13:00

正文

导读你好，我是王喆，这里是「深度学习计算广告」的第一篇文章。熟悉我的朋友们可能知道，从2018年底开始，我更新了一系列推荐系统相关的文章，主要集中在推荐模型，CTR模型等技术的迭代更新上。2020年，我以专栏内容为基础，把所有知识结构化，形成了「深度学习推荐系统」这本书，以及「深度学习推荐系统实战」这门课程。算是把自己所有的理论知识和实践经验做了一个全面的总结。

从2021年开始，我离开了推荐系统领域，回到我职业生涯开始的地方——计算广告，全面负责Tiktok Ad Network的算法工作，最近这一年又来到Dinsey Streaming，负责其下辖所有视频app的广告算法研究和相关工程工作，算是做了一个小的职业方向的转型。

由于职业方向上的转变，我也希望从这第一篇文章开始，逐渐把计算广告最经典也最前沿的知识体系建立起来。专栏名称“深度学习计算广告”有两层意思，第一层意思是深度地学习计算广告，第二层意思是计算广告中的深度学习应用。一语双关，也符合咱们专栏的定位。

全文目录：

1. 为什么回到计算广告领域—推荐系统和计算广告的特点

2. 计算广告系统的优化空间在哪？还有卷的余地吗？

3. 为什么不是大模型？

4. 深度学习计算广告系列今后写些什么？

为什么回到计算广告领域—推荐系统和计算广告的技术特点

回到计算广告领域的决定我当初也思考了一阵子，主要的出发点是考虑到推荐系统和广告系统技术特点的差异，从职业生涯不同阶段的需求决策的。虽然推荐系统和计算广告的主流技术有诸多相似点，比如：

深度学习推荐模型和深度学习CTR模型分别作为二者的核心，技术方案是完全相通的；

推荐系统的工程架构和广告系统的工程架构也基本可以共用，事实上，一线公司的推荐和广告业务也往往会共享技术中台；

搜广推不分家，二者的业务形态和团队背景也都高度近似。

但如果你在两个方向都工作过三年以上，其实能很清晰的感觉到，两个方向的特点其实看似相似，工作模式实则差异很大，宏观上来说主要是以下区别：

推荐系统：推荐系统的主要目标是候选物品排序，这甚至是整个系统的唯一目标，围绕着这个目标，做深做精推荐模型几乎是唯一的效果提升途径，所以“技术精深”是推荐系统的第一特点。

广告系统：计算广告系统首先生态上就非常复杂，DSP，SSP，ADX，DMP，MMP等等，广告生态上的各个平台都是重要不可或缺的组成部分。第二广告系统技术架构本身比推荐系统复杂，除了相似的排序模块，广告系统中出价，pacing，库存预估，竞价，定向等模块都是推荐系统不具备的。所以“生态庞大，架构复杂”是广告系统的第一特点。

基于上面的技术特点，我的技术选择也就比较顺理成章了。在推荐系统方向工作的4年期间，我跟团队一起搭建了深度学习推荐系统的工程架构，模型服务体系，数据流体系，尝试了不同的模型结构，在业务上也完成了几十个点的效果提升。我几乎经历了一个深度学习推荐系统成熟过程中所有精彩的部分，自己也可以说成长为一个领域专家。再往下走，除了用同一套技术体系支持不同的业务场景，就是在已有的体系上修修补补，这不是不可以，但我个人认为不够精彩。

广告系统这时候的优势就体现出来了。不同利益方之间的关系权衡，不同技术模块之间的联合优化，虽然业界优秀团队的积淀不可谓不深厚，但显然，这其中的潜在优化点是多于推荐系统的。另外，广告团队的合作关系往往非常复杂，跟内外部合作团队的连接也比推荐团队多出很多，这也是对自己软实力的进一步锻炼。

基于上面的考虑，我微调了一下自己的职业方向，让自己的工作不确定性更强，也有更大的优化空间。事实证明，这一步走的不容易，但却完全符合我当初的期望，实现了当初的目标。

计算广告系统的优化空间在哪？还有卷的余地吗？

很多知友可能会说，搜广推，搜广推，三个业务都已经极端成熟，都已经卷到极致了，哪还有什么优化空间啊。我可以很负责的说，说这话的人要么对搜广推的任意一个系统都没有全面的认识，要么就是没什么发现问题解决问题的能力。特别是对于计算广告系统来说，几乎可以说是四处漏风，即使是业界最前沿的团队，几乎也没办法对每个模块都深入独立研究一遍，更别提模块间的联合优化了。

下面是我之前画过的一张广告系统技术架构图。随便举两个优化点来说：

DSP和ADX之间的竞价算法在流量价值方向上的优化。竞价算法有不少独立的研究，但单单竞价过程中流量价值如何衡量这一点，就很少有团队深入思考过。思考过的也仅仅是拿出一个理论框架，没法真正联系实际操作。比如CTR目标和CVR目标广告主对流量价值的判断是一致的吗？如何在一起比较确定这个流量最终的价值，进而决定对外竞价时的出价？

再比如CTR，CVR预估与pacing的结合。广告系统大致可分为效果广告和品牌广告，品牌广告有pacing无CTRCVR，这无可厚非。效果广告系统有CTRCVR和出价，但pacing仅仅负责粗力度的投放速度控制，无法做到基于流量特点分布的全局优化，这一点又有多少团队深入研究过呢？

类似这样的优化点，在仅在DSP方，少说也有几十个，更何况ADX，SSP都有站在自己利益角度的业务需求和相应算法设计，这所有的所有，充满了生态位上不同公司间的合作和博弈，真是多么有趣的问题。

爱因斯坦曾说过：“提出一个问题往往比解决一个问题更重要“。发现不了问题不能都怪一个行业太卷。当初经典物理学大厦都完备了，爱因斯坦都能生生咬出一个口子把大厦推翻，何况是这个四处漏风的广告系统呢。

为什么不是大模型？

选择了计算广告这个非常传统又看似很卷的方向之后，很多同行曾经问过我，为啥不选择那么火的大模型呢？太多大佬都投身其中，特别是清华很多实验室的老同学，优秀的师兄弟们都已经成绩斐然，风生水起，我也确实在很多大模型公司早期有不错的加入机会。这个就还得聊聊职业选择的问题，前段时间我跟很多找我咨询的新同行说，钱差不多的时候，或者不太缺钱的时候 follow your heart，最好能找到属于自己的passion。

我是一个非常喜欢研究“赚钱”策略的人。这是我加入搜广推的初衷，我喜欢看到自己的工作直接为公司赚了多少钱，越直接越好，看到一个AB Test能让公司多赚几个million，我自己比老板估计还高兴（简直完美打工人啊。。）。所以我个人对离钱比较远的方向得不到成就感的正反馈。总结来说就是人比较“俗”，对改变世界的梦想不太感兴趣，因此也就对自动驾驶，AGI，LLM这些预期改变人类从而挣大钱的方向比较祛魅。

所以工作这个东西还是要看点个人性格，了解自己，别让自己工作的太痛苦是你应该要做的，不要低估了兴趣对你长期主义的帮助。工作之外我也很喜欢研究投资策略，所以这个东西是我的爱好，那选择广告系统还有啥说的，能让我跟铜臭味一起腐烂还不高兴坏了。

当然，我对直接研究基础大模型技术本身不感兴趣，但对怎么拿大模型赚钱很感兴趣，对怎么把大模型应用在广告系统这种话题简直感兴趣到家了。所以今后，专栏也会多探讨这方面内容。

深度学习计算广告系列今后写些什么？

说回咱们的专栏，这个专栏今后会写些什么呢？其实初衷还是我自己的知识架构的构建，上次是推荐系统，这次是计算广告系统，如果在这个过程中，大家能有所收获，当然是最好的正反馈。具体到内容，还是两个标准：

1.经典

2.前沿

经典的内容比如经典的出价算法，经典的pacing方法，经典的竞价算法等等，这会帮助我们建立一个很好的技术地基，技术感觉；前沿的内容比如大模型在计算广告的应用，深度学习CTRCVR模型的最新进展，多目标学习，联邦学习的广告应用等等，这些新内容会保持我们的技术竞争力。

最后我们回答一个问题，选择了从推荐系统转向计算广告，是不是意味着推荐系统卷的价值不大了？答案肯定是否定的，因为这完全是基于我自己的客观状况，自己所处的职业发展阶段做出的决定，每个人有不同的适合自己的个性化决定，才能让整个行业更健康，万不可跟风决策，人云亦云。另一方面，推荐系统仍然是学术界和工业界最经典的应用机器学习和AI的场合，它需要工程师和研究者们进一步向精深的方向深挖推荐模型的潜力，另一方面探索推荐产品的新模式，探索新技术在推荐系统的进一步应用。

如果这个专栏的定位符合你想看到的内容，那就请点赞支持一下，给我点继续写作的正反馈吧，感谢！

往期推荐

腾讯语音合成技术：模型优化与推理加速实践

策略产品AI转型指南：能力模型与实战策略

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

RAG 2.0性能提升：优化索引与召回机制的策略与实践

人工智能在汽车智能化领域的创新应用

深度｜什么是李飞飞的AI“世界模型”，它们为什么重要？

一篇具身智能的最新全面综述！（上）

一篇具身智能的最新全面综述！（下）

智慧零售2.0：丰e足食新解法

腾讯基于 LLM 的智能数据分析平台 OlaChat 的落地实践

点个在看你最好看

SPRING HAS ARRIVED