为什么回到计算广告领域—推荐系统和计算广告的技术特点
回到计算广告领域的决定我当初也思考了一阵子,主要的出发点是考虑到推荐系统和广告系统技术特点的差异,从职业生涯不同阶段的需求决策的。虽然推荐系统和计算广告的主流技术有诸多相似点,比如:深度学习推荐模型和深度学习CTR模型分别作为二者的核心,技术方案是完全相通的;
推荐系统的工程架构和广告系统的工程架构也基本可以共用,事实上,一线公司的推荐和广告业务也往往会共享技术中台;
搜广推不分家,二者的业务形态和团队背景也都高度近似。
但如果你在两个方向都工作过三年以上,其实能很清晰的感觉到,两个方向的特点其实看似相似,工作模式实则差异很大,宏观上来说主要是以下区别:
推荐系统:推荐系统的主要目标是候选物品排序,这甚至是整个系统的唯一目标,围绕着这个目标,做深做精推荐模型几乎是唯一的效果提升途径,所以“技术精深”是推荐系统的第一特点。
广告系统:计算广告系统首先生态上就非常复杂,DSP,SSP,ADX,DMP,MMP等等,广告生态上的各个平台都是重要不可或缺的组成部分。第二广告系统技术架构本身比推荐系统复杂,除了相似的排序模块,广告系统中出价,pacing,库存预估,竞价,定向等模块都是推荐系统不具备的。所以“生态庞大,架构复杂”是广告系统的第一特点。
基于上面的技术特点,我的技术选择也就比较顺理成章了。在推荐系统方向工作的4年期间,我跟团队一起搭建了深度学习推荐系统的工程架构,模型服务体系,数据流体系,尝试了不同的模型结构,在业务上也完成了几十个点的效果提升。我几乎经历了一个深度学习推荐系统成熟过程中所有精彩的部分,自己也可以说成长为一个领域专家。再往下走,除了用同一套技术体系支持不同的业务场景,就是在已有的体系上修修补补,这不是不可以,但我个人认为不够精彩。
广告系统这时候的优势就体现出来了。不同利益方之间的关系权衡,不同技术模块之间的联合优化,虽然业界优秀团队的积淀不可谓不深厚,但显然,这其中的潜在优化点是多于推荐系统的。另外,广告团队的合作关系往往非常复杂,跟内外部合作团队的连接也比推荐团队多出很多,这也是对自己软实力的进一步锻炼。
基于上面的考虑,我微调了一下自己的职业方向,让自己的工作不确定性更强,也有更大的优化空间。事实证明,这一步走的不容易,但却完全符合我当初的期望,实现了当初的目标。
计算广告系统的优化空间在哪?还有卷的余地吗?
很多知友可能会说,搜广推,搜广推,三个业务都已经极端成熟,都已经卷到极致了,哪还有什么优化空间啊。我可以很负责的说,说这话的人要么对搜广推的任意一个系统都没有全面的认识,要么就是没什么发现问题解决问题的能力。特别是对于计算广告系统来说,几乎可以说是四处漏风,即使是业界最前沿的团队,几乎也没办法对每个模块都深入独立研究一遍,更别提模块间的联合优化了。
下面是我之前画过的一张广告系统技术架构图。随便举两个优化点来说:
DSP和ADX之间的竞价算法在流量价值方向上的优化。竞价算法有不少独立的研究,但单单竞价过程中流量价值如何衡量这一点,就很少有团队深入思考过。思考过的也仅仅是拿出一个理论框架,没法真正联系实际操作。比如CTR目标和CVR目标广告主对流量价值的判断是一致的吗?如何在一起比较确定这个流量最终的价值,进而决定对外竞价时的出价?
再比如CTR,CVR预估与pacing的结合。广告系统大致可分为效果广告和品牌广告,品牌广告有pacing无CTRCVR,这无可厚非。效果广告系统有CTRCVR和出价,但pacing仅仅负责粗力度的投放速度控制,无法做到基于流量特点分布的全局优化,这一点又有多少团队深入研究过呢?
类似这样的优化点,在仅在DSP方,少说也有几十个,更何况ADX,SSP都有站在自己利益角度的业务需求和相应算法设计,这所有的所有,充满了生态位上不同公司间的合作和博弈,真是多么有趣的问题。爱因斯坦曾说过:“提出一个问题往往比解决一个问题更重要“。发现不了问题不能都怪一个行业太卷。当初经典物理学大厦都完备了,爱因斯坦都能生生咬出一个口子把大厦推翻,何况是这个四处漏风的广告系统呢。
为什么不是大模型?
选择了计算广告这个非常传统又看似很卷的方向之后,很多同行曾经问过我,为啥不选择那么火的大模型呢?太多大佬都投身其中,特别是清华很多实验室的老同学,优秀的师兄弟们都已经成绩斐然,风生水起,我也确实在很多大模型公司早期有不错的加入机会。这个就还得聊聊职业选择的问题,前段时间我跟很多找我咨询的新同行说,钱差不多的时候,或者不太缺钱的时候 follow your heart,最好能找到属于自己的passion。
我是一个非常喜欢研究“赚钱”策略的人。这是我加入搜广推的初衷,我喜欢看到自己的工作直接为公司赚了多少钱,越直接越好,看到一个AB Test能让公司多赚几个million,我自己比老板估计还高兴(简直完美打工人啊。。)。所以我个人对离钱比较远的方向得不到成就感的正反馈。总结来说就是人比较“俗”,对改变世界的梦想不太感兴趣,因此也就对自动驾驶,AGI,LLM这些预期改变人类从而挣大钱的方向比较祛魅。
所以工作这个东西还是要看点个人性格,了解自己,别让自己工作的太痛苦是你应该要做的,不要低估了兴趣对你长期主义的帮助。工作之外我也很喜欢研究投资策略,所以这个东西是我的爱好,那选择广告系统还有啥说的,能让我跟铜臭味一起腐烂还不高兴坏了。
当然,我对直接研究基础大模型技术本身不感兴趣,但对怎么拿大模型赚钱很感兴趣,对怎么把大模型应用在广告系统这种话题简直感兴趣到家了。所以今后,专栏也会多探讨这方面内容。
深度学习计算广告系列今后写些什么?
说回咱们的专栏,这个专栏今后会写些什么呢?其实初衷还是我自己的知识架构的构建,上次是推荐系统,这次是计算广告系统,如果在这个过程中,大家能有所收获,当然是最好的正反馈。具体到内容,还是两个标准:经典的内容比如经典的出价算法,经典的pacing方法,经典的竞价算法等等,这会帮助我们建立一个很好的技术地基,技术感觉;前沿的内容比如大模型在计算广告的应用,深度学习CTRCVR模型的最新进展,多目标学习,联邦学习的广告应用等等,这些新内容会保持我们的技术竞争力。
最后我们回答一个问题,选择了从推荐系统转向计算广告,是不是意味着推荐系统卷的价值不大了?答案肯定是否定的,因为这完全是基于我自己的客观状况,自己所处的职业发展阶段做出的决定,每个人有不同的适合自己的个性化决定,才能让整个行业更健康,万不可跟风决策,人云亦云。另一方面,推荐系统仍然是学术界和工业界最经典的应用机器学习和AI的场合,它需要工程师和研究者们进一步向精深的方向深挖推荐模型的潜力,另一方面探索推荐产品的新模式,探索新技术在推荐系统的进一步应用。
如果这个专栏的定位符合你想看到的内容,那就请点赞支持一下,给我点继续写作的正反馈吧,感谢!