1
.
互联网广告的指标简介
名词释义:
-
广告商、广告主:广告商是发布和运营广告者,广告主是委托发布广告者。例如对于下文的场景,百度、Google都是常见的广告商,而京东是常见的广告主。像阿里这样的企业,往往在互联网生态中既是广告商,也是广告主(既向媒体投放广告,自身也作为流量平台出售广告位)
-
基础指标:展点消是广告最核心的三个广告商指标,即展示量(Impression)、点击量(Click)、消费量(Cost),一般由媒体提供;广告主指标中,Order指订单量,Action指广告导致的转化量(可自由定义,常见的例如电询次数、下载安装次数、注册次数等),Sales一般指销售额。
-
ROI是广告主评判广告效果的较为核心的指标,即投资回报率,一般定义为:ROI=(Income-Cost)/Cost*100% 。可以理解为我们的利润除以付费的百分比,这个数字小于0,说明广告投放为亏损;否则为盈余,这个数字显然越大越好。
2.搜索引擎广告原理
互联网广告是个很广义的概念,包含许多种广告形式。其中最具挑战性、影响最大的,无疑是搜索引擎广告,这也是百度和Google业务的核心基础。
1.离线计算:核心是CTR预估、人群定向、广告索引等
2.在线计算:广告检索、排名等
3.流式计算:反作弊、计费、实时模型反馈等
可以看到,这个结构非常复杂,其中每一部分都历经了数十年的改进变迁。但是从搜索引擎诞生以来,其广告业务无非围绕3个问题:
下面我们就这3个基础问题,展开介绍:
2
.1
广告检索原理
熟悉信息检索的同学知道,搜索引擎进行查询的基础数据结构是倒排索引。虽然对于百度、Google等搜索引擎而言,广告信息和普通网页有很大差别,但是其索引基础也都是倒排索引。
比起普通网页信息,广告信息数据量更小,但是更为集中,例如医疗广告、中介信息等,因此极少部分term的倒排链会非常长(达到百万、千万级),而其他倒排链中几乎没有文档。这种情况下,很容易造成热门关键词竞争过于激烈,因而,一般搜索引擎会有两个思路来解决这个问题:1. 进行查询扩展,例如对“iphone”的搜索也能触发“华为P9”相关广告;2.通过定价策略等方式,促使广告主向长尾方向的关键词进行投放,避免扎堆。
2.2
计价方式
搜索引擎广告常被称为“竞价排名”,其最重要的原因是,任何关键词的点击价格,并非通过广告商主动定价,而是通过各个相关广告主的出价博弈定价。具体来说,主流有3种方式:
-
GFP:最高价得标,按出价付费,这是最常见的拍卖方式
-
GSP:最高价得标,按次高价付费,这是搜索引擎常见的计价方式
-
VCG:计算较为复杂,简单地说,是计算了最高价占据首名位置时,给后面的其它广告主造成的损失,以此为依据来计费。目前Facebook参照此方式付费
在互联网的洪荒年代,GFP曾经是Yahoo的定价方式,但是很快Google提出GSP,也迅速成为了当前的主流。其中原因,大家可以猜测求证。
2.3
广告排序和CTR预估
首先,排名为什么重要?因为搜索引擎的不同排名之间,点击率相差很大,根据Google的点击率统计,第一名是第十名的10倍左右。
出价并非搜索引擎给广告排名的唯一因素,单纯追求经济效益,可能带来用户体验上的问题。因此搜索引擎商提出了质量度的概念,广告主出价和质量度,共同影响其排名。而质量度与预估点击率(CTR),有直接的关系。(CTR预估是机器学习领域的王冠明珠,相关论文极多)
目前国内较常见的预估方法是GBDT+LR的路线,Google据传已经完全使用FTRL算法。此相关内容较为复杂和深入,此处不再赘述,可查阅文后参考材料。
3.
后记
作为广告主,目前京东是各个搜索引擎广告商的重要大客户。了解流量的来源和追踪,对于开发人员有必要意义。
广告算法领域博大精深,不仅深入涉及到信息检索、博弈论、机器学习、大数据等领域,同时自身也产生了许多理论。如广告定向、点击率预测等课题,是目前学术界和工业界的热门前沿。
参考资料:
1.《计算广告》,刘鹏著
2.《互联网广告算法与系统实践》
3.《机器学习》,周志华著
4.Google FTRL源论文:Ad Click Prediction: a View from the Trenches
5.GSP的数学证明论文:Internet Advertising and the Generalized Second Price Auction