专栏名称: 虎嗅APP
有视角的商业资讯交流平台
目录
相关文章推荐
新浪科技  ·  【#前10月一般公共预算收入184981亿# ... ·  5 天前  
新浪科技  ·  【#广州全面放宽入户条件#】 ... ·  6 天前  
得物技术  ·  Java性能测试利器:JMH入门与实践|得物技术 ·  6 天前  
得物技术  ·  Java性能测试利器:JMH入门与实践|得物技术 ·  6 天前  
51好读  ›  专栏  ›  虎嗅APP

视奸渣浪的feed流算法

虎嗅APP  · 公众号  · 科技媒体  · 2016-11-17 18:21

正文


虎嗅注:知道你们骂渣浪微博的feed流算法很久了,看看资深产品人纯银怎么看渣浪算法。本文来自简书,作者纯银,原文标题为《视奸渣浪的feed流算法》,虎嗅转载。

鉴于渣浪的微博feed流算法被骂得特别厉害,把我知道的算法公布一下。我可没什么内部消息,只不过长期视奸微博CEO的评论,再加上脑补,盲人摸象,说错了你们别怪我。

我视奸了解到的微博调整feed流算法,有三个阶段。

1、

第一个阶段是打压蓝V和营销号,从去年底开始。

蓝V就是企业认证号,对“营销号”的定义则是对百万级粉丝,高传播微博进行人工排查,把肉眼可辨识的营销号标记出来。

算法大致是这样的,这批PO主发布的内容,首先只分发给5%的粉丝,进行灰度测试。如果互动率高,进一步分发给15%的粉丝,最多也就15%。具体的数字不断调整,并不严格遵照5-15的标准。

这么做的理由是,微博认为蓝V和营销号天然有动力“大量发布内容”,尤其是非原创微博,或低价值的营销微博。这部分内容比例增大,就会挤压原创内容的曝光率,而微博的策略是鼓励原创,扶持自媒体。毕竟开心网和人人网饮鸩止渴,放纵转帖组件的恶果历历在目。

你问我怎么看呢,我其实是支持这个算法的。的确粗暴,的确不近情理,的确搞一刀切,但广州市搞一刀切禁摩之后,治安的确大有好转,我是亲历者。在当时那个feed流环境下,可能没有更好的办法,只能牺牲蓝V和营销号的利益,确保更多人的利益。反正当前阶段蓝V和营销号对微博生态的价值不大,该种田的时候就得拔草。

很多人对此评论说:“觉得烦我自己会取关,不用你渣浪多事”。我作为产品经理代答“呵呵”,翻个白眼给你看。

也有人评论说,是不是非得用这么粗暴的手段?能不能用更好的方法筛选出内容优质的蓝V和营销号,而不是一刀切?但我觉得,以优质内容的比例之少,大可不必这么折腾。毕竟企业经营不是白左小清新,讲的不是大爱无疆公平正义,而是效率与投入产出比。

不过,这套针对蓝V和营销号的算法,疑似被新的“未读池”全局算法迭代了,稍后再讲。

2、

又过了几个月,大概是今年春节后,算法的屠刀砍到了普通用户头上。正应了那句“起初他们…因为我不是…我不说话; 接着他们…我不说话;最后…再也没有人为我说话了。”

好吧我是在搞笑(可能你并没有笑),新的算法我也是支持的。

新算法大致是这样的,即便你是普通用户,长图微博被降权,转发被降权,内容触发了敏感字被降权。敏感字包括政治、情色、竞品等等。

降权的意思是,你发出的微博只会被一定比例的粉丝看到,或者在未读池里排到后面再出来。

这段时间微博面临的问题有可能是,怎样增加高价值内容的曝光率?于是对低价值内容降权。什么是低价值内容呢?比如说长图的浏览体验不如微博自家的头条文章,且内容无法导入搜索引擎,所以要降权。转发的内容价值通常不如原创,也要降权。敏感字就更不用解释了。判断高价值低价值的规则很多,我只猜到这几个。

然后你多半要问两个问题。

问:为什么非得降权不可呢?为什么不能对优质内容加权呢?
答:傻孩子,你想想,每天刷微博的时间就这么多,一些内容加权被优先看到,占据了注意力,另一些内容相当于被降权。“降权”的措辞让你心里不舒服,但结果其实是一样的。

问:凭什么要新浪微博来决定我看什么不看什么,凭什么?
答:综合微博feed流的速度,用户打开微博的频次,很大一部分内容是被错过的,这是不可避免的。微博官方有动力来优化“可见内容”的构成,这对于用户本人来说反倒是不可控的,随机性的。同样的事情Facebook做了很多年,也被用户骂了很多年,痴心不改。不改不改就是不改,你有志气就不要用。

从产品专业的角度来讲,当feed流速到了某一个地步,用算法来优化内容构成就是一件不可避免的事情,挨骂也是一件不可避免的事情。因为这个算法起作用,内容价值提升的时候,你意识不到,觉得是自己眼光好,订阅的PO主质量高。但是当你发现订阅内容丢失的时候,人之常情,必定破口大骂。

渣浪唾面自干。

骂归骂,如果feed流的内容价值真的提升上去了,你其实是离不开的。边骂边用,边用边骂。环球同此凉热,彼岸Facebook搞这套都多少年了,渣浪只是个学生。什么?你说Twitter?Twitter用没用feed流调节算法我不知道,但它的市值持续走低,用户增长乏力可是不争的事实。渣浪微博的市值已超过Twitter,这是10月的最新消息。

3、

好了,终于到了本文的重点。以上两套算法对普通用户影响不太大,那么渣浪怎么到了千夫所指,人人喊打的地步呢?是因为4月左右推出的全局算法,关键字是“未读池”。

什么叫未读池呢?就是指你订阅PO主所发的微博,如果你没刷到过,还是未读状态,就会进入未读池。

当你刷新timeline时,会按照一定的规则,一次只取出15-30条内容,而不是全部未读内容。算法优先取权重高的,刚刚发布的内容,取完以后你再刷新,从未读池里边接着提取。说白了就是“智能分批提取数据”,而不是传统的“一次性提取全部未读数据”。

我给你们解释背后的原因。

刚才提到过“feed流很大一部分内容是被错过的,这是不可避免的”。比如说你半天刷一次微博,这段时间订阅的PO主产生了80条信息,但平均下来,一次浏览的微博数量是15-30条,剩下的内容看不完,在过去,它就被浪费掉了。

被浪费掉的内容里,很可能有高价值的,特别值得看的,也被浪费掉了。

然后,你这段时间特别空闲,过了15分钟又去刷微博。这么短的时间间隔,新产生的信息只有5条。你觉得没意思,就把微博关掉了。

未读池在理论上可以完美解决这些问题。一次刷新只出来15-30条内容,符合一次浏览的统计中位数。再刷,再出,再刷,中出。直到新内容刷空了,就从未读池里提取高权重的内容,再接下来是未读池里低权重的内容。

未读池的时间容量是3天,最多存放3天的内容。也就是你发一条微博,用户在这一刻没刷到,进了未读池,内容权重又不高(排在后面分发),那就有可能第3天才被粉丝看到。当然,也有可能永远都看不到了。但你想想,如果用户“这一刻没刷到”,就算没有未读池,内容沉底在下面,很大的概率他还是“永远都看不到了”,未读池反而增加了这条微博的曝光机会。

未读池算法对浏览者的好处,一方面是你只要不停刷,就不会错过任何有价值的内容,减少了浪费;另一方面是空闲时多次刷新,多次刷出来新内容打发时光,而不是刷两下就没有了。对作者的好处,则是增加了整体曝光率——我测算自己的数据,浏览数大约增加了1/3。

多完美的解决方案啊,为什么渣浪被骂成了个猪头呢?

主要的原因是未读池打乱了时间线。微博和Facebook不一样,新闻价值更高得多,当内容在两三天内从未读池里分批提取出来,带有强烈时间属性的内容显然是错乱的。比如球赛结束两天后,你还能看见朋友为球员加油,顿时就炸了有没有。

这个问题非常尴尬,未读池显著提升了内容体验,但也破坏掉了时间线上的新闻体验。我又不是渣浪员工,没深入研究过feed流算法,我也提不出来解决方案。从渣浪一意孤行来看,未读池对数据的提升非常显著,再加上一家独大,不怕用户跑路,最后还是执行未读池方案

所以成千上万人骂渣浪臭傻逼,我不赞同。臭傻逼能做到一百多亿刀的市值?渣浪得有多丧心病狂,才能摧毁用户体验而不自知,同时市值和用户数持续上涨?

但是换个角度来看,渣浪微博的战略很好,战术低能,一以贯之。未读池算法刚上线的时候,犯了特别多的低级错误,到现在可能还有不少低级错误,挨骂一点都不冤枉。感觉上“瞎鸡巴搞,完成任务不过脑”也是渣浪传统,和微信团队的精英化是冰火两重天。

4、

文章写完了,想都不用想,就知道涌上来不少人,冲着我说“收了多少钱为渣浪洗地?”
看我口型:

“洗你XX(后两个字被和谐)”
洗你XX(后两个字被和谐)
洗你XX(后两个字被和谐)

另外,本文如出现数据错误很正常,我他妈又不是渣浪分析师,所有数字都是凭记忆随手写的。我是跟你们讲这个道理,feed流调节算法的动机是什么,好处和坏处是什么。文章也是写给产品爱好者看的——你看,我作为一只网红产品狗都会为渣浪洗地,下次再骂feed流乱七八糟的时候,可不可以想想,还有什么更好的解决方案,而不只是泄愤?

比如说,上次视奸到微博CEO在评论里跟产品负责人说:“某些特定的新闻关键字,是不是就不要进未读池了?”说明渣浪也在想办法,改进未读池带来的时间线错乱问题。很难根治,或可改善。