专栏名称: 亿邦动力
电商第一媒体,每日发布独家电商重磅新闻。爆料、合作请发邮件至[email protected]
目录
相关文章推荐
杨不坏  ·  淘宝百亿超级补贴:超级符号创建时 ·  昨天  
杨不坏  ·  淘宝百亿超级补贴:超级符号创建时 ·  昨天  
黄岛主副业笔记  ·  小红书出售实践家启示录,3个月收益8万! ·  2 天前  
黄岛主副业笔记  ·  小红书出售实践家启示录,3个月收益8万! ·  2 天前  
远川研究所  ·  放弃内卷,是电商平台最大的谎言 ·  3 天前  
学习强国  ·  莫名其妙开了“先用后付”?消保委发声! ·  3 天前  
学习强国  ·  莫名其妙开了“先用后付”?消保委发声! ·  3 天前  
51好读  ›  专栏  ›  亿邦动力

2000万自媒体人必读:内容分发新逻辑全揭秘 | 一点晨光

亿邦动力  · 公众号  · 电商  · 2017-08-09 21:22

正文

Reading

这是一篇写给2000万自媒体人的文章,也希望对平台运营者和正在转型的传统媒体人有所帮助。

  



作者:吴晨光丨来自:一点晨光


全文超过14000字,粗粗看完至少需要30分钟。建议你在安静的环境下阅读——当然,如果拥有一颗安静的心,环境不是问题。


如果你不愿太费力,也可以看以下的文章摘要:


  1.   今天,内容生产的权力已经发生了转化——从专业人士到自媒体人。这就如同改革开放初期,在“国营饭店”傍边,诞生出一批个体饭馆一样。


  2.  内容分发的权力也已经发生了转化——从专业人士到社交媒体,再到算法(人工智能)。先有用户画像、再去匹配内容,这是算法的根本。相对于传统媒体和门户网站,如同计划经济到市场经济的转型。


  3.  但编辑、算法、社交三种分发模式,单纯靠每种都有问题。所以,大平台正在走向“三合一”的分发模式。微信、一点资讯是典型的探索代表者。


  4. 正因为有了“千人千面”的分发逻辑,才催生了大量长尾领域的自媒体内容的诞生。也正因为有了2000多万个自媒体账号,才会促使平台更深入研究“千人千面”。内容生产权力的转换与内容分发权力的转换,相互促进、相互依存。


  5. 自媒体人到一个平台上发文,无非想获得两个东西——利与名。利,是以钱为代表的收益;名,是内容展示、点击、分享、收藏、用户停留时长等指标的综合数据。而平台要做的事情,就是先定义优质内容,然后把利和名分配给它。


  6. 算法分发的核心有三个:用户画像、文章画像、算法模型。用户画像:你是谁,喜欢什么?文章画像:这是一篇什么文章?什么题材?什么领域?是好是坏?算法模型:如何实现用户画像和文章画像之间的最佳匹配。算法的核心难度,是体察人性。


  7. 如果你不去执着研究“冷启动”,那用户很快会走光。冷启动,就是你下载一个APP第一次看到的内容,如同谈恋爱时的第一面。


  8.  编辑以价值观为导向,算法以数据为导向。价值观保证公平,数据保证效率。我们要做的,是在公平和效率之间找到平衡点。一点资讯走的就是“有中国特色的社会主义道路”。


  9. 未来的编辑是复合型编辑,要了解算法、了解自媒体、了解短视频——因为这些都是大平台的标配。只想做蓝领的编辑,最终会被淘汰。


  10.  “格物穷理”是一个很痛苦的过程。不过一旦想通了,你就能把握事物运行的规律。如果再做到“知行合一”,就会战无不胜。


需要说明的是:此文选自我的一次内部分享。因部分内容涉及重要数据,所以删除了相关细节。但这一篇框架、结构很整的文章,每一个观点背后,都隐藏着无数次探索、碰壁和失败。“知行合一”的乐趣也就在此间。

   

最后特别感谢“一点晨光”的粉丝。很多铁粉一直在后台催促我发文。我基本都给了回复:这个公号做到现在,如果只发口水文或者鸡汤文,意义不大了。互联网上不缺内容,但缺少真正的思考。在这个浮躁的时代,更需要我们沉下心来,方有所成。

  

 

1.今天,内容生产的权力已经分配到了每个人

如上图:从一百万年前人类诞生开始,传播就由以上四个环节组成——内容获取(生产)、内容审核、内容分发,以及用户互动。直到今天,这四个环节没有发生任何变化,但就在最近2—3年里,每一个环节的内涵发生了本质变化,特别是在内容生产和内容分发环节。比如,在门户时代,我们强调的是海量和快速;而在今天,我们更强调丰富与精准。


首先,我们来看内容获取层面(或者内容生产层面)的变化。


2016年,我曾提出一个概念——内容生产权力的转换。以前,谁有权力生产内容?是我们在座的人,以及我们的合作伙伴——包括新华社、中央电视台、中国新闻周刊等等。也就是说,媒体专业人士拥有生产内容的权力,这些专业人士是职务行为,其实代表其背后的媒体机构。但现在,每一个自然人都有生产内容的权力,这就是自媒体。


据不完全统计,2017年年中,微信公共账号注册超过两千万个,其中两百多万个为活跃账号。而在一点资讯平台上,2015年8月,我接手的时候,只有不到5000个自媒体,而现在一点号(也包括我们的友军凤凰号),已经接近50万个,每天发文近20万篇。


再看下面的数据:最近一周时间里,在一点资讯App平台上,自媒体的展示量、点击量、分享量、评论量占、收藏量、阅读时长都超过了90%(其余为RSS抓取等方式接入的内容所占的量);而在两年前,这些数据不到30%。


所以,在这样一个“人人都是内容生产者”的环境下,我们要认真地去面对今天的形势,去协同作战、精细化运营。


 2.自媒体运营之道——重新定义优质内容


怎么去运营自媒体?首先,要有这样的胸怀——天下所有优质内容都应该为我所用,天下所有优秀的自媒体人都应该是我们的作者。打破什么东西都要原创的思维,因为读者(用户)根本不关心你的内容是不是原创,他只关心内容是不是好看、是不是重要、是不是他感兴趣的。


自媒体运营之道的核心,在于能否为优质内容提供“利”与“名”。为此,我们需要做以下的思考:


第一,  什么是优质内容?

第二,  给优质内容提供什么样的利?

第三,  给优质内容提供什么样的名?


我进入媒体行业已经整整20年,关于优质内容的定义,其实是每一天都思考的东西。如果从文章(或者视频、图片、直播等)角度而言,无非是8个字:选题、采访、写作、包装(主要包括标题和图片)。关于好的选题、好的采访、好的写作、好的包装,这些已经阐述过多次,如果大家有疑问,可以看看《超越门户》和《自媒体之道》这两本书,我就不再累述了。


但这里插入一个案例,就是腾讯同仁对优质短视频的定义。



确实经典——能总结出这样的话,证明他们是在认真思考。短视频正值风口,也希望大家在这方面多一些想法。


对于优质内容定义的第二个维度,是自媒体号。它相当于平面媒体时代的“栏目”,是文章的集合。公号是否优质,可以从以下六个维度定义。


第一是原创度。“天下文章一大抄,一把剪子一把刀”,有了电脑和互联网,抄袭的成本又变低了很多。正因为自媒体号互相抄袭情况非常严重,所以优质号必须是原创。


但我们必须要清楚,怎么去定义和鉴别一个公号是否原创。在网上搜索资料作为背景补充在文章里,或者对已知内容进行分析后提炼出自己的观点——这不能算抄袭。所以,要能界定特别是标题、图片、文章的重合度比例问题。也正因为自媒体的量很大,所以这事情也不是人干的。而是要通过一套版权系统,进行梳理对比。技术应该能够鉴别全网谁是首发,重复度有多少,并去清理“做号党”。现在,“做号党”已经形成了一个产业——他们很善于捕捉热点,并迅速搜索热门文章,东拼西凑,再搞一个标题党,以骗取点击。“做号党”生产的内容一旦进入我们平台,会大量瓜分流量和补贴,导致真正的原创优质内容进不来,而且会引发大量的版权官司和投诉。


第二是垂直度。迄今为止,一点资讯还有很多内容是通过RSS抓取方式接入的。特别是一些大内容源,比如新华社。我们也会按照稿源的质量对它们进行评级,从一级到六级,由差到好。那么问题来了,新华社的内容,有经典的也有一般的,你怎么定义它的级别?但这个定义很重要,因为它直接关系着内容分发的权重。


所以,我们要对新华社的内容进行拆解,比如拆解成新华时政、新华财经、新华军事、新华娱乐、新华文化等等。如果新华时政是最好的,就给它评六级;新华XX是最差的,只给它二级(我只是打个比方,新华娱乐还是很好的内容)。而新华时政可以再拆解,比如人事变局、官员落马、重大会议、政策解读等等。每个领域,我们都可以定义它的级别。


拆解到最后,就是各种各样的“号”。拆分得越细,越有利于分发——除了明确好坏之外,还有很重要的一点:可以更精准分发。我们知道,一点资讯的分发逻辑是千人千面,如果我们的号定义得非常精准,推荐文章时也就非常精准,就可以把相关内容发给对它感兴趣的人,增加文章的点击率——这是个效率问题,之后我会详细讲解。


第三是活跃度。账号——特别是高级别的账号,每周、每月发文的数量和比例,这就是活跃度。但更精细化的运营,是我们要比与“友商”平台上的发文数、发文质量,以及发文时间的差距。我们必须清楚:一篇时政文章,如果在对手的平台上先发了,晚多少时间我们可以容忍;一篇财经类的文章,晚多少时间我们可以容忍……有些内容,如果差上一两个小时,即使发了,意义也不大了。这种精细化运营的思路和方式,一定要贯穿工作的每一个环节。


第四是关注度。这个概念,是我第一次正式提出来。所谓关注度,是指某个自媒体号的用户订阅数,以及用户订阅之后,这个号与他之间的关系有多密切。


为什么大家愿意在微信上开设自媒体号?除了玩微信的人多之外,微信公众号的订阅关系非常明晰——粉丝订阅之后,只要发文,就会给用户很明确的提示。而在其它平台上,这个功能需要加强。


我们先要建立订阅功能。这个相对简单,在产品的文章页上加个按钮就可以了;也可以在首页流直接推荐公号。方法有很多,但订阅之后的关系是非常复杂的:比如,是不是要PUSH?网易号就有这个功能——当你订阅了某个账号之后,会给你PUSH这个公号发出的内容。但如果你订阅了100个账号,PUSH哪个?在PUSH的同时,要不要给你推荐到首页流?推荐到第一屏,还是第二屏?推荐的频率是多高?这种推荐,与你后期的点击、分享等行为有什么关系?总之,这涉及算法,非常复杂,不是一蹴而就的事情。但如果不建立订阅功能,自媒体人就永远也找不到自己和用户(或者说是读者)之间的关系,他就不愿意来这里发内容。


第五是知名度。这个很好理解,就是自媒体作者的身份,或者说江湖地位。我们又把自媒体人分为三类:名人、达人、普通人。名人是指他具备社会知名度——比如姚晨;达人指他在某个领域具备知名度——比如吴晨光,影响力仅限于传媒圈。这两类人来一点资讯开自媒体,我们在内容的分发上是加权的。也就是说,同样质量的文章,我们优先分发名人写的。我们也在努力,把一点平台上的普通号培养为达人号、名人号,这是平台的责任。


最后是内容质量。号是由文章等内容构成的,内容质量决定了公号质量。关于内容质量的定义,前面已经说过了,不再累述。但要强调是,每一个维度的背后,都是一套体系——包括产品、算法,也包括对数据细节的洞察。对于编辑,这些都是很新的东西,转型之道,也从此开始。




 3.自媒体运营之道——何为“利”


 大家先看看下面的表格:

  


大家请看一位自媒体人统计的表格。包括一点资讯的一点号、今日头条的头条号、网易的网易号、UC的大鱼号、企鹅的自媒体平台,以及微信号。通过这张表格,你可以看到,平台给自媒体人带来了哪些利益。


“利”,我对它的第一个理解就是钱。自媒体人需要钱。因为在座的诸位都有工资,比如说我,“一点晨光”这个自媒体号,只是我在玩票。但很多自媒体人没有工资,他们能靠平台收益带来生活的基本保障。所以能给他们带来多少钱,是他们是否选择你所在平台发文章的基本点。


各个平台就此展开了竞赛。你一个一千万,我给一个亿,下一个号称十亿、二十亿,还有人打出了一百亿的招牌。但钱真的是越多越好吗?我认为未必。如果钱都分给了“做号党”,那就是适得其反。所以,我们一是要定义优质内容、原创内容、独家内容,另外,要有一个非常科学合理的分配机制。


钱究竟应该怎么分配?在这个平台上,频道、领域有很多,他们对平台的流量贡献,应该是在钱的分配上很重要的一个因素。各种数据可以反映出来。目前,娱乐是某平台流量的第一贡献者,所以,我们把最多比例的钱分给娱乐。娱乐里面我们再继续拆分,明星、综艺,还是电影、电视,我们按照流量再进行拆解。这个比例,也不是一成不变的,应该按照每天、每周、每月的实际情况进行分析,然后调整分配模型。我们也可以人工提高在某一个领域的钱的投入——如果我们想做大、做强某个领域,或者我们有个判断,就是这个领域的优质内容严重不足而用户又有巨大的潜在需要。


而上文所说的自媒体的原创度、垂直度等指标,也是衡量对钱的分配的重要因素。比如某个账号,它的文章数据都很好,但全部是转载甚至抄袭的。这样的号,我们就不能给它钱。因为它破坏了平台的规则,它的流量带来的是“负能量”。姑息纵容,会导致原创的、优质账号的离开。这和管理企业一样,不能让劣币驱逐良币。


在“利”里面,除了钱之外还包括资源。给自媒体人的钱不到位时,可以提供其他资源作为补偿。比如,我们可以在文章内插一个链接,点击这篇文章通?过这个链接进入电商平台下单,然后让用户和平台对利润进行分成。我们也可以给出广告位,让自媒体人自己运营获利——当然,前提条件是,我们要有配套的广告审核团队。不能把虚假广告带过来,让用户变成魏则西。


目前,一点正在大面积寻求资源的对接与合作,这和我们公司的整体战略也是吻合的。今年3月,我们把视觉中国的图片资源接入,自媒体人可以从2000万张图片中选择他们喜欢的进行配图,高清、免费而且不用担心版权;今年7月,我们把GIF图接入,自媒体人又可以在100万张动图里做出选择。一点是除微信外,唯一一家为自媒体提供GIF图片服务的平台。


当然,我们开放的各种资源,是要和自媒体人在这个平台上的贡献度成正比。比如,谁有资格拿到点金、谁有资格免费使用图片等等。也因为有了利的诱惑,所以自媒体人才会不断写稿、写好稿。如果用一句话来形容,就是我们需要自媒体有更多的“资产”放在这个平台上,他们才能产生黏性。你可以想想微信,什么离不开?就是因为你在微信里的资产很多——包括朋友、钱包、信息流等等。


 4.算法是如何控制“名”的


除了利,平台还要为自媒体人提供“名”。


名就是影响力。如果从单篇文章的角度说,它包括:点击数、分享数、评论数、收藏数、用户停留时长等;而对公号来说,名是订阅数以及订阅后公号与读者之间的黏度。 



那么,谁又有权力对内容进行分发?在传统媒体时代,只有编辑拥有这种权力。比如,点击数取决于文章的位置、曝光时长,也取决于标题和配图,这就是编辑的权力。而分享数取决于文章的质量,评论数取决于能不能挑动社会情绪,收藏数取决于文章有没有价值,用户停留时长取决于文章质量。这些,都是要靠人来运营的。


但在今天,由于社交媒体的兴起,专业人士之外,社交媒体中的每一个人都有权力发言、转发;人工智能的应用,则让算法同样具有了内容分发的权力。


因为一点资讯是一个靠人工智能分发的App,我们就跳过社交,进入算法是如何进行内容分发的环节。


在这里,先要讲个小故事,让大家弄清楚几个概念:人工智能、机器学习,以及算法主导的内容分发。


这个故事,讲述的是“我”是如何在老板的眼皮底下看日本AV动作片的。



图说:有谁认识这位同学,请举手!


我的工位就在老板办公室附近,每次他出门都要经过。可我非常想在上班时间看日本动作片。于是,我首先要安装一个摄像头,摄像头对着他办公室大门。只要他一出办公室门,摄像头能就拍下他,然后传输到我的电脑上。我在电脑上放了“一点资讯算法分发逻辑”的屏幕保护,只要镜头拍到他,屏幕就自动从动作片跳到“研究算法分发”这个页面上,老板就会认为我在努力工作。


核心的问题来了——为什么只要摄像头拍到他,我的屏幕就能变化?因为我做了一套人脸识别系统。我用尽一切手段(包括上百度搜索、贿赂他的秘书等等),收集了老板10万张照片,然后输入到我的计算机里,计算机对这些照片进行学习(学习又分为有监督学习、无监督学习、半监督学习、深度学习等等,总之就是拼命学),于是可以判断出摄像头拍到的照片和我输入的照片的相似性。一旦相似度达到一定的数值,就认定是老板走过来了。于是就给屏幕下达指令,迅速从AV切换到研究算法分发的页面。


这就叫人工智能(AI)。人工智能是最大的概念。而向计算机里输入照片,学习辨别此人是不是老板的过程,就是机器学习。人工智能有很多应用,比如这个小故事里讲的叫“人脸识别”,此外还包括无人驾驶、健康诊断,著名的阿尔法狗则是人工智能在围棋领域的应用。在一点资讯的应用,就是通过算法分发信息,实现千人千面、私人定制。


全球最伟大的人工智能公司是谷歌。他们有一个机构叫“谷歌大脑”,主要研究人工智能的应用;中国的百度公司也在向人工智能公司进发,他们通过搜索积累了大量的数据,这就如同上一个小故事里讲的搜集照片的过程——没有大数据,无法实现人工智能。


现在回到人工智能在信息传播上的应用。要实现精准分发有三个要素:一是用户画像,二是文章画像,三是算法模型。


用户画像:他是谁?喜欢什么?

文章画像:这是什么内容?是图文、视频还是图集?是时政、社会还是财经?这个内容是好是坏?

算法模型:用户画像和文章画像之间,以什么样的方式来匹配?


先看用户画像。



如上图展示:在用户画像中,生活环境是基础。生活环境又包括两个层次,第一是地理位置。一点资讯已经能定位到商圈和小区,而百度地图、滴滴打车已经能实时定位到你站的地方。衣食住行、水电煤气,包括政府提供的产品服务,都和你的生活环境、地理位置有关系,所以,地理位置越精准越好。


时间场景来说,早上推的东西应该是硬的、偏资讯类的内容,因为过了一夜,大家需要看到昨晚发生了什么。而且,上班族在早晨都比较忙,没有时间看长篇大论。到了晚上则相反,用户有时间而且希望放松,所以需要推送偏软性、偏娱乐的内容,包括一些美文——在安静的夜里,才能读出其中的味道。


第二个层次是手机环境。它同样包含两个含义,一是手机型号,不同型号的手机使用者的阅读习惯是不一样的,比如红米用户和苹果用户。即使是同一个品牌的手机——OPPO A57和OPPO R11,使用者的阅读习惯也是不相同的,这都需要我们通过数据去洞察。另外,我们的手机里激活了哪些软件,使用的频率如何,在不影响用户隐私的情况下,都需要去深刻洞察。


第三个层次是用户信息。如果你是注册用户,你的性别、年龄、身份、学历等,都可以成为我们判断你兴趣的依据。另外,为了把一个用户画像描述得更精准,一点资讯设计了一个开屏问卷——问用户喜欢什么。有超过50%的用户做了选择,于是,我们能够了解到他们的基本兴趣。当然,也有人不愿意填写,甚至不愿意透露自己的地理位置。所以,这就给我们提出了难题——冷启动时,应该给用户提供哪些信息。


冷启动,指用户下载某个App后第一次打开它的过程。正如同恋爱的第一次见面,它的重要性毋庸置疑。而在冷启动中,重中之重则是用户打开之后呈现的第一屏,大概有5条信息。测试表明,如果在这5条中,用户点击了一条,那么它的次日留存率就会比没有点击的人高一倍。所以,花多大精力去打造这5条内容都不为过。为此,我们做了大量的对比试验——包括尝试推送相关型号手机的资讯,包括推送相关地理位置的资讯,有成功也有失败。在冷启动中,因为用户画像不够清晰,所以基本原则应该是推送重要事件、大概率领域(比如足球,而不是高尔夫球),而不能推送拿些小众内容去赌,否则你很容易失败。


当用户阅读完冷启动首屏内容之后,可能会产生五种情况:


(1)有点击下拉;(2)无点击下拉;(3)无点击上滑;(4)有点击上滑;(5)直接走人。针对这些不同的行为方式,我们应该启动不同的策略。这需要非常细腻的数据观察,要从中总结规律。从此,用户的行为也变得多样化——比如点击、分享、收藏、评论、用户停留时长等等,这都是算法判断推送哪些内容的依据。


这是一个非常复杂的运算过程。比如,有个用户点击了五次“吴晨光”,搜索了一次“邹明”(凤凰网总编辑),如果只给他推一条,应该先推“吴晨光”还是“邹明”?从数量上来说,一定是“吴晨光”更多,但是搜索属于深度行为,他主动去搜索说明对“邹明”很感兴趣,这种情况应该去推谁?


再如,他点击了五次“吴晨光”,点了两次“邹明”。但关于吴晨光的优质内容没有了,只有关于“邹明”的好文章,那是应该推一条很水的关于“吴晨光”的文章,还是推出关于 “邹明”的好文章?


还有,他点了五次“吴晨光”的图文,要不要推一个视频、音频或者问答?或者一个用户很喜欢“吴晨光”,今天突然出了“邹明”的绯闻,是应该把“邹明”的热点推出来,还是,依然根据用户的兴趣继续推“吴晨光”?


所以,用户画像的复杂性,不是简简单单的群体划分问题。它是对人性的深刻洞察,一个行为,比如点击,背后的含义也完全不同,有的是因为真的感兴趣,有的是因为标题党。


再看文章画像。对于编辑而言,文章画像相对简单,因为这是我们的专业。在传统媒体时代,我们就对文章进行画像——比如说消息、通讯、特稿,还包括我一直在尝试的调查报道和解释性报道。


当然,今天的文章画像的复杂性远远高于传统媒体时代。因为这里的文章泛指内容,而不是单纯的文字概念。它包括:


体裁——是文字、图片、视频、音频、直播,还是问答,或者类似微博的短内容?


作者——作者其实代表着背后的自媒体号,包括它的级别、知名度、订阅数等;


标签——这是对于文章描述的领域的认知,比如体育—足球—中超—国安。我们把打标签的权力交给了自媒体作者,他们可以在自己生产的内容下打好标签。同时,我们的审核编辑、频道编辑会修正标签;算法也会对标签做进一步调整。最后综合评判,给文章一个最准确的定位。如果是算法很聪明,做了深度学习,那么还可以分析出更多关于文章的特点,也就是像人一样,去理解文章的中心思想、段落大意。当然,这个很难。特别是对视频、图片的识别更难。


内容质量——它有两个维度,第一是编辑判断,第二是算法判断。编辑的判断前面已经讲过,无非是选题、采访、写作和包装四个维度;而算法判断无非依据数据,还是点击、分享、收藏、用户停留时长等等。


用户画像有了,文章画像也有了。我们现在开始匹配。匹配的依据就是算法模型。我们可以把模型做详细拆解,分为很多模块——比如垃圾过滤模块、热点模块、本地模块等等。算法在每个模块里,进行文章的挑选、排序;不同模块里的文章也在进行竞争、排序。最后择准、择优分发给用户。


我们以热点模块为案例,做具体分析。


热点是一个很好理解的词,就是刚刚发生的、关注度较高的新闻。它有别于其它非时效性的资讯。首先,我们要告诉算法,什么是热点。这里有很多方式——比如,监控百度。百度热搜词可能就是热点。在一点资讯要闻频道,编辑置顶的也是热点。我们还可以人工定义一些文章是热点:比如挂“新华社快讯”字头的就认为是热点。这是第一步。让算法了解热点,这就是机器学习。


第二步,我们要把热点内容做“召回”。这里的召回和问题汽车的召回不一样,是指把相关热点文章聚集在某一个池子里。我们称之为“热点池”。我们会把热点池分若干层次,在3年前,我就在《超越门户》中描述了搜狐网重大突发事件的规则,从三级到特级。来一点资讯做总编辑后,又进行了进一步修订。现在,我们把标准通个案例的方式输入计算机,让算法来判断热点的大小,以决定向什么样的群体进行推送。



图说:《超越门户》一书中,有编辑对重大突发事件处理的详细分级标准,现在我们要让机器学习,做更精准的分发。


下面,我们再来看文章分发的全过程。注意此图:


文章分为两个类型——抓取源文章(RSS)和自媒体文章。但不管什么样的文章,都需要经过反垃圾模块的过滤,去除有害政治信息、低俗内容、虚假广告、“标题党”文章等。所以,反垃圾模块里应该有这些功能。如果你问,这些功能是如何实现的,那还是前面提到的答案——输入案例或者关键词,让机器学习,找到特征并举一反三。


垃圾过滤之后,算法或者编辑给文章打了标签、做了分类,文章就聚集在各种池子里。刚才说了,这个过程就叫做召回。按照文章的标签分类以及不同的属性,它们被分配到各个池子里——包括我们刚才所说的热点模块、本地模块,还包括被编辑挑出来的好文章,进入精品池模块。如果有些文章又有本地属性、又是精品,就会同时放在两个池子里。还有一些文章,被打上了体育标签或者财经标签,就放在了体育或者财经的池子里。


最后到了分发过程,主要是针对某一个用户,这么多内容先出谁后出谁。这就是排序。用户下拉首页流看到的内容,就是排好序的。其它频道流也是如此。排序具体的规则取决于算法,也就是说用户画像、文章画像和算法模型之间的关系。刚才,我们已经讨论过了。


关于如何去衡量分发的效果,大概有几个点:


第一是准——推的东西就是用户喜欢的;

第二是快——好内容要第一时间推送;

第三是优——同一领域的文章,一定是先推高品质的。否则,我们的优质内容就没有流量,获得不了利益和影响力。优秀的自媒体人也会因此远离这个平台,进而形成恶性循环。

最后是宽——不让用户陷入信息孤岛。要有准确的兴趣探测,能预判你喜欢什么不喜欢什么。这就是我们讲的,保证用户的更多“知情权”。


 5. 趋势:编辑、算法、社交分发三合一


完了微观的运营,我们返回头来看看宏观。刚才我们说了,已经有三个人拥有了内容分发的权力,而最新的趋势是,编辑、算法、社交这三种分发模式,正在融合之中。

大家请看下面三个例子:


A.微信“看一看”功能。


我们知道,微信是最典型的社交工具,而它的“朋友圈”功能,其实是一个社交属性很强的信息流。你的好友在做什么、看什么、关注什么,通过朋友圈一目了然。2016年6月15日,微信的一个小功能—— “朋友圈热文”悄然上线。据微信内部人士透露:在最初的一段时间里,只有大约10%的用户开通了这个功能;即使在9个月后的今天,该功能也并非对全部用户开放。而从这个产品的位置来看,也是“庭院深深深几许”,藏在三级页面之后?。


但开发者为这个产品赋予了一个大气的口号:“发现更广阔的世界”。他们试图通过这个产品,把微信上2400多万个公众号里最优质的内容,以“微信头条”的模式呈现在6.5亿用户面前。


 “朋友圈热文”的来源,是所有微信用户转发到朋友圈的超链接内容(主要是文图模式)。微信团队的解释是:“此功能通过对微信用户行为习惯的深入分析,基于用户的选择,会优先推荐(a)用户关注的公众号文章和(b)好友阅读过的原创文章,同时也会(c)精选整个微信平台上的优质文章。”


热文中公众号的权重是优质,具体体现如下:


基本权重指标:认证号(比如新京报的官方微信号)权重高于个人号,原创号的权重高于非原创,用户关注的号及用户朋友关注的号权重更高,但与公众号粉丝数没有直接关系。

从这个逻辑上看,微信团队对原创内容的重视至高无上。在其2400万个公号中,活跃账号约占1/10,而被认证的原创账号已经超过50万个。微信采用各种方式扶植原创——比如说打赏功能只对原创作者开放,此次又是信息流的优先推荐权。所谓的“认证号”也是原创的标识之一。


.粉丝活跃度:包含文章点击率(打开率)、粉丝消息及留言互动频率、留言内容的点赞率、阅读原文的打开率等(注意都是“率”,而不是“量”)。


公众号搜索频率:如果公众号经常出现在用户的搜索结果中,并且被点击关注,也可提高公众号的推荐权重。


关键词匹配度:公众号名称与简介的关键词匹配度;公众号名称及描述的关键词与内容关键词匹配度,匹配度越高则权重越大。


而在这个产品的进化过程中,我们还发现:


1.很多文章的左下角,都有标签。主要包括:


(1)已关注:说明你已经订阅产生此文的公号。

(2)好友都在读:说明你的朋友们在阅读此文(但具体点击率到一个怎样的比例才会获得这种推荐,还没有获得具体数据)。

(3)XX人都在读:比如北京人、河北人,说明某一个地域的人都在阅读此文。

(4)XX精英、XX爱好者都在读:说明某一个圈子(如IT人群)都在阅读此文。XX人群,应该来自用户的注册信息。


2.在文章的排列逻辑上,可以参考下图:

3.个性化推荐的算法逻辑,在越来越多地融入推荐中。比如,你连续两次点击了关于“星座”的文章,“朋友圈热文”会在第三刷的第一屏、第四刷的第一屏连续推荐关于星座的文章。


对于微信而言,即使不用社交逻辑,仅仅是它对某一个用户的信息获取,就已经无可匹敌——你在注册时,它获得了所有个人基本信息;你进群时,它对你的身份信息又进行了验证;你在刷朋友圈内容时,它获得了你的阅读兴趣;你在消费时,它获得了你的金融信息,这是一个用户最核心的信息,你的花销很大程度上代表了爱好。


这可能是该产品“最危险”的地方,它标志着一种新的推荐逻辑,以社交、圈层为属性的内容分发,正在与以算法、个性化推荐为属性的分发,逐渐结合在一起。


而在两个月前,“朋友圈热文”已经改头换面为“看一看”。入口变浅并覆盖全体用户,“微信头条”的功能已经初具规模。



B.一点资讯“编辑+算法”的分发理念


一点资讯的分发理念与头条相近,但不等于头条。今日头条的负责人曾经说过,头条没有总编辑,也没有编辑,不负责提供价值观(其实头条也是有总编辑的,还有不少编辑)。但一点资讯不能如此——我们强调编辑与算法的融合,主要我们要一起解决问题——特别是公平与效率的问题。


从所有数据上看,算法分发的效率一定高于人工,特别是点击率。因为算法可以根据你的兴趣进行分发,给你想看的东西。但也正因为如此,会导致“标题党”内容泛滥、导致口水文章泛滥,也会导致用户陷入兴趣孤岛。而这损害了“公平”,这里所说的公平,是指重要的、有一定价值观的,但用户不一定那么关注的内容。比如,中国科学家屠呦呦获得了诺奖。与那些明星绯闻比较,如果单纯靠算法,这篇文章肯定没几个人看。但这么重要的内容,我们能只靠算法去推动吗?再如,贾跃亭去职乐视董事长,如果让算法判断,这就是一个财经新闻或者科技新闻,不可能推给大众用户。但我们不能如此,因为我们是媒体。对公众的知情权和社会的进步,我们有责任推动。


特别是在热点事件上,算法还是有天然的弱势。因为算法判断热点,需要根据用户点击率的提升、百度等平台热词的提升等手段,是有一个过程的,也许是15分钟或者更长。但编辑可以在5秒钟之内判断热点。所以,在重大突发事件上,一点资讯已经有非常大的优势。我们在重大事件上的PUSH,几乎次次都是商业网媒体第一。这背后,就是人工推动。但如上文所说,热点池的建立,也是为了让算法尽快学习编辑的判断力,早日超过人工。



 6. 关于产品与转型


最后谈关于产品的问题。


水相当于内容,我们要把它盛到一个杯子里,杯子就是产品。杯子设计得好,我们喝水才舒服。至少不能漏水。


在我的理解中,产品应该有三个体系:


第一是2C的——给用户的;

第二是2B的——给自媒体作者的;

第三是2E的——给编辑提供的运营工具。



以自媒体的产品为例子,2C主要是用户的基本体验,这个还涉及一些产品的核心功能——比如我们的搜索订阅功能,如果一个自媒体号和一个频道重名,搜索结果(SUG)的排序问题。


2B端,我在最初做自媒体的时候提出了12个字,“入驻易,发文快,影响大,挣钱多”目前,B端的核心内容就是积分体系问题——能够更方便地给优质自媒体人提供名与利,让更多的资产留在我们的自媒体平台,比如免费图片、数据统计、一键导入、视频功能等等这些权限都跟积分制有关系。


2C端的核心是,能够更快速监控与查询。


好的产品不是反复去和用户说教,一定是用户自己愿意用。所有用户,都是又懒又傻又白(不是说大家不好,其实我也是这样),产品功能越方便越实用,他们越喜欢。否则,傻瓜相机也不会发明。


关于算法的问题、自媒体的问题、产品的问题,都是这个时代编辑需要深刻理解的。有些编辑和我抱怨,说频道“人少活多”,而且活很杂,不如在平面媒体时工作那么聚焦。我说这是好事啊,从微观来说,是对你个人层次的提高——不想当将军的士兵不是好士兵,不想当总编辑的编辑不是好编辑;从宏观来说,这是新媒体时代的要求——我们不是搬砖工,我们是建筑设计师。


有些同学说我之前没干过,或者公司招聘我的时候让我做的是另一个岗位,现在我适应不了。我说自媒体我以前也没干过,但现在必须干,因为这就是时代的要求。


如果你真的干不了,只有一条路:离开。我也是如此,公司不会因人设岗。特别是一点这样的创业型公司。


还有人说,我不了解算法,对这个没兴趣。如果你不了解算法,你就会被淘汰,因为它代表了先进的生产力。我们也不能因为算法出现了问题,就回到人工编辑的老模式里。这就像马车没有汽车跑得快,但汽车一定会带来更多交通事故一样,我们不能因为汽车出现了交通事故,就说我们今天不造汽车了,或者像慈禧一样让几匹马拉着火车头往前跑,这是时代的倒退。


我再强调一次,算法的先进性在于提升了分发的效率。因为它以数据为依据。数据是用户行为习惯的反映,我们对数据不敏感就代表不理解用户,不理解用户怎么提高分发效率?真正的转型,一方面我们要坚持编辑的理念、价值观和情怀,另一方面对于运营的结果而言,数据是很重要的,千万不要忽视每一个百分点的变化。



大家还要充分理解我们在公司里处的位置。以前,我们强调“内容为王”,但这是一个片面的概念。正如上图所示,内容只是其中一环。内容放在产品之上,这就是水和杯子的关系。最下面的“一”是渠道,没有苹果、OPPO、小米、华为这样的渠道,就没有人知道一点资讯。中间的“1”,是技术或者说是算法,就像配送员一样,把内容精准地推出去。而用户,凌驾于这个“王”之上,只有拥有了用户,才能主宰天下。


1992年,我进入大学的那年,中国发生了本质性的变化,从计划经济转到市场经济,当时叫 “有中国特色的社会主义市场经济”。计划经济是啥?国家规定生产多少吨钢、多少吨布、多少吨米,然后分配给每个人,你有多少、他有多少,要用布票、粮票来买。现在不一样了,我们是根据市场的需求去生产,市场需要多少吨钢、多少吨米,然后使用价格杠杆来调解供需。这种转变,和我们媒体今天的转变一样——内容生产和内容分发都发生了本质的变化,所以,我们必须转型。再抱着计划经济的思维,死路一条。你看,以前计划经济时代,饭馆都是国营的——这相当于我们的机构媒体;现在呢,国有老字号还存在,但绝大多数饭馆已经是“个体户了”,这就相当于我们的自媒体。怎么去管、怎么去用,就是时代给我们的新挑战。


最后回归到主题——今天讲的是“道”的问题。道是什么?是万事万物运行的规律。掌握道的人,可以战无不胜。那么怎么掌握道?前辈已经告诉我们了,就是“格物穷理”。


它来自“心学”创始人王阳明。“心学”核心的八个字,就是“格物穷理,知行合一”。所谓“格”,是分析;比如格竹子,来分析它的结构。格来格去,你就会明白它的生长规律。



“格物”的过程是非常枯燥的。今天讲的这些东西,是我“格”了两年的总结。好多东西一开始根本想不通,就像当年王阳明在想清楚“天理即是人欲”前的痛苦。


但人最痛苦的时候,往往是将发生质变的时候。我的记得是在今年春节三十晚上,我在办公室值班。外面鞭炮隆隆,我的内心无比煎熬。我想起两年前的春节,就是这样一个礼花灿烂的夜里,我完成了《超越门户》一书的序言。后来,这本书成为传媒界的经典之作。2017年春节,我也要做一点东西,于是不知道哪里来的灵感,我就手绘了这张图。当画完图的时候,我的眼前豁然开朗。这个演讲里所有的东西,都在这张图上了。我仰天大笑,因为我又上了一个境界,而新的未知也展现在我面前。



你有什么看法?欢迎在底部留言