专栏名称: 国际新闻界
新闻传播学科唯一的国家社科基金首批资助期刊、全国中文核心期刊、全国新闻核心期刊、中文社会科学引文索引(CSSCI)来源期刊。
目录
相关文章推荐
高分子科学前沿  ·  南方科技大学赵天寿院士、李一举等《Angew ... ·  5 小时前  
高分子科技  ·  天津大学宋东坡教授课题组 Angew: ... ·  昨天  
高分子科技  ·  清华大学杨忠强课题组 Matter ... ·  昨天  
高分子科技  ·  天工大高辉/余云健、吉林大学杨英威 ... ·  2 天前  
高分子科学前沿  ·  香港中文大学魏涛、许建坤、秦岭《AM》:组织 ... ·  3 天前  
51好读  ›  专栏  ›  国际新闻界

热搜代表民意?大众媒体对热点算法的合法性话语建构

国际新闻界  · 公众号  ·  · 2024-07-02 14:59

正文

本刊官方网站:

http://cjjc.ruc.edu.cn/

摘要

以往,大众媒体主要通过民意调查来量化民意;如今,微博热搜日益被视为民意的风向标。本文应用民意基础设施模型,采用文本分析、访谈和内容分析法,考察热搜定义和测量民意的方式,以及大众媒体如何看待和阐释热搜。研究发现,随着2018年上榜规则的调整,热搜糅合了“个体的搜索痕迹聚合”和“公众之间的互动和交流”,前者是个体的、私下的、平等的,后者是关系的、公开的、分层级的,标志着“一人一票”逻辑向“优先考虑明智舆论”的转变。媒体将热搜描绘为民意的代名词,常使用“冲上热搜”“热搜第一”作为评估公众反应的基准,进而合法化了热点算法的知识逻辑。该发现有助于修正“党媒对算法持批判态度”的结论,未来研究可纳入更多“人与算法相遇”的具体场景。


作者简介

王茜,郑州大学新闻与传播学院副教授。


孟志杰,郑州大学新闻与传播学院硕士研究生。


张璐,郑州大学新闻与传播学院硕士研究生。


基金项目

本文系郑州大学新闻传播学学科建设专项课题(项目编号:21XKJS018)、河南省哲学社会科学规划项目(项目编号:2023CXW024)阶段性成果。




研究缘起


“除了统计选票数以外,如何探明多数人的意愿?……按周按月地考量或者是测量民意的机器尚未发明出来,也不可能被制造出来;然而,对统治者来说,也许会有一个倾向,要连续不断地寻找当前大众意见的表现,并且按照对这些表现的解读来形成他们自己的做法”(Bryce, 1891:251)。


詹姆斯·布赖斯(James Bryce)在一百多年前写下这段话时,大概没有预料到后人真的发明出了民意测量机器,不仅可以“按周按月”地运转,还能够实时更新。在一个评分、评级、排序等量化评估形式盛行的“度量社会”(Mau,2019:2),民意测量机器最直接的体现就是内嵌于诸多平台的热门榜单功能:微博、百度、电商平台的热搜榜,音视频平台的热播榜,豆瓣电影/音乐/图书的近期热门榜单和年度榜单……它们实时监测和反映用户的注意力和意见,并催生了网红城市、网红影视剧、网络热词等新的文化形式。


在上述热门榜单中,微博热搜的社会影响力最为广泛。相关负责人指出,“微博热搜是社会脉搏的呈现,是社会情绪的反应”(筱松,2023)。截至 2023 年 9 月,微博月度活跃用户达到 6.05 亿(Weibo,2023)。热搜已成为公众判断某个事件、现象、人物被关注度的重要依据(雷丽莉,2019),成为公众舆论注意力的重要载体与依托(周葆华,2022)。


以往,大众媒体主要通过民意调查(以下简称“民调”)报道来量化民意。如今,记者日益通过社交媒体来反映和代表民意(Dubois et al.,2020;McGregor,2019)。笔者在日常浏览新闻报道时,愈发频繁的看到《冲上热搜!烈士妻子等他到94岁》《“电话发我。”深圳卫健委又上热搜了!》等标题。大众媒体是否接纳和认可了“热搜代表民意”的合法性?


美国政治学家苏珊·赫布斯特(Susan Herbst)提出的民意基础设施模型是本文主要借鉴的理论资源。该模型描绘了不同历史时期的民意基础设施对民意的定义、测量和传播,包括 “3M”要素:定义(Meanings),即什么是民意;测量(Measures),合适的测量工具和方法;媒介(Media),即民意如何传播(Herbst,2001)。该模型强调民意的内嵌性(embeddedness),尤其是它与民意测量工具与技巧、媒体之间的密切联系。这三个要素紧密交织,被Herbst(2001) 形容为“三头兽”(three-headed monster):“如果研究媒体对民意的报道,而不去分析数据是如何形成的、基于何种假设,那么这样的研究似乎是肤浅的”。


结合该模型提供的理论视角,本文试图探讨以下问题:


RQ1:热搜如何定义和测量民意?相较于以往的民调,具有什么新特点?


RQ2:大众媒体如何传播热搜生成的量化民意?在“热搜代表民意”的合法性话语建构中,扮演了什么角色?


文献回顾与核心概念


(一)民意基础设施


民意(public opinion),又称舆论,指大多数人共同持有的态度或信念(Price,1992)。如前文所述,赫布斯特提出民意基础设施模型来描绘不同历史时期的民意定义、测量与传播方式。赫布斯特举例,哈贝马斯所描述的18世纪欧洲沙龙公共领域,其民意基础设施模型可以概括为:(1)在定义方面,民意是感兴趣的、参与的、精英公众之间的批判性交谈;(2)在测量方面,通过倾听和参与对话来识别民意;(3)在媒介方面,民意通过大众媒体、公众间的人际交往来传播。而民调则可以概括为:(1)民意是单个个体意见的聚合;(2)民意通过问卷调查来测量;(3)民意通过大众媒体传播(Herbst,2001)。


如今,社交媒体成为了21世纪的民意基础设施(Zhang et al.,2021),其定义、测量和传播民意的方式也发生了显著变化。在《社交媒体作为民意:记者如何使用社交媒体代表民意》一文中,McGregor(2019)阐释了两种代表民意方式的异同:通过调查来推测的民意是私下的(private)、个体的(individual)、有代表性的(representative)、可测量的(measurable);而通过社交媒体来推测的民意则是公开的(public)、关系的(relational)、分层级的(hierarchical)、可测量的。


学者指出,尽管民调人士批评社交媒体的样本缺乏代表性,且存在数据污染问题,然而社交媒体分析扩展了民意的含义,尤其纳入了社交维度。其优势在于:(1)数据生成不受研究者干预;(2)能够对民意进行动态追踪甚至实时回应;(3)强调互动、参与和对话(Anstead & O’Loughlin, 2015)。以往对民调的主要批评就是,个体并不是原子化的、相互隔绝的,而是在社会互动中形成意见。民调也没有考虑到社会分层级的本质,如精英在意见形成过程中所发挥的作用(Blumer,1948;周葆华,2014)。从这个意义上讲,社交媒体作为民意基础设施,似乎更加符合经典的民主参与观念。


在众多的社交媒体中,有关推特热点话题的研究对本文尤其具有参考价值。与脸书对朋友关系的推崇和强调(DeVito,2017;方师师,2016)不同,推特致力于促进“全球对话”,认为事件的价值在于“能否将原本不是朋友的人联合起来”,朋友关系反而成为界定热点的负面指标(Birkbak & Carlsen,2016)。比起那些仅在现有用户群(用户已彼此连接,互相关注)之间传播的词汇,那些能够超越群组的话题被推特认为更加重要(Gillespie,2012)。


那么,在中国语境下,我们如何理解和描绘以热搜为代表的民意基础设施呢?热搜是如何定义和测量民意的,更偏向于“分散个体的搜索痕迹聚合”,还是“公众之间的连接、讨论与交流”?朋友关系被热搜视为正面指标(类似脸书)还是负面指标(类似推特)?背后又体现了怎样的算法价值观?本研究推测,热搜不仅具有社交媒体的共性特征,很可能还具有不同于推特等西方平台的独特性和差异性;此外,民意基础设施模型也有助于我们洞察热搜因时而变的特点,这正是RQ1致力于探讨的问题。


(二)热点算法:一种新的“知识逻辑”


过去30年间,人类日益将文化工作——“对人、地、物及想法所进行的排序、分类和等级划分”——委托给计算过程。人类不再是文化的独家生产者(producers)、仲裁者(arbiters)、策展者(curators)或阐释者(interpreters),这一转变极大地改变了长期以来文化范畴得以被实践、经验与理解的方式,催生了算法文化(Striphas,2015)。在这样的背景下,新闻业也开始关注以数据化形态出现的集体注意力,越来越多地报道那些据称引发了广泛公众关注的议题,公众反应(public response)成为新的新闻价值要素(Fürst & Oehmer,2021)。


微博热搜通过对民众注意力的实时监测和反映,逐渐被视为民意的风向标。热搜背后的热点算法——“使用一系列指标来识别那些在特定时间内、在特定的用户群中产生最多热度的内容或话题”(Gillespie,2016)——也被建构为一种合法的知识逻辑,这种知识逻辑“建立在有关什么是知识,以及如何确定最相关组成部分的特定假设”(Gillespie,2014)。Gillespie(2012)以词条“#occupywallstreet”(占领华尔街)未登上推特热点话题为例,展现了这种知识逻辑所具有的不证自明(self-affirming)的特点。Gillespie分析,该词条未上榜的原因可能包括:


(a)它正遭到刻意审查;

(b)它实际上没有人们以为的那样流行;

(c)它非常流行但一贯如此,不是突然剧增;

(d)它既流行也在剧增,但不是以算法设计所能测量的方式;

(e)它既流行也在剧增,但还赶不上一些把它挤出榜单的流行文化现象;

(f)它既流行也重要,但不如通过战略博弈挤进榜单的流行文化那么流行;

(g)它没能成为热点就是因为没有成为热点,因而无法享受热点所提供的放大效应。


“微博管理员”(2018)在《关于“紫光阁地沟油”从未进入微博热搜榜的说明》中也曾有过相似解释:“‘紫光阁地沟油’只是进入了‘实时上升热点’,虽然短时间内搜索量或讨论量增长趋势特别快,但因为搜索量不够而不能进入热搜榜。”由此可以发现,热点算法的生成结果不证自明,社交平台总是可以自圆其说。


尽管学术界、普通用户时常质疑热搜的真实性和有效性,但不可否认的是,热搜在公共话语中承担了日益重要的分量。如同在美国,尽管选民、政党、新闻业对民调结果有诸多质疑,仍然密切关注民调数字一样。如赫布斯特(1993/ 2018:2)所言,表达和测量民意的量化技巧之所以引人注目,是因为这种技巧具有客观性与貌似确定性的性质,“数字化的数据资料往往传播出权威性”。而算法的权力不仅体现在它所发挥的具体功能,还体现在围绕算法这一概念(notion)本身的话语实践与框架(Beer,2017)。接踵而来的一个研究议题就是算法的合法性话语建构。


(三)算法的合法性话语建构


合法性是指在由规范、价值观、信念和定义建构的社会体系内,一个实体的行为被认为是可取的、恰当的或合适的一般性感知或假设(Suchman,1995)。Ananny(2016)指出,“算法被看作是与社会、技术相关的一种话语和知识文化,这涉及在算法结构中,信息如何生产出来、如何浮现在我们面前,以及我们如何来理解这些信息,这些信息是如何被看作是合法的,又是如何被赋予公共意义的”。Carlson(2018)继而强调,与现存的知识结构相比,算法也会利用正当化的修辞来合法化它们的知识结构,未来研究应关注算法判断的合法性话语(discursive legitimization)是如何建构的。


不同的行动主体围绕算法展开了话语阐释与争夺。首先,数字平台积极调用话语资源来构建算法的合法性。已有研究指出,谷歌通过一整套话语网络建构起了其PageRank算法的合法性,包含技术科学(算法可以解决信息超载)、经济(算法是商业机密)、政治(算法公正中立)以及道德美学(不作恶)等四种话语(Roberge et al.,2020)。国内平台也不断建构和完善以“算法中立”为核心的合法性话语(皇甫博媛,2021),如微博热搜对“呈现”“反映”“客观”等修辞的运用(王茜,2020)。


其次,大众媒体也是算法合法性建构或解构的重要主体。已有研究主要聚焦于以今日头条为代表的个性化资讯推荐平台,尤其在人民网“三评算法推荐”的背景下,发现官方媒体对算法持批判性态度:官方媒体从价值正当性、规制正当性消解了算法的权威(张志安,2019),其调用的正当化话语资源从早期的责任层面提高到了后期的政治层面(白红义,2019),总体上将算法驱动平台视为公共价值和新闻的威胁(Meng,2021)。这些研究为我们理解中国语境下算法的合法性话语建构提供了重要借鉴,然而个性化推送类仅是《互联网信息服务算法推荐管理规定》所划分的五类算法推荐系统——生成合成类、个性化推送类、排序精选类、检索过滤类和调度决策类——中的一类;周葆华(2022)也将算法划分为个性化推荐算法与集体化热点算法两大类:前者关注“什么和‘你’相关”,后者则致力于识别和捕捉“什么和‘我们’相关”(Gillespie,2016),天然具有舆论属性。为了弥补已有研究聚焦单一平台和单一功能的不足,本研究的RQ2试图探究热搜背后集体化热点算法的合法性话语建构,尤其是大众媒体在其中所扮演的角色。对这一问题的探索有助于补充、拓展乃至修正已有的研究结论。


研究设计


(一)研究对象


根据微博热搜榜(2022)的介绍,“微博热搜根据微博海量用户的真实行为进行计算,实时发现微博平台内正受到广泛关注的热点内容,形成实时榜单。热搜致力于提供新鲜、热门、有料的资讯,提升用户发现微博热点的效率。”


本文选取微博热搜作为研究对象,原因在于微博是中国最重要的互联网公共表达平台之一,而热搜发挥着重要的民意聚合和监测功能。热搜还被国家列为监管的重点环节,自2022年3月1日起施行的《互联网信息服务算法推荐管理规定》提出,不得利用算法“操纵榜单或者检索结果排序、控制热搜或者精选等干预信息呈现”。微博也曾“为了澄清‘花钱撤热搜’‘花钱压热搜’等不实传言”,公开了热搜上榜规则与计算公式(微博管理员,2021)。值得注意的是,当我们说热搜受到了“操纵”“控制”“干预”或“撤/压”时,变相承认了它作为民意测量机器的合法性,这让热搜成为很具代表性的研究对象。


(二)研究方法


1. 文本分析与深度访谈


为了回答RQ1,本研究搜集了微博发布的年度报告、新闻稿,以及“微博热搜榜”“微博搜索”“微博管理员”“微博客服”“微博小秘书”等官方账号发布的公开声明,从中找出与“热搜”“规则”“计算公式”等相关的内容。基于对上述材料的文本分析,并结合已有研究(王茜,2020),梳理热搜上榜规则和计算方式的主要更迭,并据此分析热搜相较于民调以及其他民意基础设施所具有的特点。


此外,第一作者于2022年8月16日与一位知情人士进行了60分钟的深度访谈,重点了解热搜规则更迭的背景、原因,以及人工干预算法的标准与依据。


2. 内容分析


为了回答RQ2,本文选取了《人民日报》、《新京报》、《环球时报》、《光明日报》、《南方日报》、新华社、澎湃新闻、央视新闻、央视网、中国新闻网共10家大众媒体的微信公众号相关推文作为分析对象。理由在于,微信是国内每日使用时间最长和使用人数最多的社交媒体,媒体运营的微信公众号的粉丝总量已超过23亿(杨鑫倢,2018)。微信公众号每天只能推送10次消息,单条推送的影响力远超微博和客户端(陈阳,2019)。在有限的推送中如若频繁出现“热搜”,能够较好地体现热点算法逻辑对新闻业的渗透。此外,已有研究仅仅以《人民日报》和人民网作为党媒的代表(白红义,2019;张志安,2019;Meng,2021),本文希望尽可能多地扩大样本量,最终选取的10家媒体中有7家国家级媒体和3家地方媒体。


本研究以“热搜”为关键词,分别在这10家媒体的微信公众号进行检索,发现最早能够检索到的推文发布于2018年。我们最终选取了2018 年1月1日至2022年5月31日正文中包含“热搜”的全部推文,人工剔除涉及国内外其他平台热搜的无关推文,最终得到有效样本1133篇。


在深入阅读样本的基础上,结合本研究目的和需要,本文将大众媒体对于“热搜代表民意”的态度分为三种类型:(1)认可/接纳,这类推文将热搜视为民意的代名词,将热搜上榜话题作为新闻选题来源;(2)质疑/批评,这类推文质疑热搜的真实性(如刷榜、营销号、买/撤热搜)或有效性(如无价值的内容“凭啥上热搜”,有价值的内容“难上热搜”),批评热搜乱象带来的负面社会影响;(3)中性,客观陈述正反面意见,或仅仅报道事实本身,没有表现出倾向性。此外,我们还统计了热搜在新闻报道中出现的位置,包括:(1)标题;(2)导语;(3)正文。


编码由一名传播学副教授和一名新闻学专业研究生共同完成。在正式编码前,两位编码员抽出样本数量的10%进行了前测,信度较为理想。随后各自对1133个样本进行独立编码。研究使用Cohen’s kappa评估编码员间信度,kappa值0.879,符合内容分析的信度要求。对于编码不一致的样本,编码员先各自检查编码表,修正错误,随后讨论仍存在编码不一致的样本情况,直至对编码结果达成共识。本研究采用SPSS for Windows22.0进行统计数据的分析,采用Python对样本标题进行词频分析。


研究发现


(一)微博热搜对民意的定义与测量


通过对微博公开材料的文本分析以及访谈,本文发现热搜对民意的定义和测量有着不同于推特等西方平台的独特一面,并非铁板一块、一成不变,有必要引入历时性视角来考察其动态发展过程。


参照前人的研究成果(赫布斯特,1993/2018;Anstead & O’Loughlin,2015;McGregor,2019),结合文本分析材料,本文提炼出了微博热搜定义与测量民意的三个动态变化,分别是:从个体走向关系、从私下走向公开、从自动走向调控。


1. 从个体走向关系


2018年以前,微博的多份官方声明及高层发言均显示,热搜榜“依据用户的真实搜索量”“基于实时搜索数据计算而来”“热搜不是根据转评赞来决定上不上的,是根据搜索量上的”(王茜,2020)。2018年3月15日是一个重要的分界点,热搜的上榜规则从单一考量“搜索热度”转变为“(搜索热度+讨论热搜+传播热度)*互动因子”的多重考量(微博热搜榜,2018)。据微博(2021)介绍,


“搜索热度指搜索量,是基于搜索行为建立的热度模型,反映用户对热点的关注和探索程度;讨论热度指讨论量,是基于原创和转发的发博行为建立的热度模型,反映用户热议和参与的热情;传播热度指阅读量,是基于热搜结果的关联微博在全站的阅读量建立的热度模型,反映热点在微博体系内的传播情况;互动因子指用户在热搜结果页下转评赞等行为的互动比率,归因到[1-1.2]区间,反映用户消费内容的意愿。”


受访者介绍了热搜规则调整的背景:


早期微博热搜的上榜内容,新闻属性和媒体属性不那么突出,更多是偏生活类的内容。以用户搜索作为一个主要的参考量,是比较符合当时热搜榜的属性和调性的。后来整体的生态发生了很大变化:一是大量的主流媒体入驻微博,二是大V、高质量用户等对热点新闻的参与度越来越高,我们也希望新闻的当事人、相关的人员能够在新闻中扮演比较重要的角色……热搜的整体逻辑还会随着生态不断的演进。


这标志着一场重要的却几乎悄无声息的变革:热搜从表面上看仍然是原来的排行榜,然而其对民意的定义与测量方式发生了根本改变:从“原子化个体的搜索痕迹聚合”走向“处于社交网络中的人际交互”。前者是孤立的、彼此隔绝的、平等的,后者则是连结的、交互的、分层级的。例如,当热搜仅仅根据搜索量定义与测量民意时,一位普通网民和一位大V的搜索具有同等权重;而当互动量被纳入考量,那些拥有更多粉丝和资本的大V、组织等将发挥更大的影响力。


2. 从私下走向公开


2018年3月之前,热搜计算的搜索量是人们私下的意见表达,它类似于民调对个体意见的聚合,“是针对彼此没有联系的个人、秘密地同时又科学地完成的”(赫布斯特,1993/2018:172)。不同之处在于民调采集到的是被访者的自我报告(self-report),热搜则是对用户搜索痕迹的聚合。


此外,热搜所聚合和测量的民意不是随机的、有代表性的,而是主要反映了青年群体的关注。根据微博发布的《2021上半年微博热搜榜趋势报告》,热搜用户中19岁至29岁用户占76%,40岁及以上用户仅占2%。“微博管理员”(2018)在《关于“紫光阁地沟油”从未进入微博热搜榜的说明》中也指出,热搜计算主要依据的是“可信用户的搜索行为”,为了防止刷榜,还会考虑用户群分布、终端系统分布、搜索操作特征等维度。然而,“可信用户”是如何界定的?“大家正在搜”中的“大家”包括哪些人,又排除了哪些人?这是模糊的、不透明的。Gillespie(2014)称之为“计算公众”(calculated publics),即人们只能通过算法生成结果(如热搜人气值、讨论人数)来感知共同体的存在(见图1),然而其具体构成则处于黑箱之中。“计算公众”还包括算法推荐的“你可能认识的人”“喜欢……的人也喜欢……”,没有算法,这些推荐的“人(们)”也就不复存在。



随着热搜上榜规则的改变,其定义与测量民意的方式也走向公开。计算公式“(搜索热度+讨论热搜+传播热度)*互动因子”中的搜索热度和传播热度具有私下的特点,用户的搜索与阅读行为在后台进行,具有匿名性;而讨论热度和互动因子则具有公开表达的特点,用户在讨论、转发、点赞或评论时往往带有前台表演的成分。例如,用户点赞的内容会以“某人某月某日赞过的微博”的形式显示在个人主页上。


3. 从自动走向调控


2018年,首次整改后的热搜上线了“新时代”版块,且宣布放弃纯粹的算法模式,引入编辑人工干预模式(杨阳,2018)。2021年上半年,热搜将“减少娱乐占比”作为平台的主要调控目标,设置正能量推荐位,加大对正向内容的宣传力度(微博管理员,2021)。2022年1月,微博宣布将优化热搜榜单内容配比机制,并基于热搜生态和价值导向加强人工调控。具体举措包括突出媒体、政务在社会时事报道中的主导作用,结合重大事件和重要时间节点调节榜单氛围等(微博热搜榜,2022)。


受访者介绍了对热搜进行人工调控的标准和依据:


从整个的产品生态角度上来说,(我们)会对热搜的内容做一些调整,但出发点都是为了让内容更好的符合公序良俗的原则和社会道德标准。不是所有的新闻都有引发全民关注的价值,有的内容并不适合成为新闻焦点,如血腥、暴露隐私、真伪未确认,有的内容还可能起到不好的公众示范。


上述措施回应了党和国家对算法治理的要求与关注,如《关于加强互联网信息服务算法综合治理的指导意见》《互联网信息服务算法推荐管理规定》等文件提出要“算法导向正确、正能量充沛”“加强算法推荐服务版面页面生态管理,建立完善人工干预机制”。微博在2021年度报告中指出,上述法规有可能会对微博的商业运作,尤其是社交兴趣图谱推荐引擎(social interest graph recommendation engine)带来负面影响(Weibo,2022)。由此可知,热搜的运作并非机械中立,而是会受到广告主、政策等的影响与制约。


综上,微博热搜糅合了“分散个体的搜索痕迹聚合”和“公众间的互动、讨论与连接”这两种民意定义与测量方式:既是私下的、个体的、平等的,也是公开的、关系的、分层级的,且日益走向人机联姻。以2018年为界,热搜从遵循“一人一票的普选逻辑”(承认舆论具有原则上的平等性和普遍性)向“优先考虑明智舆论”(凯罗尔,2011/2015:109)转变,相较于普通民众,新闻当事人、意见领袖、媒体等开始发挥更重要的作用。


(二)大众媒体对热搜生成民意的传播


评估当下民众关心什么,是大众媒体工作的重要内容。赫布斯特(1993/ 2018:111)对20世纪三四十年代的民调研究发现,记者虽然“被定量与规范化所提供的工具性优势所吸引”,但会克制、谨慎地运用定量数据。而本研究发现,我国的大众媒体较少质疑“热搜代表民意”的有效性,更多是认可、接纳和助推。


1. 大众媒体总体上认可“热搜代表民意”的合法性


本研究以“热搜”为关键词,在《人民日报》等十家大众媒体微信公众号搜集到了1133篇有效样本。其中,2018年80篇,2019年289篇,2020年245篇,2021年396篇,2022年1月至5月123篇。虽然不同年份间的报道量有所起伏,但整体呈增长趋势。内容分析结果(见表1)显示,94.5%的大众媒体报道认可和接纳了“热搜代表民意”的合法性,仅有4.9%的报道提出了质疑和批评的声音。卡方检验分析显示,十家媒体的态度不存在显著性差异(χ 2 =15.970,P>0.05)。



此外,本研究使用Python对样本标题进行词频分析。首先,利用jieba库对样本数据进行分词,并实现对于关键词词频以及关键词两两之间共同出现频率的统计。其次,利用NetworkX初始化创建一个尚不包含节点信息的简单无向图G,并在新创建的网络关系图中逐个添加新的节点Node和新的连边Edge,设置节点和连边的属性和布局。最后,在词频分析的基础上完成绘图。将每个关键词当作图中的一个节点,节点大小反映了关键词的词频大小,计算节点之间的关系,共同出现过则连线,连线粗细反映了两个关键词之间共同出现的频率大小。


如图2所示,大众媒体最常将“热搜”(n=998)与“冲上”(n=187)、“第一”(n=116)搭配在一起使用,其次是“刷屏”(n=20)、“火上”(n=16)、“登上”(n=16)、“又双叒”(n=9)、“连上”(n=7)、“引爆”(n=6)和“整改”(n=5)。除了“整改”带有质疑/批评的意涵外,其余高频词汇均显现出了大众媒体将热搜视为民意风向标的倾向。在这些报道中,登上热搜第一的内容(如《“孟晚舟上班”登顶热搜》《热搜第一的“中国红”开工了!》),或是能够多次登上热搜的内容(如《“南方供暖需求”又双叒叕上热搜!》《小学教材插图连上7条热搜,人教社回应了》)等同于引发了广泛的公众反应,进而具有新闻价值(Fürst & Oehmer,2021)。



此外,我们还统计了热搜在报道中出现的位置。结果显示,87.8%的推文将“热搜”放在标题中,74.9%的推文将热搜置于导语位置,且多以“近日,某某信息冲上热搜”“某某热搜引发了网友热议”等句式出现。在此列举三个代表性例子:


(1)她,16年,献血200次,折合累计84900毫升,冲上新浪微博热搜。

(2)“浙江为近400滞留考研生从全国调卷”的消息,从19日晚到今早持续占据热搜榜,引发大量网友关注与点赞。

(3)17日,国新办举行发布会,请国家互联网信息办公室副主任盛荣华介绍2022年清朗专项行动有关情况,并答记者问。这场发布会信息量很大,受到网友的广泛关注,迅速登上微博热搜榜第一,处于“爆”的状态。


以上三个新闻导语分别出自《人民日报》、新华社和中国新闻网,“冲上热搜”“持续占据热搜榜”“第一/爆”被用来揭示和证明话题所具有的高关注度。


2. 大众媒体对热搜的质疑和批评逐年减少


卡方检验分析发现,随着时间的推移,大众媒体对热搜的阐释存在显著差异(χ2=44.548,P<0.05),表示存在着历时性变化(见表2)。质疑和批评热搜的声音逐年减少,从2018年的20%下降到2022年的2.4%。需要指出的是,2018年1月和2020年6月,北京市网络信息办公室曾两度约谈微博,责令其立即整改,暂停更新微博热搜榜一周。对此事件的报道均被编码为“质疑/批评”。2018年样本总量最小,因此,“质疑/批评”类的推文比例最高。2020年尽管也出现了热搜整改的相关报道,但由于样本总量最高,“质疑/批评”类的推文比例相对较小。



这种历时性变化可能与微博愈加强调正能量和人工调控有关,带来的直接后果就是,大众媒体推动话题登上热搜的比例越来越高。2021年上半年热搜中的社会时事热点话题81%由媒体主持(微博热搜榜,2021),而后续发布的《热搜双月报》显示,7-8月该比例是85%,9-10月该比例是88%,11-12月该比例达到了89%。面对国家对算法推荐平台的调控,热搜愈加注重编辑价值以及社会公共职责的履行,这与大众媒体的目标趋于一致。


综上,基于民意基础设施模型来理解微博热搜,它可以被概括为:(1)在定义方面,民意是“分散个体的搜索痕迹聚合”和“公众间的互动、讨论与连接”的糅合;(2)在测量方面,通过挖掘用户的数字痕迹来测量民意;(3)在传播方面,除了平台自身,大众媒体也对热搜生成的量化民意进行了二次传播。


讨论与结论


(一)平台“公式”形塑的“计算群众”


雷蒙·威廉斯(Raymond Williams)曾说,“实际上没有群众,有的只是把人看成群众的那种看法……实际上,我们根据某种方便的公式把他们聚集成群并加以诠释。在它的条件之中,这公式是成立的。但是,我们真正应该检验的是这个公式,而不是群众”(威廉斯,1958/1991:379)。







请到「今天看啥」查看全文