这是一个喧嚣的数字时代。关于不同个人、话题、观念等的海量信息在各个数字平台扩散(diffusion),形成一个个短暂而又极具爆发力的热点,不断形塑着数字时代整体的公共领域与社会心态(哈贝马斯,1999)。值得注意的是,数字平台信息扩散呈现高频、连续、非线性以及算法驱动等特征(韦伯斯特,2011),不同信息、用户像是纠缠在一起的多线性集合,总是处于动态的不平衡状态(Hepp,2022)。上述社会的动态性和复杂性使得数字平台上的信息扩散模式及其社会影响仍不明确,学者们一方面因公众密切关注同一公共话题而认为数字平台促进了社会关系的“增强”(Marres,2017),另一方面则担忧数字平台暴露并加剧一些负面社会动态,如平台上泛滥的偏见、煽动性话语(Van Dijck et al.,2018),以及用户间不断扩大的观念分化(Walsh,2020)。
社会学长期关注不同思想、文化脚本、组织模板等的扩散模式(Bail et al.,2019),通过追踪不同社会事物在不同行动者间的扩散和重组过程,从而尝试在宏微观尺度上理解社会过程及其潜在的动态权力关系。例如,文化社会学、组织社会学分别关注文化脚本、政策原型在不同行动者间的扩散模式与机制(Wimmer,2021)。尽管研究对象有所不同,但已有文献多采用发送—采纳的经典框架,分析诸如采纳者内在特征、外部社会因素等对特定事物扩散过程的影响。
上述视角为理解各类社会事物的扩散过程及其机制提供了重要启发,但解释数字时代的信息扩散则面临诸多挑战:一方面,不同于已有研究考察政策等如何在较长时间跨度内被不同行动者采纳并从中提炼较为稳定的扩散模式,数字平台的海量信息以极快速率源源不断地涌向不同用户(Thorson & Wells,2016),这意味着不仅海量信息间的扩散模式可能存在差异,扩散模式也可能随时间而快速变化;另一方面,信息扩散不仅是技术层面的现象,而且是社会事实、平台、用户等多主体持续交互的结果(Luhmann,2012;Marres,2017),这种动态互动机制使信息扩散呈现多样化的轨迹,且这些轨迹随着不同的社会情境和用户行为而变化,难以通过传统静态模型或特定主导变量来充分解释。社会和技术环境的变化带来了信息扩散的高度动态性和复杂性。
为应对上述动态性和复杂性,本文尝试提出“观念流”的分析视角。观念流视角将信息扩散视为一个多维度的社会现象,其轨迹受到社会事实、用户行为和平台算法等多重因素的共同影响,强调挖掘信息扩散背后更深层次的观念流动的具体过程和轨迹。同时观念流视角不预设结构,不寻求特定变量对观念流动的固定解释,而是强调追踪不同观念如何在不同场景中流动和演化,以更好地应对观念流动的复杂性和动态性。通过追踪不同类型观念的竞争、交汇和重叠模式及其在不同用户间的流动轨迹,观念流视角尝试从更基础的过程和关系角度揭示数字时代社会事实、平台和用户间的互动机制,进而更深入地理解数字时代社会关系和权力关系的动态构建与延续模式。
本研究基于“今日头条”平台为不同用户连续22天推送的信息数据,使用生成式人工智能模型挖掘海量信息中承载的情绪、集体观、偏见程度等三种不同类型的观念,进而分析不同观念的具体流动轨迹。在此基础上,本研究将基于互联网行为实验所收集的连续互动数据,持续追踪大大小小、不同类型的外部事件如何跟平台、用户互动,进而形塑动态而复杂的平台观念流动。
二、文献述评
(一)流动性视角下的社会事物扩散
社会学对于社会事物的扩散有长久的关注。20世纪40年代,学者们便尝试了解杂交玉米这一技术创新在农村居民中的扩散过程(Ryan & Gross,1943)。延续这一经典研究,后续文献将发送者发明或提出的社会事物被多个接收者以不同速度采纳的过程定义为扩散,使用发送—采纳框架分析了诸如组织模板、公共政策、商业实践、流行文化等多样化的社会事物在不同行动者中的扩散过程,并对扩散的模式、动力机制进行了详尽探讨(杨典,2018;Wimmer,2021)。
在以信息为基础、由平台算法驱动和主导的数字社会中(Marres,2017;邱泽奇,2022),信息扩散呈现更为复杂的模式(韦伯斯特,2011),人们被不断更新的新信息淹没(拉什,2009)。相较于少数社会事物以较慢的速率在特定行动者间单向扩散,数字平台的信息扩散速率极快,这些信息源源不断地涌向大量用户,形成一个动态和互动的异质性网络(韦伯斯特,2011;乔天宇、向静林,2022)。从扩散机制看,平台通过动态计算用户和信息的高维特征,进而对用户进行实时的信息推送并动态调整推送策略,这意味着研究者在这一时段捕捉到的信息扩散模式可能会因外部社会因素、信息特征、用户行为等多种因素而快速发生变化。因此,相较于尝试寻找稳定的信息扩散模式,更为关键的是描述和理解上述高速变化的复杂过程(Law & Urry,2004)。
为理解高速变化的信息扩散过程,本文引入流动性视角。传统扩散研究在某种意义上也是关注流动,但本质上是基于二元流动的分析框架(Adey,2006;Nail,2018),即关注信息、知识或实践等事物从一个点传递到另一个点的线性过程,流动有着非常明确的出发地和目的地(事物从位置A到位置B的移动)。在二元流动框架中,人、商品、信息被视为动态和活跃的,而两端则被视为静态的不可移动的(厄里,2009)。社会事物扩散研究是使用此框架分析发送者和采纳者等行动者的特征对流动模式影响的典型。在解释数字时代的信息扩散时,二元流动框架面临的核心挑战在于平台用户的类别是高度模糊且变动的,信息扩散是社会事实、平台、用户等多主体以不同规模、在多个场景进行交互的结果,若以固定、有限的属性去预测一个稳定的扩散模式无疑会遮蔽其复杂性与动态性。
相较于二元流动框架,部分研究则更加强调追踪和观察流动本身(Nail,2018;Ingold,2021;阿伯特,2022),认为流动并非是由固定行动者主导的事物从特定地点移动到特定地点的简单过程,而是不断进行中的流动过程配置并塑造了不同行动者(Ingold,2021)。在此过程中,流动不再是线性或单向的,端点、外在的社会、文化和政治力量也不再是静态的,而是相互之间不断互相影响、纠缠而形成的一个亚稳态结构(Nail,2018)。综上所述,数字时代信息扩散的现实特征以及关于流动性的系列讨论启发我们跳出以固定行动者为中心的二元流动框架,要持续追踪数字平台中不同信息随时间的流变以及在不同用户中的流动轨迹,这有助于揭示以往被视为离散的平台、用户、社会事实等之间的动态互动和纠缠关系。
(二)信息扩散:量与质的视角
数字时代社会生活平台化带来的海量平台数据为研究信息扩散提供了前所未有的机会,这一当代重要议题也吸引了计算机等多学科的关注。
计算机等学科的研究者聚焦信息扩散的过程,系统地分析了诸如网络结构特征、关键节点的特征、用户之间的互动等对信息扩散速度和过程的影响(Watts,2004)。上述文献还大量借鉴流行病学模型,将信息扩散类比为疾病扩散过程,将平台用户分为易感者等不同人群,使用诸如SIR等流行病学模型分析信息在不同用户中扩散的概率,尝试概括信息扩散的宏观规律(Li et al.,2017)。
除了对信息的数量层次的分析外,越来越多研究从信息质量层次关注信息扩散。彭特兰(Alex Pentland)强调分析组织内部抽象的想法流动的重要性,指出想法流动受到网络结构、节点连接强度和个体网络位置的影响(彭特兰,2015)。后续研究通过追踪不同内容信息的扩散轨迹来理解数字社会,关注诸如假新闻、标题党、情绪性等不同内容的扩散模式(Vosoughi et al.,2018),如有研究发现道德情感词汇的增加会显著提升信息的扩散概率(Brady et al.,2017)。同时,学者们也注意到,随着时间的推移,数字平台上的“点击诱饵”现象愈发严重,即那些夸张、情绪性的内容在平台上的扩散速度更快(陈华珊、王呈伟,2019;Walsh,2020)。针对信息在不同用户间扩散模式的研究则发现,一方面,在信息分发过程中,平台对用户偏好的分析可能会导致忽略或排除与用户观念相悖的内容,加剧信息茧房(刘河庆、梁玉成,2023);另一方面,平台倾向于推送具有强烈情绪的信息,这类信息能激发用户更多互动(Brady et al.,2017),但可能会加剧对立情绪,并导致数字平台情绪性和偏见等信息的增加(Bail,2021)。
对于数字平台信息扩散的跨学科关注揭示出信息扩散不只是单纯的技术现象,而是社会事实、平台、用户在不同场景中持续交互的结果。信息扩散轨迹一方面反映了社会、平台与用户间的互构模式,另一方面也直接揭示并持续影响着数字时代社会关系的构建与变化。尽管既有研究已经初步揭示了信息扩散的复杂性,但仍有需要深化之处。第一,对信息中丰富的社会面向关注不足。早期信息扩散研究多将信息简化为单一、孤立的实体,进而以阅读量等指标分析信息的流动模式。这种对信息相对粗糙的处理以及更强调信息数量而非质量(哈贝马斯,1999)的分析框架相对而言“删除了社会”,对信息的社会面向关注不足,使得观察到的往往是表层和碎片化的信息流。第二,尽管后续研究关注不同信息内容的扩散模式,但未能将社会、平台和用户行为的动态互动纳入分析视角。以情绪性信息在平台上的流动为例,其具体流动轨迹不仅受到离散的用户行为、平台算法或者社会事实的影响(Brady et al.,2017),更是三者互动的结果,比如面对不同的外部社会事件,平台如何动态地依据不同用户行为推送内容,这一过程涉及平台算法对用户行为以及社会事件本身的实时分析、用户对不同信息内容的反馈以及社会事件对整体信息生态的冲击。因此,信息的扩散轨迹是多主体动态交互的结果,需要从多主体互动视角进行系统分析(吕鹏等,2022)。第三,平台信息扩散具有高度的复杂性和变动性,这要求研究者不能简单地假定一个统一的平台信息扩散模式。正如德兰达(Manuel DeLanda)所强调的,只有挖掘信息中承载的不同类型的观念,进而持续比较不同观念的动态轨迹,才能深入理解数字时代信息扩散的动因及其对社会关系和社会实践的影响(DeLanda,2019)。第四,从研究设计和方法角度看,基于截面数据的传统方法难以捕捉信息扩散过程中的互动和反馈机制,研究者需要在方法上超越固定的模式和变量设定,以挖掘信息扩散中出现的新模式和新可能(阿伯特,2022)。
三、观念流视角
数字平台海量信息在用户间动态而复杂的扩散过程背后,是数字时代底层运作逻辑的深刻变化(Marres,2017;邱泽奇,2022;赵一璋、王明玉,2023)。数字社会是由多种混合的社会和技术元素组成的生态系统(Marres,2017),社会事实、平台、用户在多样化场景下持续交互,形成一个持续互动的复杂系统(如图1左侧所示),信息扩散则成为上述多主体间动态交互的产物(Luhmann,2012)。在此背景下,信息扩散可能呈现多样化的轨迹,且这些轨迹随着不同的社会情境和用户行为而变化。因此,要深入揭示数字时代信息扩散的轨迹及其背后的社会机制,关键在于应对上述社会复杂性和动态性。
本文的回应是尝试提出“观念流”分析视角。首先,观念流视角强调对信息中承载的不同社会观念的深度挖掘,注重信息中质的变化和流动,进而捕捉信息中丰富的社会面向。其次,观念流视角将信息扩散视为一个多维度的社会现象,其轨迹和模式受到社会事实、用户行为和平台算法等多重因素的共同影响,强调挖掘观念流动过程中多主体间的互动机制。同时,借鉴过程本体论(Ingold,2021;怀特海,2011),观念流视角尝试突破传统以行动者为中心的分析视角,转而关注“流”本身,聚焦于观念的动态流动过程。该视角不预设结构,不寻求特定变量对观念流动的固定解释(事实上,与传统相对固定的类别不同,数字平台用户类别以及用户间关系是高度模糊化且迅速变动的),而是追踪观念如何在不同交互场景中流动和演化。从这个意义上,观念流视角是一种归纳性的工具,它对“惊喜”,即那些无法用现有理论或模型预测的现象和趋势足够敏感,这种敏感性和灵活性使得该视角能够适应数字社会的高度复杂性和动态性。最后,观念流视角强调对多种不同类型观念流动轨迹的追踪和对比,以捕捉观念在平台中的竞争、交汇和重叠模式。
如图1右半部分所示,本研究基于观念流视角,追踪情绪、集体观和偏见等三种观念如何在不同用户间流动,并实证检验外部社会事件和用户行为变化如何影响上述观念的流动轨迹。之所以关注上述三种观念,一方面是因为带有明显情绪色彩、含有偏见或者强调特定倾向的信息扩散速度更快,成为数字时代信息生产和扩散的主要特征之一(黄荣贵等,2022;龚为纲等,2023)。另一方面,情绪、集体观和偏见不是孤立存在的,而是有着复杂的相互作用,例如情绪可能激发偏见,偏见又可能塑造和加强集体观(Walsh,2020)。上述三种类型观念的重要性以及相互间作用的复杂性为本研究使用观念流视角追踪和对比多种维度类型不同的观念流动轨迹,进而挖掘背后复杂的社会动因提供了研究机会。
具体而言,本文将基于今日头条的互联网行为实验,尝试回答以下实证问题:第一,情绪、集体观和偏见如何在数字平台以及不同用户间流动?第二,社会事实、平台、用户行为如何共同塑造观念流,特别是当遭遇不同外部事件冲击时,不同用户推送信息的观念差异如何变化,是扩大、缩小还是变得混乱?第三,情绪、集体观和偏见三者流动过程中呈现何种交叉、重叠与纠缠模式?
四、研究设计
(一)数据收集
为准确捕捉不同观念在平台的流变以及在不同用户间的动态流动轨迹,笔者设置了120个不同信息点击行为的个体账号,其与今日头条平台进行连续22天(2021年8月9日至2021年8月30日)的自动互动,进而持续收集今日头条平台为不同账号推送的信息大数据。
在数据收集过程中,笔者将120个个体账号分为八个组别,参照平台公布的用户点击偏好设置各组点击行为,如第一组的账号会以90%的概率去点击信息流中带有政治、金融、科技、自然、汽车等五种标签的信息。在用户点击偏好设置中,本文选择基于点击信息类别的差异来设置不同用户组别。
相较于相对抽象的信息中承载的观念,基于平台标注的信息类别去设置不用组别点击偏好,可以为观念流分析提供足够的开放性和灵活度。后续实证分析可以根据具体研究需求,灵活计算不同组别在不同时点被平台推送的不同信息中承载的观念,进而考察不同观念的流动模式。此外,使用不同虚拟账号与平台实时互动的数据收集设计可以更为灵活地设置用户行为。在实验进行的第14天,笔者改变了部分账号的点击偏好,并持续观察和追踪平台为相关用户推送信息的变化。根据上述设计,120个账号经过22天与今日头条平台的持续自动互动,共生成平台为不同用户推送的2548161条包括信息ID、推送时间、标题、摘要、标签、发布者、阅读量等在内的推送数据。
(二)测量
1.因变量
因变量为信息中承载的情绪、集体观和偏见等三种观念。根据已有文献,笔者将信息中承载的情绪定义为“通过语言、图像等多种媒介,使用不同的叙述方式和视觉元素等来传递和表达的特定情绪状态”;将信息中的集体观定义为“信息中传递的重视群体的共同目标和责任,强调个人对群体的贡献和依赖等价值倾向”(Oishi et al.,1998)。将信息中的偏见定义为“某些观点或群体因信息内容本身的选择性或倾向性而被不公正地强调或贬低”(Walsh,2020)。
尽管已有文献对上述三种观念有着较为丰富的讨论(王俊秀,2014;Brady et al.,2017;陈云松,2022),但同时准确识别信息中研究者感兴趣的不同类型的内容仍非常困难。以偏见为例(Walsh,2020),识别信息中承载的偏见不仅需要把握每个信息的整体内容,而且要有外部知识的推论能力,还需能理解信息中可能的反讽、隐喻以及不断变化的话语类型和风格。
近年来迅速发展的生成式人工智能模型为解决上述难题提供了宝贵契机。作为典型的生成式人工智能,ChatGPT具有多模态数据处理能力,在总结、抽象、推理等多种能力上以及在处理细粒度的意识形态识别、识别文本中的隐喻与反讽等诸多任务中达到或超过人类水平(政光景、吕鹏,2023)。此外,作为生成式模型,ChatGPT能够灵活给出评分原因等辅助信息。
综上,本研究使用ChatGPT模型来生成信息承载的情绪、集体观和偏见。具体步骤如下:首先,从本研究的数据库中,随机抽取5000条信息,依据已有相关文献分别为情绪、集体观、偏见设定初步提示词(包括定义具体任务、期望的输出等),之后调用GPT-4 API根据相关的提示词对上述5000条信息(标题加摘要)进行分析,得出每条信息的情绪、集体观、偏见的具体得分,并给出每种观念的给分原因、情绪类型、偏见针对的社会群体等辅助信息。其次,在得出每条信息对应得分后,与使用Frameaxis模型所计算出的对应的三种观念的得分进行对比,挑出两个模型得分差异较大的信息。从数据比对结果来看,相较于Frameaxis模型,GPT-4对于信息中不同观念的识别和提取有着非常高的准确性和可靠性,但也存在因模型价值观设定而使其对某些信息的解读倾向于特定的情感或价值观(如GPT-4将“美军撤离阿富汗”等相对中性、未带有明显负向情绪的信息判定为-7分)。针对上述问题,笔者进一步细化和修改提示词,以这些反面识别案例为例提示模型在后续识别中更为客观地给出信息中的相关观念得分。最后,根据调整后的提示词以及添加的说明和反面案例线索,调用GPT-4 API对剩余所有信息进行分析,生成每条信息的情绪得分、集体观得分、偏见程度得分,以及每种观念的给分原因、情绪类型、偏见针对的社会群体等辅助信息。
2.关键解释变量
本研究的关键解释变量包括用户组别、实验阶段(日期)等变量。依据上文,本文的研究设计允许我们灵活计算不同组别在不同时点被平台推送的不同信息中承载的各种观念,进而考察各种不同观念的流动模式。以情绪为例,笔者首先计算各个组别实验第一天推送信息中情绪的均值,依据该均值将八个组别划分为起始阶段情绪高于均值组别和起始阶段情绪低于均值组别等两个大类。在区分两个大类后,本研究尝试持续观察和比较两个大类组别间承载的情绪的差异情况是否会随着不同外部事件的冲击而不断扩大、缩小或变得混乱。
实验阶段(日期)变量除了代表实验的进度外,还是不同外部事件的代理变量。在研究的进程中,每天都会发生可能影响不同观念生产和扩散的大大小小的外部事件(如实验第16天为东京残奥会开幕)。除了考察不同外部事件对信息中承载观念的整体影响外,本文重点关注和追踪不同类型、不同方向外部事件对上述不同组别的持续影响。
3.控制变量
本研究的控制变量包括信息阅读量对数、信息标签(采用今日头条平台的信息类别标签,共113个类别)、信息推送组别、信息在实验中是否被点击等。
(三)模型设定
在本研究关注的三种观念中,信息承载的情绪为-10~10的连续变量,且近似正态分布,采用OLS模型进行分析。信息中承载的集体观与偏见程度均为0到10的连续变量,考虑到两个变量均有大量的0值存在,使用零膨胀负二项(Zeroinflated Negative Binomial,简称ZINB)计数回归进行分析。此外,为进一步比较三种观念的流动轨迹差异,本研究引入动态时间规整算法(Dynamic Time Warping,简称DTW)来比较和分析不同用户组别不同观念之间的时间序列数据。
五、平台层面观念流
本节首先从平台层面分析三种观念的流动。图2以河流图的形式呈现了推送信息中承载的具体情绪类型的历时性变化和分布,每种颜色代表一种情绪类型,图中标签显示了具体情绪类型、该情绪类型在推送信息中的占比、该情绪类型的平均阅读量。由图2可见,今日头条平台为不同用户推送的信息中,情绪类型为快乐的信息占比最高(37.3%),其次分别为无明显情绪(26.2%)、悲伤(18.1%)、愤怒(10.1%)、恐惧(5.0%)、惊讶(2.0%)和厌恶(1.3%)。这表明,相比于无明显情绪的信息,平台流动的更多是充斥着各种正向或负向情绪的信息。图中的平均阅读量是指不同情绪类型在推送给用户时显示的阅读量的均值。由图2可见,愤怒、惊讶、恐惧等负面情绪的平均阅读量远大于快乐等正面情绪信息以及无明显情绪的信息,这也表明从信息影响力的角度来看,愤怒、惊讶、恐惧等负面情绪在平台上有着更大的影响力。从各个情绪类型动态变动情况可以看到,各个情绪类型随着实验日期的推进有着一定的波动。
本文进一步考察了信息中承载集体观和偏见程度的历时性变化和分布。从集体观来看,今日头条平台为不同用户推送的信息中,未明显强调集体观的占比最高(77.2%),强调集体重要性得分为1—2、3—4、5—6、7—8、9—10等五个组别的占比分别为0.2%、0.4%、8.9%、8.8%、4.5%。从信息承载的偏见程度这一维度来看,在今日头条平台为不同用户推送的信息中,未承载任何偏见的信息占比最高(90.8%),偏见程度得分为1—2、3—4、5—6、7—8、9—10等五个组别的占比分别为2.0%、3.7%、3.0%、0.5%、0.1%。同时,从动态变动情况来看,无论是集体观抑或是偏见程度,均随着实验日期的差异有着较大的波动。
综上,从平台层面的观念流来看,三种观念的历时性变化和分布存在一定的差异,且均随着实验的推进有或大或小的波动,构成一个不同速率的多重流动体系。由此,我们得以在相对整体的层面上理解平台推送信息的观念空间及其演化过程。
六、从平台到用户的观念流
本节重点比较不同观念由平台向不同用户的流动模式。这一方面有助于理解上述平台观念空间是如何由一个个隐蔽的个体观念流汇聚而成,另一方面有助于呈现观念在平台和不同用户间的流动图景,进而揭示观念流背后所体现出的社会、平台以及用户等多主体间的互动模式。
(一)不同观念在用户间的流动
为实证探索不同观念在不同用户间的动态流动模式,笔者采用OLS模型对平台为不同用户推送信息中承载的情绪程度进行考察,同时采用ZINB模型分别对平台为不同用户推送信息中承载的集体观念程度以及偏见程度进行考察,相关回归结果呈现在表1中。
在表1关于信息中承载情绪的回归模型中,在控制了信息推送组别、信息在实验中是否被点击、信息阅读量对数、信息类别等变量的前提下,笔者考察了组别、实验阶段、组别与实验阶段的交互项对信息中可能承载的情绪程度的具体影响。考虑到今日头条平台为不同组别推送的信息本身就可能存在较大重合,而这可能对实证结果有较大影响,因此本文在模型中首先控制了信息推送组别变量。具体来说,以信息为单位,将信息分为只被推送给对应观念低于均值组别、只推送给对应观念高于均值组别、以及两个组别均推送等三个类别。从实证分析结果来看,只推送给对应观念高于均值组别的信息承载的情绪最为正面,只推送给对应观念低于均值组别的信息承载的情绪最为负面,相对而言,两个组别均推送的信息则情绪处于中间,这初步揭示了平台针对不同用户组别的推送逻辑。同时,相较于推送给用户但未被点击的信息,在实验中被点击的信息情绪更为正面,平台为用户推送的阅读量越大的信息承载的情绪越负面。因不同信息类别同样会对信息中承载的情绪有较大影响,该变量也被放入模型中,以控制信息类别的可能影响。
从表1关于信息中承载情绪的模型结果看,模型主效应显示,在实验开始阶段,平台为起始阶段情绪均值高的组别推送信息的情绪明显更为正面,同时推送信息中承载的情绪并非随着实验推进而不断趋于正向或负向,而是随实验阶段的不同而不断波动。模型的交互效应分析则表明,随着实验的推进,两个起始阶段差异较大的组别被推送的信息中承载的情绪差异并未不断扩大,而是整体缩小,但又并非随着实验推进而不断缩小,而是同样因不同实验日期而不断波动。
从表1关于信息中承载集体观的模型结果来看,模型主效应显示,在实验开始阶段,对于起始阶段集体观高于均值的组别,其被平台推送的信息中承载的集体观也得分更高,且同样会因实验阶段的不同而不断波动。模型的交互效应分析则显示,两组之间被推送信息所承载的集体观念程度差异并非不断扩大或缩小,而是随着实验阶段的不同有所波动。
从表1关于信息中承载偏见的回归模型结果来看,在实验开始阶段,对于起始阶段偏见程度高于均值的组别,其被平台推送的信息中承载的偏见程度更高,且同样会因实验阶段的不同而不断波动。最后,模型的交互效应分析显示,跟情绪和集体观一致,两组之间被推送信息所承载的偏见程度差异并非不断扩大或缩小,而是随着实验阶段的不同有所波动。
图3进一步用三个子图(图3a、图3b、图3c)分别报告了起始阶段对应观念组别与实验阶段等两个变量对三种观念影响的边际效应。图3a呈现了情绪在不同组别的流动情况,从图中可以非常直观地看到,对于起始阶段差异较大的两个组别,平台为其推送的信息中承载的情绪差异并未随着实验的进度不断扩大或不断缩小,也并非随着实验的进度而走向混乱,而是始终保持一定差异。有趣的是,当受到外部正向事件(如实验第16天东京残奥会开幕)影响时,平台为两个组别推送信息中情绪均更为正向,而当受到外部负向事件(如实验第8天)影响时,平台为两个组别推送信息中情绪均更为负向。但不管受到哪个方向的外部事件的影响,两个组别始终保持着一定的差异,进而呈现类似“同频共振”的特点。
图3b呈现的集体观在不同组别的动态流动模式和图3a高度相似,从图中可见,对于起始阶段差异较大的两个组别,平台为其推送的信息中承载的集体观差异同样并未随着实验的进度不断扩大、缩小或变得混乱,而是随着不同外部事件的发生而始终保持一定差异,呈现“同频共振”的特点。图3c呈现的偏见在不同组别的动态流动情况则与上述两图有一定差异,两个组别在起始阶段的差异较小。随着实验的推进,尽管大部分时间起始阶段偏见程度较高的组别被推送信息中的偏见程度较高,但也有部分时间低于另一个组别。这也表明,如果组别间起始阶段差异不明显,将直接影响平台后续观念推送的精准度,因此起始阶段差异的大小对观念流动模式有着较大影响
上述对三种观念在不同组别的流动轨迹的追踪和呈现初步揭示了平台、社会、用户间的互动逻辑。外部社会因素的冲击并未弥合或扩大不同组别的差异,也未使不同组别的差异走向混乱。相反,不同组别的差异始终保持相对稳定,这非常直观地反映了外部社会事实如何影响观念的形成和流动,以及平台如何通过对不同用户的推送行为来调节不同观念的可见性和影响力。同时,上述发现意味着,现有文献主要分析离散的平台算法、外部事件冲击及用户行为对信息扩散的影响,并尝试寻找相对稳定的影响模式。然而,这些研究忽视了观念流动的复杂性和动态性,单一的稳定模式难以深入解释信息扩散及其背后的社会机制。
(二)基于特定信息类别的观念流分析
上一小节基于平台为不同用户组别推送的所有信息考察了不同观念由平台向不同用户的纵向动态流动模式。实际上,不同类别信息中承载的观念变化幅度可能存在较大差异,如社会类别信息观念变动幅度较大,而饮食类别信息观念变动可能较小。基于此,本节尝试分别挑选出三种观念变动较大的信息标签,进一步探索平台在面对观念变化幅度较大的信息时,如何呈现和调解观念流。具体而言,笔者基于113个不同的信息标签分别计算情绪、集体观念、偏见程度等三个值的标准差并进行排序,挑选出“社会”“历史”“娱乐”等三类观念变动幅度较大的信息类别,然后使用跟上一小节同样的建模策略,考察三种观念的流动情况。
图4用三个子图分别报告了在不同的信息类别模型中,起始阶段对应观念组别(分组与表1一致)与实验阶段等两个变量对三种观念影响的边际效应。图4a以社会类别信息为例,呈现情绪在不同组别的动态流动情况,从图中可见,对于起始阶段差异较大的两个组别,平台为其推送的信息中承载的情绪尽管均波动较大,但始终保持一定差异。图4b则以历史类别信息为例,呈现集体观念在不同组别的动态流动情况。与图4a类似,平台为其推送的信息中承载的集体观念尽管波动很大,但两组始终保持着一定的差异,呈现“同频共振”的特点。图4c以娱乐类别信息为例,呈现偏见的动态流动情况,其结果与前述两图有一定差异。两个组别在起始阶段的差异较小,平台为其推送的信息中承载的偏见程度也波动较小;随着实验的推进,两组呈现不断交叉的流动模式。
(三)用户行为变化如何改变观念流
本小节进一步考察用户点击行为的变化对观念流的影响。根据研究设计,笔者在实验进行的第14天改变用户组别部分账号的点击偏好,尝试验证上文结论的稳健性,同时探索用户行为变化对观念流的影响。以情绪为例,笔者将用户组别进一步细分为起始阶段情绪均值高控制组(点击偏好始终不变)、起始阶段情绪均值低控制组(点击偏好始终不变)、起始阶段情绪均值高实验组(点击偏好第14天起发生变化)、起始阶段情绪均值低实验组(点击偏好第14天起发生变化)等四个组别,其他建模策略参照表1。图5报告了四个组别与实验阶段等变量对情绪影响的边际效应。
由图5可见,一方面,在用户偏好逆转之前(也即第1天至第13天),无论是起始阶段情绪均值高还是情绪均值低,其实验组和控制组(起点本身差异也非常小)的情绪流动模式均较为一致,这验证了上文实证结果的稳健性。在第14天实验组的用户改变了点击偏好后,在起始阶段情绪均值高的组别中,实验组的情绪流动模式迅速与控制组发生分化;而在起始阶段情绪均值低的组别中,控制组和实验组的情绪流动模式也逐步分化。换言之,在用户点击行为逆转后,两个控制组(点击行为不变)仍保持着与上文类似的流动模式,而实验组的流动模式走向混乱。实验组在用户点击偏好逆转后,情绪流动模式迅速走向混乱,这表明当用户给出负反馈或者主动改变点击行为时,平台会迅速适应用户的动态偏好,从而导致推送策略的频繁调整。由此可见,平台对外部社会事实的调节与吸纳能力依赖于用户行为的相对稳定性,一旦这种稳定性受到挑战,观念流动模式便可能出现显著波动。
(四)观念流动中三种观念间的关系
最后,本文尝试考察不同组别内部以及组别间三种观念流动模式的关系与结构。基于图3预测出的不同组别三种观念流动的时间序列数据(共六个时间序列),计算各个时间序列间的DTW距离,得到的距离矩阵如表2所示。
从不同观念内部看,起始阶段情绪差异较大的组别间的DTW距离为5.98,起始阶段集体观念差异较大的组别间的DTW距离为4.31,起始阶段偏见程度差异较大的组别间的DTW距离仅为0.49,上述较小的DTW距离表明尽管观念流动会随着不同外部事件而不断波动,但同一观念内部不同组别的流动模式非常接近。从观念间的相关关系来看,情绪与偏见的流动模式更为接近,而情绪与集体观、偏见与集体观流动模式之间的差异则相对较大。这意味着情绪和偏见在平台中的流动是高度联动的(尽管从相关关系看两者是负相关的),相对而言,情绪和集体观以及偏见和集体观的联动性则较弱。换言之,当面对特定社会事件和情境时,情绪和偏见的扩散可能更快更同步,而集体观则更加稳定。当然,上述结果刻画的是初步的观念演化差异,不同观念间隐蔽的交叉和纠缠模式背后的社会机制与长期后果等议题则需要进一步探讨。
七、结论与讨论
为捕捉数字时代海量信息动态而复杂的扩散过程,本文基于观念流视角,通过追踪情绪、集体观和偏见等三种观念的连续流动轨迹,尝试呈现数字时代的平台观念流动与演化图景。从三种观念在平台的观念流动轨迹看,不同观念的流动并非是线性或遵循单一规律的时间序列,而是一个由不同速率构成的复杂流动体系。从平台向不同用户的观念流动轨迹来看,尽管平台为用户推送的信息中承载的观念会随着不同外部事件的发生而不断波动,但不同组别间始终保持着一定的差异,并未随着实验的推进而不断扩大、缩小或变得混乱,而是呈现“同频共振”的特征。
上述实证结果表明,相较于已有视角,观念流视角在捕捉和理解外部社会事件、平台和用户之间的互构模式,挖掘隐蔽的观念流动的亚稳态结构,以及揭示不同观念之间的纠缠和互动等方面有着明显的优势。对观念流动轨迹的动态追踪清晰地反映了面对不断影响着不同观念生产和扩散的大大小小、不同类型的社会事实,平台如何以惊人的准确性去调节这些观念的可见性和影响力。观念流视角揭示了社会事实、平台以及用户三者之间的互构模式,即外部事件不断触发社会事实的重构,平台根据这些变化以及用户行为去调整信息流,从而共同决定平台观念流动图景。这也直接表明,观念流动并不受单一主导变量决定,解释数字时代信息扩散的关键在于灵活追踪不同观念在多样化社会情境中的流动与演变。
回到本文开头提及的已有研究关于平台与社会关系的争论,如果从单个观念在平台的横向流动模式来看,平台观念随着不同社会事实的变化而不断波动,对共同社会事实的关注确实可能会促进公众的社会共鸣。如果选取一个时间截面观察观念在不同组别的纵向流动情况,则可以看到不同用户被推送的信息所承载观念的差异,进而引发研究者担忧用户间的观念分化。本文关于观念在不同组别间“同频共振”以及不同观念间的互动纠缠模式的实证发现则提醒我们,数字时代的信息扩散本质上是维度高度复杂且不断变化的,难以单纯依靠某个特定观念在某个时间截面的观测数据或依据特定主导变量总结的稳定模型来准确解释。有趣的是,不预设结构的观念流视角反而发现了观念流动中的亚稳态结构。
观念流视角对复杂动态变化的敏感性和灵活性使其有潜力广泛地应用于数字时代重要社会现象的研究。例如,基于不同数字平台,观念流视角一方面能从不同颗粒度观察外部事件发生时平台各类观念的生产过程以及在不同用户间的扩散轨迹,另一方面也能从更长跨度分析诸如平台主导观念的形成与演化。此外,观念流视角还能够灵活地跨越不同颗粒度,分析不同类型、层次观念如何在宏观结构和微观行为之间流动和转化。换言之,通过追踪不同观念在社会中的流动与演化,观念流视角能够同时捕捉即时性的微观社会变化与长期性的宏观社会变迁,进而有助于研究者更深入地理解数字时代社会现实的复杂性和社会变迁的内在动力。