专栏名称: 国际新闻界
新闻传播学科唯一的国家社科基金首批资助期刊、全国中文核心期刊、全国新闻核心期刊、中文社会科学引文索引(CSSCI)来源期刊。
目录
相关文章推荐
社会学理论大缸  ·  新春报名丨《社会学知识体系十讲》带你系统搭建 ... ·  3 天前  
研之成理  ·  杨培东,Nature Catalysis! ·  3 天前  
51好读  ›  专栏  ›  国际新闻界

张志安 | 大数据与新闻传播研究的学术想象

国际新闻界  · 公众号  · 科研  · 2018-04-27 09:21

正文


重大利好!只要评论“反思传播学”专辑的文章,就有机会获赠政治传播学名著。详情点击以下链接! 评论赠书 | “反思传播学四十年”特别活动


# 本文系2018年第2期

“反思传播学”专辑系列文章 #


作者


张志安,中山大学传播与设计学院教授、院长,广东省舆情大数据分析与仿真重点实验室、广州大数据与公共传播研究基地主任。


本文是教育部哲学社科研究重大课题攻关项目“大数据时代国家意识形态安全风险与防范体系构建研究”(编号:16JZD006)。



不久前,阿里巴巴董事局主席马云(2017)在第四届世界互联网大会开幕式致辞时说:未来30年,数据将成为生产资料,计算会是生产力,互联网将成为一种生产关系,如果我们不数据化,不和互联网相连,那么会比过去30年不通电显得更为可怕。作为互联网巨头公司,他强调互联网企业要将大数据作为核心竞争优势是非常必要的,而作为研究者,我们关注人和技术的关系、研究互联网信息传播对人类行为的影响,的确也需要把大数据作为一种新的“生产资料”。


本文首先从理论取向和应用取向的维度,简要回顾大数据与新闻传播的相关研究,继而对基于大数据的新闻传播研究进行特征概括和必要反思,最后试图针对大数据如何给新闻传播研究带来新的学术想象做一些探讨。


一、 理论和应用取向的大数据与新闻传播研究


笔者(张志安,曹艳辉,2017)曾对2011-2016年间新闻传播学领域SSCI、CSSCI期刊上的相关研究进行过梳理,大体勾勒出相关研究的基本轮廓:


其一,理论取向的大数据传播研究,主要运用大数据方法来对传播研究的理论进行验证或发展。相关研究主要从四个方面切入:1.关于传播主体与关系网络,主 要是突破以往有限样本和案例,运用大数据方法来对推特、论坛上的传播关系网络进行分析,集中探讨网络媒体是否有助力复兴“公共领域”,包括网络表达的政治同质化现象、网络意见领袖及其权力结构等;2.关于传播内容与公共舆论,主要研究社交媒体的自我表达、内容生产和政治传播呈现哪些特点和规律,比如不同文化群体的表情符使用差异、传统媒体和社交媒体上政治评论的异同、社交媒体上的情感表达及其对争议性风险议题的态度等;3.关于传播过程和信息流,借助大数据分析可以实时、精准记录社交媒体上的传播过程,如针对热点事件考察信息流中的信源和信息路由器(key information routers)、不同社交媒体的技术文化差异及其在网络动员中的作用等;4.关于传播效果,运用大数据方法来检验政治传播、风险传播的效果,比如通过议题之间的语义网络分析来丰富议程设置的测量维度、以社交媒体内容为文本考察恐惧诉求在禁烟宣传中的说服效果等。


其二,应用取向的大数据传播研究,主要聚焦于数据新闻、精准营销和网络舆情等领域。关于数据新闻,学者们(张帆,吴俊,2016)重点探讨大数据对“新闻生产流程、报道内容、数据素养和伦理道德”等四个方面的影响,考察其如何重构新闻生产的环节、重塑新闻质量标杆、怎样提升受众反馈等,其中,借助大数据分析进行的调查性报道极大提升了媒体超越表面现象、挖掘深层现实的能力;借助大数据分析,广告业可以更加精准地分析消费者需求、进行精准可控地广告投放和效果评估,海量用户的网络行为数据成为新媒体营销的重要“资本”,精准化、个性化和可预测逐渐成为大数据驱动下精准广告营销的新特点。


从国内新闻传播学科针对大数据的研究来看,网络舆情是重要的关注焦点,上海交通大学、中山大学和暨南大学等均成立了与大数据舆情相关的实验室,运用大数据进行舆情分析的确存在诸多优势(张志安,曹小杰,晏齐宏,2017):比如获取网络上公众表达和转发等动态数据,可及时或实时跟踪研究网络舆情动向;聚焦特定议题或事件,有助于把握网络舆情的总体发展态势;获取社交媒体相关数据,有助于深度挖掘网络中的信息流动规律等。不过,大数据舆情分析和传统民调方法应该有机结合,而非片面追求新数据,而放弃传统的、经典的社会调查方法。


二、基于大数据的新闻传播研究的主要特征


通过上述研究回顾看,运用大数据分析方法来做新闻传播研究,基本上可以概括为两种类型:一是“新方法+旧问题”,运用社交媒体和论坛数据研究信息流、议程设置、意见领袖等传播研究的经典问题,但更多的是着力于比较传统媒体和网络媒体之间的效果差异;二是“新方法+新问题”,运用社交媒体、论坛数据研究表情符号、网络情绪、在线关系网络等互联网研究领域的新问题。无论哪种类型的研究,要真正在理论建构上获得突破都并非易事。


从研究问题看,现有大数据与新闻传播研究多数还是“数据驱动”的研究,而非“理论驱动”的研究,能拿到各种类型的网络大数据并基于这些数据来进行理论研究,本身就是这个领域一直积极探索的方向。目前的数据来源,国外研究主要是推特(Twitter)、YouTube、Facebook等社交媒体,而且大部分是推特这一开放性社交平台的数据,国内研究主要是论坛、微博、百度等网络社区、社交媒体和搜索平台的数据而且以微博这一开放性社交平台的数据为主,数据规模小则数万、数十万,多则数千万和上亿。与传统研究主要通过调查问卷、访谈等方式获取受访者“自我报告”数据,不同的是,基于大数据传播的研究主要以精炼的“关键词”或整群采样来建立数据库,传统的抽样逻辑被颠覆,研究的关注焦点从“代表性的小样本” 转向“选择性的全样本”(张志安,曹艳辉,2017)。


从研究方法看,针对大数据的处理往往与计算机辅助内容分析、自动化的数据 挖掘、大规模的社会网络分析相联系,需要传播学、心理学、计算机等多学科的理论和方法支撑。其中,最流行和便捷的计算机辅助内容分析方法是基于词典的文本分析工具(Dictionary-Based Text Analysis),可以根据词典中关键词所属类别自动对文本内容进行编码;机器学习(Machine Learning)包括无监督、有监督的机器学习两种类型,是基于数据经验来识别提取数据类型、做出决策的算法;复杂社会网络分析常针对传播者(如意见领袖)、传播议题之间的关系进行分析,常用工具包括Ucinet、Gephi、Pajek等(张志安,曹艳辉,2017)。


从研究结论看,基于大数据的新闻传播相关研究更多注重的是变量之间相关关系的检验,而非因果关系的阐释。一方面,这受制于研究所收集的网络数据很难进行结构化处理,难以获取研究样本详实的人口统计变量数据,更重要的是难以根据研究目的灵活设计控制变量,只能基于自然生成的数据进行挖掘;另一方面,基于时间、人力和研究成本的考量,要收集到更多不同维度的线上和线下数据,尤其是将社交媒体上网民表达的内容数据、浏览和转发的行为数据与其现实生活中的人口学特征数据结合在一起进行研究,难度非常大。正如喻国明(2014)指出:大数据思维只关注“相关性”,而不再关注“因果”关系,对大数据的研究,发生了从 “随机样本”到“总体”的研究范式改变,对其研究的重点正从“理论”向“算法”与“规则”转换,理论研究的指导价值正在下降。目前,基于大数据的新闻传播研究具有哪些总体特征?第一,社交媒体数据成为研究公共表达、传播内容和传播效果的新数据来源。比如运用微博数据可以测量不同热点事件发生过程中的公共表达议题、意见领袖的关系网络、网民的直觉情绪;运用搜索数据可以分析公众关注某个社会议题的搜索路径和认知深度;基于不同热点事件的微信H5数据可以研究同一议题、不同内容的网络扩散路径,进而探讨民族主义情绪和微信传播模式之间的关系等。


第二,运用社交媒体数据进行的研究,回应的问题依然是议程设置、沉默螺旋等传播效果研究的经典问题,其背后依然是美国传播学的实证研究范式占主导。比如,运用社交媒体和传统媒体的文本进行分析比较,考察不同平台之间议题的多元和复杂互动,针对某个特定议题或事件分析预测哪个平台、哪种议题网络能够更好的预测某个群体的关注、表达和参与行为等。


第三,针对社交媒体数据的分析维度,从传播内容、传播过程和传播者关系网络越来越多地拓展到情绪、态度、空间等跨学科研究的视野中。比如社会心理学相关研究,利用社交媒体数据挖掘进一步检验用户线上情绪和线下情绪、线上心理和线下心理之间的关系;计算机仿真的相关研究,运用大数据进行人工社会的模拟系统平台建设,预测不同热点事件在线上和线下不同空间中的传播规律等。


值得思考的问题是,通过“新数据+旧问题”的研究能否越来越多地催生“新数据+新问题”的研究,“数据驱动”的研究能否越来越多地走向“理论驱动”的研究,“相关性”的研究能否越来越多提升至“因果”关系的研究,从而真正借力大数据分析方法为新闻传播研究打开新的视域。


三、 以大数据方法提升新闻传播研究的主要路径


运用大数据分析和挖掘方法来提升新闻传播研究的学术想象力,需要面对挑战和抓住机遇。以时下国内新闻传播学界热衷的网络舆论研究为例,如果只是进行决策研究、提供舆情分析报告和对策建议,则门槛相对较低,如果要真正进行学术研究,则至少面对三个方面的挑战:


(一)数据如何获取:学术机构如果要采购微博等平台的数据,购买成本非常高;如果利用高校自建的数据实验室、借助网络爬虫等方式进行数据抓取,则很容易被拦截而无法持续抓取;如果通过学术合作的方式,跟百度、腾讯、阿里巴巴等 相关互联网公司建立数据合作,所获得的传播数据往往规模有限且抓取、分析和成果发表等各环节面临诸多限制。此外,数据获取还面临着两个比较突出的困难,一是“数据孤岛”的问题,即微信、微博和各大网站的数据之间并未打通,每个平台的数据只能反映特定平台上网络舆论的特征;二是数据的“结构化”问题,即便能够抓取和分析每个平台的全样本数据,也很难对其在多大程度上符合总体人口的样本特征进行充分说明。


(二)数据如何分析:针对社交媒体的数据分析需要解决概念测量、理论建模、模型计算等诸多环节的方法难题。比如,分析网民针对特定议题所形成的网络情绪,如果仅仅从关键词的维度进行正负情绪的统计,就很难真正准确的挖掘情绪背后的态度和心理。为此,需要结合表情符号、图片、主题识别、议题类型等进行更深度、更准确的分析;再比如,针对微博140个字左右的短文本、针对微信数千字的较长文本,要进行准确的主题识别,需要更多计算机自然语言处理和数据挖掘的方法。


(三)数据如何洞察:利用不同社交媒体的网络舆论数据,通过分析来把握中国社会的真实民意,是极具挑战的。多数舆论数据都根据热点事件来进行抓取和分析,主要停留在“事件型”舆论层面、而非“话题型”舆论,因此需要更长时间的纵向研究、更多维度的横向比较。此外,借助大数据方法进行的舆论研究还需要跟传统社会调查、实验法等方法进行综合运用,才能更加准确地分析网络空间舆论和现实空间舆论之间的互动关系。


基于上述挑战,笔者认为,大数据作为方法也作为语境,要真正助力于新闻传播研究的学术想象力提升,需要重点从如下方面做更多努力:


首先,处理好“理论驱动”和“数据驱动”的关系。现阶段,能够抓取到知乎等问答社区、百度等搜索平台、微博、微信等社交媒体、今日头条等聚合型资讯终端的数据,在把握不同平台的网民结构、技术特性和文化偏向基础上,进行一些“数据驱动”的研究探索是有其意义的。但长远来看,则需要从“理论驱动”的层面,对相关数据进行结构化处理、科学化分析,从理论假设、检验和建构的高度进行更具学理性、普适性的学术研究。


其次,处理好学术前沿问题和中国本土问题的关系。社会科学的研究要解决“全球化”和“本土化”问题,归根结底要立足中国本土的政治、经济、社会和文化脉络,将基于现实的实证数据进行理论阐释、全球学术对话和普遍规律的探索。 比如,基于信息流的过程追踪、地理和议题差异的网络舆论研究,将其与中国政治 文化生态和舆论调适的权力结构结合在一起进行分析,探讨网络舆论生成规律和现实社会舆论空间的复杂互动;基于港澳台和内地舆论场针对同一议题的社交媒体传播数据,分析同一国家、不同地区的跨境政治舆论场的差异和影响机制。


最后,处理好网络空间数据和现实社会数据的关系。今天的互联网早已不再是“虚拟社会”,所谓的“虚拟”和“真实” “线上”和“线下”的边界早已被打破,但是,我们的研究总体还很缺乏对网络空间数据和现实社会数据整合打通的尝试。回到心理空间、网络空间和现实空间的多维空间传播实践的角度看,今天越来越需要在社会空间、网络空间、心理空间等多空间视域下重新审视人、信息和技术之间的关系。大数据时代新闻传播研究,需要追问的是:大数据会为我们认识和理解日益复杂的互联网社会提供新的可能吗?能够让我们在已然分割学科的边界中拆掉篱笆、运用不同学科的理论资源去完整认识社会吗?从这个角度看,立足多空间视域、运用跨学科视角,将传播视角的研究拓展至社会视角的“整体论”研究,应该是我们基于大数据的新闻传播研究“再出发”的观念起点。


原文刊载于《国际新闻界》2018年第2期。

封面图片来源于网络

本期执编 / 库萝


点击以下链接,可以阅读本专辑已经完成推送的其他文章。

吴飞 | 回首与展望:反思传播学话题引言
陈卫星 | 媒介域的方法论意义
单波 | 从新体用观的角度建构中国传播学的反思性






请到「今天看啥」查看全文