专栏名称: 国际新闻界

新闻传播学科唯一的国家社科基金首批资助期刊、全国中文核心期刊、全国新闻核心期刊、中文社会科学引文索引（CSSCI）来源期刊。

描述和可复制性：关于经验知识生产的对谈

国际新闻界 · 公众号 · 科研 · 2024-12-07 13:22

正文

本刊官方网站：

http://cjjc.ruc.edu.cn/

摘要

新闻传播学需要关注研究的可复制性危机。在这次对谈中，我们讨论了对现象的描述如何作为获取经验知识的基本手段，可复制性如何成为知识生产的认识论原则。在这个基础上，我们考察了2023年新闻传播学五大期刊发表的论文。结果显示，其中经验研究的可复制程度普遍不高，尤其是在人文取向的质化研究中。针对这些结果，我们展开了科学认识论的分析和解读，并据此提出了提升经验研究可复制性的具体建议，以求走向可相互检验、提升社会公信力的新闻传播学研究。

作者简介

於红梅，上海政法学院上海纪录片学院副教授。

潘忠党，美国威斯康星大学-麦迪逊校区传播艺术系教授。

於红梅（以下简称“於”）：2024年新年伊始，由人大出版社和几家重要期刊共同组织的线上学术回顾系列讲座汇聚了多位新传界的“大咖”，被称为“新传小春晚”。我虽未全程参与线上听讲，但是阅读了其中一些文字稿。读后觉得，这样的总结归纳太好了，非常有助于学术共同体的建设。对于青年学子来说，它们更是提供了一份导航图，用来找到学科的脉络和学术旅途的方向感。回头去看，感觉这样的年终回顾，是学界展开“认知的反身性”（epistemic reflexivity）思考的活动。借此，学界同行们批判地审视本学科各个领域的知识生产，包括做了些什么，遵循了哪些原则和步骤，在知识生产过程中有哪些得与失，产出了哪些，在哪些方面可以称为“成果”，知识呈现的规范化方面还有哪些可能需要的提升或不足等等议题。

潘忠党（以下简称“潘”）：非常同意。皮埃尔·布尔迪厄（Pierre Bourdieu）（2004）所说的“认知的反身性”是提示我们审视学科建设和知识生产的各个环节，而非个人的自我保护或疗愈。如此看来，“年终回顾”可被看作是对一个研究领域或议题的“元分析”式（meta-analytic）综述或整合。采用澳大利亚学者卡尔·梅顿（Karl Maton）对知识宣称的三重关系的框架（Maton，2003），这样的“回顾”，可以格外关注你提到的最后两个问题。针对这两个问题审视已有的文献——更确切地说，应当是“审议”，因为它并非个体孤立展开的活动，而是共同体成员展开的讨论——是学术实践和建制（institution）的有机构成元素。它是个过程，实实在在地体现和践行着可以凝聚学术共同体的基本判断标准，即认识论的规范（epistemic norms）的实践过程。

於：这个题目可能太大了，我们不可能在这里全面地讨论这些规范的内容、形成、功能，以及它们如何嵌入知识生产的社会实践中这些宏大议题。或许我们可以聚焦知识生产的一个类型，即经验研究，以及经验研究中的描述及其可复制性（replicability）。这样的讨论，也是为了更进一步理解如何以“认知的反身性”为路径展开“文献综述”或“研究回顾”，或者说如何可能将这类学术活动作为展开“认知的反身性”审视的机会和场合。

一

“可复制性危机”与我们如何相干？

潘：那我们就从社会科学界的“可复制性危机”（the replicability crisis）谈起吧。2015年，美国心理学界发生所谓“再生性危机”（the reproducibility crisis，亦称“可复制性危机”，the replicability crisis）。这个危机的标志就是以“开放科学合作团队”署名发表在《科学》（Science）上的一篇研究报告（Open Science Collaboration，2015）。这份报告公布了对心理学三份主要期刊发表的100项研究展开的复制研究所得的结果。团队用了公开征召的方式，汇聚了一批心理学家复制这些构成心理学知识体的经验研究。结果发现，复制研究所估测的效应值（effect size）只有原始研究报告的一半，只有47%的原始研究报告的结果仍在复制研究结果的95%置信区间中。这篇报告将科学研究中“可复制性”的问题提升到了格外醒目的位置。当然，可复制性危机并不限于心理学，甚至不限于社会科学（Freese & Peterson，2017），自然科学领域同样面临这个危机（Begley & Ioannidis，2015）。

於：以上讲的主要是采用量化的实验方法的领域。您似乎已经在说，经济学、社会学、政治学等社会科学领域同样可能面临可复制性的问题。但是，这些领域目前似乎尚未受到类似强烈的冲击。基于自己有限的阅读和理解，我的印象是，这些领域的量化研究往往分析的是来自巨大样本的数据。按照您说过的，样本量大意味着统计检测的统计功效（statistical power）更强，而且，我估计这也意味着展开复制性研究的难度更大。另外，这些学科各自都突出地具有包含从微观到宏观、采用量化或质化研究方法的多元性，对于可复制性，学科内一致性的关注不是特别突出。当然，您前面提到了社会学家弗里斯和皮特森（Freese & Peterson，2017）的文章，他们强调，社会学界同样需要以“开放科学”的理念提升研究实践和规范，将可复制性作为鉴定研究发现的一条基本判断和实践标准。那么，传播学界呢？

潘：传播学界已经开始谈论了。譬如，2021年，美国传播学的旗舰刊物《传播学刊》（Journal of Communication）发表了一篇由多位学者联合署名的文章（Dienlin et al.，2021），呼吁在传播学界实践开放科学，表达了对可复制性的危机意识。虽然传播学界还远没有大面积地展开复制性的研究，但是一些期刊也开始鼓励甚至要求研究者按照“开放科学”的规范，预先注册实验设计、准备检验的研究假设、计划采用的统计方法等。

於：这么说来，提升经验研究的可复制性正在从知识生产的评价标准转换为实践的规范。但是，我也看到多个与“可复制性”相关的表述，把这个概念弄得有些含混不清。譬如，强调“可复制性”是否就意味着要重复展开同一项研究？是全部的复制，即只是换个时空点的重复；还是部分的复制，也就是在相同的理论框架下采用相同的逻辑拓展某项研究？还有，可再生性（reproducibility）与可复制性（replicability），它们是不同概念，还是同一理念的不同表达？

我查阅了一些相关文献后发现，可再生性与可复制性经常被互换使用，说明它们关系密切，体现了二者共享的逻辑，也就是要求一项研究的操作和报告，都具有可接受重复研究和独立审核的基本特征。不过，可再生性的含义可能更具体一些，即一项研究结果在多大程度上可以重复获取。而可复制性含义更广一些，包括一项研究是否有意义，值得重复展开，以进一步检验其可信程度；还包括一项研究报告是否从理论阐述到研究操作等各个方面，都对同行开诚布公，提供了可以追寻的足迹和如何操作的信息，使得同行们有可能复制这项研究，以验证其结果的稳定和可信，以及可被推广（generalized）的范畴。

譬如，德国特里尔大学数字人文学者克里斯托弗·舍科（Christof Schöch，2023）以“重复性研究”（repetitive research）的概念，开辟了一个由方法、数据、研究问题构成的多维理念空间（aconceptual space），以容纳并区分不同类型的知识生产中的重复验证型研究，其中包括检验一项研究的质量、一项研究的结果是否可推衍至其它情境，采用不同的方法是否可验证对同一研究问题的解答，等等。阿姆斯特丹自由大学哲学教授瑞克·皮尔斯（Rik Peels）（2019）则选用复制（replication）作为统括性概念，并且区分了采用已有数据或研究程序的复制（再生），运用已有研究程序搜集新数据的复制（直接复制），运用修订的研究程序搜集新数据的复制（理念层面的再生）。我觉得皮尔斯的梳理读着更顺畅，概念的区分对我们更有帮助。

潘：我同意，这也是为什么我们用“可复制性”来展开这场对谈。运用这个词指代研究结果的可靠性，具体来说，是研究论文报告的操作程序，在多大程度上为重复研究提供了行动轨迹；如果遵循同样的程序，可能再生该论文报告的结果，至少验证该论文所得结论在经验层面的可靠程度。因此，我们可以区分完全复制、部分复制、理念复制等不同程度、服务不同知识生产功能的复制性研究。其中的核心是，第一，研究的展开须遵循符合逻辑规则的操作化程序；第二，论文对这样的程序不仅有论证，而且有具体的描述型呈现；第三，研究结果和结论经得起同行的独立审核，包括可在重复性研究中再生；第四，可复制性是鉴别经验研究成果的一条认识论标准，因此，常规性的复制性研究必须成为一个学科知识生产建制的核心内容。

於：但是，或许有人会认为，这样的认识论标准不适宜所有学科的知识生产；所谓“可复制性危机”只发生于以“客观性”为知识的必要特性之一、采取量化手段的经验研究领域，在以阐释意义为目的、采取某种质化手段的研究领域，包括如历史学、文化人类学以及质化取向的社会学和政治学等，人们更强调在研究过程中研究者的直接参与，他/她们所面对的研究对象具有历史动态的文本特征，因此需要研究者对之展开置身情境的解读。鉴于“解读”（或阐释，interpretation）的这些特性，“可复制性”作为一个评判标准，也就在认识论层面失去了其必要的理由。换句话说，质化的和人文取向的研究是不是就没有这样的所谓“可复制性危机”了？不过，我刚提及的舍科和皮尔斯也都是人文学者。

潘：确实，在那些研究领域和学科，对于“可复制性”的强调似乎要少很多，危机感也似乎不那么强烈。这其中原因很多，你我要在哲学或者技术层面探讨其成因，力有不逮，咱们就联系实例来讨论一些表象。人文学科与社会科学（特指量化取向的社会科学）之间确实有很多差异，我们就谈三个。

第一，人文研究的对象为独特实例（instantiation），而非群体中多个个体构成的规律。具体来说，历史事件（如俄国的“十月革命”）或人文研究的文本（如《红楼梦》）往往是独一无二的，而作为研究对象的某种媒介使用行为（如微博发帖、点评等）则可以由多个人在多个时空点一再展开。对此，我觉得这只是在不同的分析层次上划分研究对象，单一的事件其实是更普遍历史现象的多个实例之一。譬如，革命性政权更替型的历史事件可能有很多，《红楼梦》是虚构小说这一类型的多个文本之一，是讲述家族兴衰过程中人生百态故事的多部小说之一。反过来说，科学所考察的多个实例，其实是某一个独特事件的构成，是更大的特定事件在具体时空点的微观呈现。譬如，宇宙大爆炸是一个时空生成事件，由无数的原子裂变构成；新冠疫苗的效果测试牵涉多个被试者和多次执行，新冠疫情控制则是一个历史事件。

第二，人文学科以及质化的社会科学研究运用多样的方法，如文本解读、历史分析、哲学思辨等等，不像科学或量化的社会科学研究运用相对单一的方法。我对此也有不同看法。首先，科学采用多种方法，并非单一，当然取向是一致的，即经验主义，也就是以考察和发现外在世界的规律为追求。其次，人文学科确实采取多种方法，百花齐放，它们并非都能统领在经验主义的名下（譬如哲学思辨）。但是，人文学科和质化取向的社会科学研究都以外在的事物或事件为对象，或者以人们历史地、社会地创造但却被外在化、具身化了的现象（譬如小说《繁花》及其获茅盾文学奖，电视连续剧《繁花》的热播及其获得豆瓣评分8.7）为对象，它们不可避免地都有经验主义的取向，其中也就逻辑地包含了可复制、需要复制作为其真实可靠程度的基础这一认识论层面的追求。

第三，与科学或社会科学以外在现实为对象不同，人文学科以人的价值和意义为研究对象，具有规范性的维度，而不是以描述外在对象为其基本特色。这一观点也可商榷。首先，社会科学当然牵涉到人们如何社会地建构意义，并在此基础上形成态度和行为，结成某种社会关系或组织。社会科学也具有规范的维度，牵涉到对现象的意义解读和价值判断。其次，人文学科当然也要“揭示”人们在生活世界中的意义及其建构，既然为“揭示”，它就蕴含了首先需要描述的真实和可被验证。意义及其建构，价值及其判断，都具有实在性，也就是基于可观察的经验痕迹或存在。再次，如果“解读”和“建构”都主观到了没有可公开呈现的行动轨迹，不是“揭示”外在世界的深层次规律或含义，不具备基本事实和解读过程的可复制性，不需要同行们的验证，那么，它恐怕就是自说自话的玄学，不是可共享的知识。

因此，我们可以在获取经验知识（empirical knowledge）这个最基础的层面判定，自然科学、社会科学和人文学科，都是通过人的感知以及对之的组织与解读来认识世界，那么，它们都应当是有迹可循的，其经验研究的结果（当我们称之为“发现”时，我们已经预设了这一点），都是事实性知识（factual knowledge）（Hammersley，2024），应当而且可能得到验证（或复制）。体现这个基本的认识论原理，作为学术传播的主要手段之一的学术发表（论文或论著），都应当具有可复制性。当然，不同学科的特征不同，包括研究对象、研究方法、操作程序等，因此，展开复制的活动方式、过程和具体评判标准可能不同。

於：也许简略提及两个实例会更有说服力。第一个是美国人类学家玛格丽特·米德（Margaret Mead）的经历。她在1925年前往南太平洋的萨摩亚群岛展开历时9个月的田野调查，在此基础上出版了其成名之作《萨摩亚人的成年：对西方文明原始青年的心理研究》（Mead，1928）。作者以生动的描述，呈现了与西方社会不同的男女青少年步入成年的青春期行为和社会关系特征。她的观察以及在此基础上的结论后来受到多方批评，尤其是一位新西兰裔人类学家德里克·弗里曼（Derek Freeman）（1983），他于1983年出版了在萨摩亚的田野考察，批评米德的描述失真，指责她过于依赖两名知情者（informants），这使得她的材料搜集片面，解读偏离了萨摩亚社会和文化的实际。这段公案直到一位美国人类学家保罗·尚克曼（Paul Shankman）（2009）于2009年发表专著后才勉强告一段落。尚克曼详尽检索、分析了米德和弗里曼的田野笔记、实物，经过验证和比较，判定米德是对的，而弗里曼则有多处服务其结论的学术不端行为。

第二个实例是美国社会学家爱丽丝·戈夫曼（Alice Goffman）（2014）对美国费城一个黑人聚集区开展的长达6年的田野调查。这项研究工作的成果是2014年出版的《在逃：一个美国城市中的逃亡生活》一书。这本书使得她声名鹊起并成为一颗学术新星。但批评的声音随之而来。批评者们指出，她的很多经验材料无法得到确认，书中有些栩栩如生的场景不可能是她在田野观察中所观察并记载的，有些甚至可能牵涉到她目睹犯罪发生而袖手旁观的情形。假如是这样的话，这样的写作便不是学术写作了。2016年1月12日，《纽约时报》刊载了长篇特写《爱丽丝·戈夫曼受审记》，描述了她当时面临的质疑和争议。她当时就职的威斯康星-麦迪逊校区的社会学系经过详尽调查后，认定其作品是有些不详和失实的瑕疵，在后来也没有给她终身教职（Lewis-Kraus，2016）。

这两个发生在不同时代的著名案例，虽然具体过程不同、当事人结局不同，但其共同点是，它们都是以田野考察为基础、以对质化资料的解读为路径、以对真实现象的生动描述为呈现手段的研究，其影响以及对之的批评，都以事实的确凿、可靠为基本立足点。因此，围绕它们的争议，可看作是可复制性这个认识论原则的体现。

潘：也就是说，质化研究，比如田野考察、民族志的方法，也都需要清晰界定所考察现象的范畴，把“样本”的选定、筛选的过程、访谈的提问和记录方式等都呈现出来。怎么才能做到，这是一个实践难题。但是，“难”不能成为“不存在”“不相干”等宣称的证据；不同学科间的不同，也不能成为证据，用以否定研究经验现象这个共同点所引发的共享的知识生产逻辑。

换一个角度说，学术研究是公开的知识生产实践，从事它的是一个社会共同体，维系它以及它的认知权威（epistemic authority）的是诚信，以及建立在此基础上的公信力。“可复制性危机”直接伤害公众对学术和学术研究的信任，以及学术建制的正当性（Gauchat，2023；Mede，Schäfer，Ziegler & Weißkopf，2021），当然也侵蚀以科学证据为基础的公共政策及其执行的正当性。造成如此危害的有两大类行为：（1）数据造假，也就是我们说的学术品德不端行为；（2）打擦边球的、可疑的研究实践（questionable research practices），也就是各种在方法上对认识论规范原理的“灵活”运用。

前一类行为及其危害有很多实例。譬如，荷兰社会心理学家蒂德瑞克·斯戴普耳（Diederik Stapel）因被证实大面积数据造假，不仅其58篇（截至2015年底）论文被撤销，而且被逐出了学术界。曾经的泰斗级人格心理学家汉斯·艾森克（Hans Eysenck）在其学术生涯后期研究致命疾病，提出了“易患癌症人格”（cancer prone personality）和“易患心脏病人格”（heart disease prone personality）的理论，他身后被人（Pelosi，2019）质疑其研究数据，他曾任教的伦敦大学国王学院仔细审查了他与德国社会学家罗纳德·格洛萨特-马迪克（Ronald Grossarth-Maticek）合作的论文，于2019年5月公布了结论：其发表在11家不同期刊上的26篇论文的结果无法复制。据艾森克的传记作者估计，至少61篇艾森克身前发表的论文应当被撤销（Buchanan，2019）。另一个实例是1998年一篇发表在《柳叶刀》（The Lancet）上宣称小儿麻腮风三联疫苗导致自闭症的论文。这篇文章于2010年因数据造假被撤销，作者安德鲁·杰里米·韦克菲尔德（Andrew Jeremy Wakefield）也被吊销行医执照。但是，他这篇文章已经造成了全球性危害，为蔓延全球的以“阴谋论”为基础的反疫苗运动提供了依据。

我国学术界对于造假等学术不端行为有“零容忍”“绝不姑息”的规定，但问题仍不少。《自然》（Nature）杂志2023年12月（van Noorden，2023）报道，2023年这一年中全球被撤销的论文总数为1万篇，以产出论文总数中被撤销的比例排序，前三名分别是沙特、巴基斯坦、俄罗斯，第四名为中国，每万篇中占23.5篇。这些统计中当然不包括中国的社会科学和人文学科。这不是说社科与人文学科不存在这些问题，而只说明我们没有将可复制性、研究结果复查纳入日常的学术活动，没有将这些落实为制度化的机制。

并不是说这些被撤销的论文都一定牵涉到数据造假或盗用，其中有些很可能是因为“擦边球”的学术实践而造成结果无法复制。这类行为被统称为“可疑的研究实践”，它们广泛渗透在学术研究的日常活动中，有些已被人们当作“理所应当”而不假思索地接受，有些则是在发表、升职压力下的“灵活变通”（Sacco，Bruton & Brown，2018）。应对这类降低可复制程度的行为，我们必须加强问题意识、提升研究操作以及发表的规范化程度，增强学术共同体内的相互监督，其中包括“开放科学”以及“开放人文”（open humanities）的制度（Dienlin etal.，2021；Knöchelmann，2019）建设。

二

描述是知识及其生产的基本手段

於：我还是觉得“可复制性”也许不能用来要求所有形态的学术作品。它是针对经验研究论文（含论著）的评判标准，因为这类论文的基本任务是报告对明确界定的某种现象的系统观察，其他的内容，譬如对这些观察的理论解读，或者这些观察如何检验了由某一理论推导出的假设，它们怎么启发了对理论的修正或提升等，都以此为基础。但是，有些论文是以哲学思辨和逻辑推演为路径的理论建构，对它们，可能“理论创新”和“思想深度”是更常用甚至更适用的评判标准。强调“可复制性”作为知识生产中的一项规范标准，是不是反而在刻舟求剑，束缚学术知识的生产？

潘：我基本同意你的观点，尤其对你的担忧持有共情的理解。规范即是约束，它有多正当，要看第一规范本身是否合乎逻辑，第二将其落实为行动的步骤是否合情合理，否则，名为规范，实为棒杀。换个角度看，你所提到的“理论创新”和“思想深度”也同样是知识生产中的规范性要求，它们也同样需要如何将其操作化的分析，包括把何为“理论”、何为“思想”阐述清晰。

我们在这里不可能展开阐述，只能在基础层面作个简略概括。首先，如你所言，我们讨论的可复制性针对的是经验研究论文。对于理论建构的文章，如果是关于经验世界的理论抽象，我们称之为经验的理论（empirical theory），那么学界通常的衡量标准更多地强调理论的可检验程度，理论阐发在多大程度上可能启发新的研究、开辟新的研究命题或领域，或者是否为已有研究命题或领域提出了有深耕潜力的方向。这样的理论，在我看来就是有思想的内核，而检验这样的理论，还是需要可复制的经验研究。

其次，以“可复制”为要求绝不意味着弱化“原创性”（originality），与“创新”并无对立。在一篇社会学论文中，几位作者（Guetzkow，Lamont & Mallard，2004）考察了人文与社科研究基金申请的同行评审。运用深度访谈的方法，他们发现，访谈的评审专家都特别强调“原创性”，其构成是不同元素的多种组合，包括采用了新路径（approach），形成了新理论，提出了新问题，挖掘了新数据，运用了新方法，发展了新论证（arguments）等。从这个角度看，“理论创新”是学术研究中“原创性”的一个构成元素，我个人倾向于将它看作是最重要的构成元素。但是，我同时也认为，复制型研究，可对已有研究步骤和结果展开独立鉴定，据此排除一些谬误，降低知识体中的不确定性，提供一些新的经验材料，或评估新研究思路的可行性，等等，它们同样具有“原创性”，是很有价值的“创新”。

第三，我认为，对经验研究论文而言，最核心的不是所谓高深的理论、时髦的词藻和以之展开的游弋于形而上层面的论述，而是要具体地描述研究者因心生困惑而展开考察的具体经验现象。这样的描述，是知识生产的基本手段，是形成知识体的必要步骤。所谓经验的理论，即是对被明确界定的经验现象的描述，其中的理论抽象，也是对该现象的表层之下、或不同现象间的相互关联、它们在历史时空中的演变规律的描述。所谓解释（explanation），即是对特定因果机制及其运作过程的描述，可能被概括为一个因果模型；所谓阐释，即是对特定现象在行动者们编织的意义网络中被赋予意义这个过程的描述，它可能被具象为一个形象或一个叙事（Becker，1998：10-66）。我们讲的知识体，其构成是理论概念、对理论概念的操作化，以及方法论及其运作步骤，它的核心应该是具有实在性的元素，是对经验观察的描述，是论证其事实性的论据。

传播学是一门经验的学科（empirical discipline），因为它是对外在经验世界的考察，它关注的是人们如何展开交往和连接。我们会去探讨其中的机制、呈现形态等各种各样的经验材料，这样的考察往往不是形而上的哲学思辨。譬如，刘海龙（2015）在《重访灰色地带：传播研究史的书写记忆》一书中，批评了实证主义的“琐碎的”经验研究，但同时指出，“传播研究之所以能够迅速成长为学科，很大程度上是因为它能回应实践的需求”（刘海龙，2015：6），并指出，他在该书所探讨的“不是自我存在的美国传播研究，而是中国传播研究者眼中的美国传播研究”（刘海龙，2015：17）。可见，这部学术史著作有清晰的经验取向，作者为之明确界定了现实世界的现象作为其研究对象，而且挖掘并解读了一些新的史料。其实，很多以“重访”为题的学术著作都特别值得一读，因为“重访”这个提法本身就包含了重新审视、重新检验、重新解读等多种可能的含义，其中隐含了“可复制性”的原理，它同时也告诉我们，如刘海龙的专著所呈现的，这样的“重访”包括了对被忽略了的经验材料或其中蕴含的情境关系的描述。

於：我理解，之所以要强调描述的重要性，是因为我们在强调理论甚至“范式”创新时可能轻视了描述。描述的准确、到位和系统，应该是判断论文的最基本的标准，如果这个表述还有理论的支撑、有在理论升华这个层次的解读，那就更好。没有描述，所谓理论便是空中楼阁。我记得您说过，那种理论思辨，属于悬浮着的七彩云霞，虽然炫目，但无从连接地面，研究便是搭建“云梯”，从空中下来，落脚在实处。

但同时，也没有理论缺位的纯粹描述。具有理论启迪意义的描述，是人类学家克利福德·格尔茨（Clifford Geertz）（1973：3-30）所说的“深描”（thick description），是将现象置于具体的历史和文化场景下展开的解读和阐释。因此，我们不能脱离理论建构谈对现象的“描述”。

潘：你说得没错，没有脱离理论的观察，当然也就没有脱离理论建构的描述。不过，这样的表述当中有对“理论”的模糊理解，还有我们对“深描”可能有的一些误解。所谓观察中不可避免的“理论负载性”（theory-ladenness）是个认识论的命题（Hanson，1969），指的是“数据”并非客观事实本身，因为它的被搜集、记录和整理，都在理论指导下发生。在认知心理学中，这表现为人们对外部世界的感知经过他们携带的认知再现（cognitive representations）系统的中介（Brewer，2015）。但是，虽然观察不可避免理论负载，这个“理论”却并非必然就是一项研究所要检验的理论，对被检验的理论而言，此处的观察也完全可能成为具有一定客观性的证据。理论负载性这个特征，更凸显了研究者需要将观察和分析的过程开放透明，与同行交流，通过不同视角下的相互检视和三角印证，降低知识生产中的不确定性。

说到“描述”，我们又多了一层可能的中介，这便是语言，包括它作为系统所携带的历史与文化积累，以及它的运用所发生的行动场景。因此，描述当然携带了多重的理论负载。但是，我们还是可以区分“浅描”（thin description）和“深描”。二者的区分，在于描述的对象，前者，用格尔茨（Geertz，1973：3-30）的话来说，是“生活的坚硬层面”（the hard surfaces of life），而后者的对象是人们在这些坚硬层面上展开的具有文本特性的行动和互动；“浅描”是对现实的硬质层面的描述，“深描”是对构成现实动态的社会行动的“符号维度”（the symbolic dimensions of social action）的描述。如宾夕法尼亚大学英语系教授海瑟·拉芙（Heather Love）（2013：409）所说，在格尔茨那里，“深描”与“浅描”并非对立，前者其实预设了后者，而且他警示读者，文化研究不能脱离生活的坚硬层面。采用格尔茨援引的那个著名示例，区别挤眼和眨眼并在具体行动和互动的场景下解读各自的意义，都需要能对最基础的，也就是“硬质”层面的眼帘运动作出描述。

很多时候，“深描”的诱惑力来自我们对“缺乏理论深度”的焦虑，对“理论创新”的迷信。我们担心文章成为平铺直叙的描述，既琐碎又肤浅。但是，“深描”却可能“是对理论的崇拜和对‘描述’的鄙视”（杨国斌，2017：40）。如美国文化人类学家约翰·杰克森（John L. Jackson）（2013：13）所言，在有些人那里，“深描”被当作一个修辞的符号，或者是方法论的一个护身符，用以抬高自己的学术分量，表达对获取丰富、严谨甚至无所不包的认知的祈求，甚至以之宣称自己独具洞见。以“深描”为方法论的呼吁，往往携带着对复杂多样的现实存在——尤其是理论光照边缘或之外——的忽视甚至是忽略。

也就是说，在认识到描述的理论负载性的同时，我们格外需要重新认识“浅描”的价值所在，突破对“深描”的迷思。虽然有理论介入的“深描”，如果操作得当，适合解答某些研究问题，但它也需要“浅描”的助力；通过“浅描”，我们可以期待更加多元的、复杂的描述与呈现。描述的确切，视角的多样，能帮助我们积累经验的知识，这是夯实理论抽象所必需的基石，并为理论检验的可复制性提供了可能。简言之，在一个经验性的学科，没有抽离描述的理论；表现形式或风格（genre）上的“人文主义或文学的转向”，也并非意味着可以脱离对外在现实的描述（Hammersley，2024）。

三

描述与可复制性如何体现在知识体中？

於：谈到这儿，对于描述和可复制性，以及两者之间的关系，我们有了比较清楚的理解。在此基础上，我们可以将“描述现象”及其“可复制性”作为知识生产中的认识论路径和原则，来经验地考察新闻与传播研究领域的知识生产。当然，全面地考察这样的实践及其过程，远非我们两人力所能及，我们可以退而求其次，考察由此生成的知识体，比如系统考察新闻传播学的五大刊于2023年刊载的所有论文。这些论文当然没有涵盖这一整年新闻传播学生产的知识整体，但是，它们代表了其中核心且最有影响的部分。我们要观察的是这个知识体中描述现象的经验研究占比有多高，这些经验研究论文呈现出多高的可复制性和可能的不足。

潘：我觉得可行。类似做法在英语学术文献中有先例。譬如，2021年，德国心理学家克劳斯·费德勒及其合作者（Fiedler，McCaughey & Prager，2021）考察了《人格和社会心理学杂志》（Journal of Personality and Social Psychology）2018年发表的33篇经验研究论文，对它们所报告的175项研究展开系统的编码和量化分析，以考察实验研究中对实验操控展开效度检控（validity control）的实践。根据结果，他们认为，当下心理学的知识生产中对测量效度的检控不够严谨，据此，他们对如何展开效度检控以提升实验结果的效度和可复制性提出了一系列的建议。与此类似，加拿大心理学家杰西卡·弗雷克等人（Flake，Pek & Hehman，2017）考察了从《人格和社会心理学杂志》2014年发表的论文中随机抽选的39篇经验研究论文（占该年这个期刊发表论文总数的34%），对它们展开编码和内容分析，以考察这些研究对其所采用的测量展开系统的效度评估的做法，以及所得证据的质量。他们的分析显示，在这方面的研究实践有种种缺陷，它们削弱了心理学研究的知识宣称。针对这种情况，作者们围绕如何提升测量的效度评估提出了一系列建议。这两项都是对知识宣称及其实践展开“认知的反身性”的经验研究。作者们都选择了同一份期刊，因为在英语学术文献中，它是涵盖社会心理学领域最全面、最有影响力（至2023年止，5年平均影响因子9.2，在收入Web of Science数据库的72份该领域的期刊中名列第一）的期刊。

於：太好了，这样的案例增强了我们对自己这个项目的信心。我先来描述操作过程。首先，我们囊括了2023年中五大刊发表的所有研究文章，在剔除卷首语、著作推广后，共计610篇。其次，根据研究目的，我们制定了一个编码表，对这些文章以篇目为单位作了编码。编码表的最主要一个变量是一篇文章是否为报告经验研究的论文。我们对经验研究论文的操作化界定是，论文作者（们）搜集并分析了一手或二手的经验材料。经验材料的形式多样，可能是问卷调查或实验的数据，田野考察或深度访谈记录，媒体（包括社交媒体）刊载的文本，历史档案或历史上的报刊对当时状况的报道等等。

对被界定为“经验研究”的论文，我们再展开进一步的编码。这部分的编码主要围绕着“可复制性”展开。所谓“可复制性”，就是论文开放其研究的步骤、手段、程序等，给同行们提供了可“按图索骥”地部分或全面地复制该项研究的必要信息。我们将“可复制性”看作是个描述程度高低的连续性变量，并将它简化为根据以下几个方面的综合考量，即是否：（1）提出并试图回答明确设置的研究问题或试图检验明确提出的假设；（2）明确界定了经验考察对象的总体及其范围（用抽样的技术语汇，即母本）；（3）清晰陈述了从总体中筛选实际观察对象的步骤（即抽样，包括对经验材料来源的确实性和代表性的衡量）；（4）具体呈现了测量或观察的手段和步骤（譬如量表的构成，文本分析中主题提炼的步骤与标准，历史分析中对史料的择选步骤与标准）；（5）具体描述了资料/数据的分析步骤（譬如采取了什么统计方法，如何从史料中鉴别并提炼出可解读的证据，如何分析文本中提炼出的主题的内涵及其关系等）；（6）整体地衡量，给作为读者的我们一个清晰的主观感受，即假设有相应的学术训练，同行是否可以按照论文的陈述复制这项研究，或者至少能展开从理念到步骤和材料等近似的研究。这其中的第六项，可看作是前五项的总和，但它又允许了一个超出机械性总和的整体性（holistic）评估。如果对这6项都采用“1=是，0=否”来编码，那么一篇论文的“可复制程度”可以置于一个0-6的量表上。这样的测量有些粗糙，失去了很多细节，也没有考量各项指标对“可复制程度”强弱不一的影响，但它适合我们归纳大量论文的需求。

我们的编码还包括了其他一些变量：（1）研究方法是否为量化、质化或二者混合的方法，（2）所搜集并分析的经验材料的类型，（3）论文的主要取向（对此，我们也参考了作者的学术背景）是人文学科、社会科学，及其他（如法学、工程等）。我们区分了6类经验材料：问卷调查、实验、田野及/或访谈、史料、文本、混合。这当中“史料”和“文本”之间的区分比较困难，有些史学论文主要采用历史文本作为经验材料（如《新莱茵报》刊载的文章，前人出版的回忆录、史学著作或文献汇编等），还有些则主要考察原始的历史档案，其基本构成并非是大众媒介刊载的文字或图片。对前者，经验材料类型被编码为文本，而后者则被编码为史料。

潘：这个编码表反映了我们对多元研究取向和方法的认知。采用这些测量指标，我们期待采用量化方法的社科型论文可复制程度较高，采用质化方法的社科型论文次之，人文型论文重在阐释，哪怕采用了量化的方法，它们的可复制程度更低。其实，这里的“程度”包括了所谓“复制”的全面或精确程度（Peels，2019；Schöck，2023），我们在这项研究中只能做到这些粗略的区分。

於：为提升编码表的可操作程度、最大限度地减少个人判断的偏误，我们对编码表作了多次调试。在初步制定编码表后，我们分别用它独立地对2个期刊20篇随机抽选的论文展开编码，然后比较两人的编码结果，确认编码不一致之处，并对此展开讨论。在这个基础上，我们进一步修订编码表，提升其可操作程度。然后，我们用修订了的编码表，分别对一个期刊的另10篇论文进行编码，再比较这一轮的编码结果，确认并诊断不一致的编码，并在此基础上进一步修订编码表。到了这个阶段，我们确信，首先，对如何鉴别“经验研究论文”，我们已经达成了两人可一致采用的界定；其次，对于“经验研究论文”的其他需要编码的特征，我们也达成了一致的理解，并实现了可信度很高的编码。据此，我们采用这个编码表，首先筛选出了“经验研究论文”，两人分工对它们展开编码，并在这个过程中，就不确定的编码个案展开讨论，形成一致意见。

潘：需要指出的是，这样的编码需要编码者对不同的研究方法和规范的表达有比较全面的了解，并且要深度阅读论文，所以我们选择了自己编码，而不是把这个环节交给研究经验不足的学生编码员。我们在此详细陈述分析对象的界定、编码的标准、编码的程序，也是为了提高本研究的可复制程度。

於：我们对数据的分析，首先是描述，其次是检测您刚提到的对“可复制性”的几项经验期待。我们从第一项描述开始（详见表1：五大刊经验研究论文数量和基本特征的描述）。我们辨别出354篇经验研究论文，占总体的58.03%。五大刊之间在经验研究论文比重方面有统计上的显著差异，主要因为《现代传播》刊载的经验研究论文在论文总数中不到41%。

聚焦经验研究论文，我们看到：（1）其中101篇（28.5%）为量化研究论文，197篇（55.6%）为质化研究论文，56篇（15.8%）采用了某种混合的方法。论文的类型与发表在哪个期刊之间没有显著关系。（2）就经验研究论文的类型而言，其中83篇（23.4%）采取了人文取向，268篇（75.7%）为社科取向，只有3篇为其他，占0.8%。五大刊之间的比较显示，《新闻与传播研究》发表论文中采取社科取向的百分比低于其他期刊。（3）就可复制程度而言，其中136篇（38.4%）被认定基本可复制。就这个特征而言，五大刊之间没有统计上显著的差异。

这些数据显示，经验研究在2023年五大刊上发表的论文总体当中占比不高。在经验研究论文当中，研究方法和取向比较多元（虽然我们的编码类别较为粗略），但是，总体而言，这些经验研究论文的可复制程度不高。

潘：对这个“可复制程度”的总体判断还要分解来考察。通过表2呈现的数据，我们比较了构成可复制性的各元素在三个研究类型中的分布，从中探究总体可复制程度不高的主要成因。需要说明的是，对于每一个元素，被编码为“否”只代表这个元素在论文中没有得到清晰呈现，并不一定说明它在作者的研究过程中实际缺失。一篇经验研究论文的可复制程度低，也不等于它的选题差、理论建树弱，或者经验结果不确凿，而只是说它报告了太少的必要信息，对我们判断其结果的可信度造成了较大或很大的不确定性。

表2的前五行显示了经验论文对五个基本元素的呈现。结果显示，这三类论文有很大差异：除了明确陈述研究问题、界定研究对象（或对象母本）外，其它三个元素在绝大部分质化研究论文中都缺失，而且有接近41%的质化研究论文没有明确陈述的研究问题。绝大多数量化研究论文和大多数采用混合方法的论文对这些元素都有呈现，但是，这些百分比远低于理想值，即100%。

值得注意的是，不到60%的量化研究论文明确陈述了样本筛选步骤。一些报告实验的论文，仅报告了通过某种方式招募自愿参与者，但对所招募的人是否或者如何适宜作为该实验的参与者没有说明；一些采用问卷调查的论文，也只提及将问卷放置在某平台，收取完成的问卷，没有提供样本构成与母本相比较的数据。在质化研究论文中，清晰呈现这个元素的比例只占四分之一。譬如，在一些史学研究论文中，作者会援引多种材料，有些是文本，有些是史料，但却不说明与被考察现象相关的材料的整体范围，在其中不同类型材料的证据价值如何，对材料又以什么标准展开选择。一些以田野考察或深度访谈为方法的论文，对这部分陈述模糊，譬如，访谈者是“在长期互动中结识的用户”，或者说是“平台工作人员”。

质化研究的论文绝大多数对于观察的手段和步骤、资料分析的步骤等疏于陈述。这个趋势，在很大程度上可归因于人文取向的论文。在人文取向的论文中，这两方面信息缺失的分别为93%和96%；而在社科取向的质化研究论文中，相对应的百分比分别为68%和86%。诚然，人文取向的知识生产有其深远的传统，其中一个社会学的要素是，人文学者强调积累深厚，而达到这个程度的，曾经是一个很小的群体，相互间预设了一个共享的档案库存和查询程序。但是，在参与知识生产开放的今天，以此预设展开学术交流，大约不会有助于对知识宣称的相互查验。

量化研究的论文作为整体，可复制程度也差强人意。在5项基本元素中，平均得到清晰呈现的只有4项。这虽然比质化研究和采用混合方法的论文要高，但是，除了对呈现样本筛选步骤不够重视外，在其他各项中也存在问题。就以报告观察和测量的手段与步骤来说，有近13%的论文没有提供这方面的信息。其中一个表现是，列举变量，但不描述量表，更谈不上衡量其效度，而是将每一个测量指向一篇文献，似乎预设，首先，读者都必须熟悉这些文献；其次，这些英文文献采用的量表具有当然的效度，哪怕跨越了不同文化的边界。

还有一些对数据的观察没有呈现在两个表格中。譬如，几乎所有量化研究的论文都具有社科取向，但在社科取向的论文中，采用量化方法的只占36.9%。在量化研究论文中，45篇（44.6%）分析了问卷调查数据，16篇（15.8%）分析了实验数据，39篇（38.6%）分析了文本数据。后者包括了不少抓取社交媒体平台的内容和用户互动的数字足迹，采用机器学习、主题提炼等方法编码，再分析所得的数据。在质化研究的论文中，77篇（39.1%）采用了线上或线下的“田野考察”或深度访谈的方法，46篇（23.4%）分析了史料，62篇（31.5%）分析了文本，其中包括当作史料用的历史文本，譬如《申报》或《新莱茵报》刊发的文章。

四

走向可相互检验、提升公信力的

新闻与传播研究

於：我们是不是可以总结一下？我们从心理学界爆发的“可复制性危机”谈起，讨论了描述和可复制性，以及两者之间的关系。然后，我们对2023年新闻与传播研究领域的五大刊发表的经验研究论文做了系统的描述。我们可以把这些观察归纳为四点。首先，整体来看，五大刊并非同样地注重刊载经验研究论文。其次，在经验研究中，质化方法仍然占主导；在采用量化方法的研究中，问卷调查和分析文本的计算方法比较普遍。第三，在经验研究中，就论文数量而言，社科取向是人文取向的三倍。显然，新闻传播学虽是人文和社科交织的学科，但是社科的特色更加突出。第四，总体来说，经验研究论文在知识体当中占比不高，可复制程度也不高，包括采用量化研究方法的论文。但是，质化研究的论文可复制程度更低，尤其是人文取向的论文。

我们应该如何进一步解读这些对知识体特征的描述呢？首先，整体的可复制程度不高，除了来自方法论规范和学术传统等问题外，是不是部分也源于我们是按照量化研究的模式设置了编码表？是不是我们的结论有以量化研究为规范模式的学术霸权倾向？也许，量化研究者往往会更加关注我们在编码中所涉及的那些程序和步骤问题，并且关心它们是否得到了清晰的呈现。其次，在我们最后判断被编码的文章是否具有至少部分的可复制性时，不可避免地是对前五项特征陈述和呈现状况的总结。而我们受限于自己的训练，可能对哪些元素能提升人文取向的论文的可复制性缺乏清晰理解。这是不是说，我们所观察的结果其实是验证了一个“共享的常识”，即人文和社科是两类不同路径和风格的知识生产模式，可复制性及其程度只对评价量化的或者社科取向的经验研究有意义，对人文的、质化的研究则不然？

潘：你的这些问题都非常好。如我们前面已经讨论的，在一个经验性的学科，研究者首先要描述作为外部世界之一部分的研究对象，那么，这个描述必须得有其他同行的独立审核。对于隐含在经验观察内的关系、机制和过程的揭示（可能通过假设检验的途径，也可能通过归纳与解读的路径），既然是在对现象的描述基础上，遵循了特定分析方法的程序而展开的，那么，它也应当是经得起独立审核的。原则上说，这个实证主义认识论的原理，无论一个人是坚持现实主义还是建构主义的本体论立场（Anderson & Baym，2004），在量化和质化方法、社科和人文取向中间是通行的。但是，如此前所言，具体的展现和实践的方式可能有不同。考虑到这些不同，我们的编码只试图获取一项研究“如何做”的5个基本信息。我相信，在这几个方面如何根据同行们广泛接受的原则作出决策，如何实施自己的研究计划，如何向同行阐明并论证自己的决策和执行，应当不限于量化研究的领域。

相对而言，人文研究或其他质化研究，研究者依照惯例，或是师承传统，对包括我们编码所试图观察到的过程往往不作清晰交代。在文章中的这些缺失，不等于这些元素在研究的实际操作过程中一定就缺失。我在前面已经揣测，在一个大家都是饱学之士且共享一个治学文化的小圈子里，那些琐碎的程序和步骤，皆为不须浪费笔墨的细节。这种圈子内的约定俗成，在今天需要得到反思：也许它们曾经行之有效且能凝聚群体认同，但它们所必需的预设，今天可能已被消解。更进一步，在知识生产为公众所支持、服务公共利益的今天，公众是其中的利益相关者（stakeholders），专业知识生产者有道义上的责任，开放自己的研究过程以及自己在其中所作的选择。这其中有个直接或间接地接受公众问责的承诺。

确实，人文研究强调研究者的主观介入及其必要性，其中包括个人的体验和感受所汇聚的人与外部世界的互动。对此我也在自己的研究活动中感同身受。但我还是相信，没有一个过程“不可言传”，缺失的可能只是执行起来的困难，即对象化作为研究者的自我，以及这个自我与研究对象之间的关系（Bourdieu，2004：8594）。缺乏对“做研究”的“做”这个过程的描述，那么做出来的研究就让人无法依葫芦画瓢地复制，也很难对之展开实质性的批评。你在前面提到的米德和戈夫曼的两个案例说明，同行们的独立审核是可能的，更是必要的。学术共同体的建设，各种形式的同行评审，包括匿名评审和学术成果考量等等，至少理论上说，都以可复制性作为其基本的假设和实践的原则。

同时，就如我们强调的，这里的可复制性并不是简单的“是”与“否”的二元判断，而是一个程度性的判断，包括了部分的或者是理念层面的（partial or conceptual）可复制性（Peels，2019）。它的实现方式和程序，在不同方法和取向的研究中也应当是不同的。

於：我们以“开放科学”作为切入点，再到对描述和可复制性的讨论，以及涉及到“开放人文”的讨论，我的理解是，都是要将“学术规范化”落到具体的操作层面上，提升操作过程的透明度。您其实是在说，研究的操作要有章可循，而且要做得中规中矩。之前，您（潘忠党，2014）也曾说过，论文写作是与同行展开交流，要遵循“学术八股”背后的认识论和交往逻辑。我们是在这两个基本点上，讨论在我们学科的知识生产中，描述为什么是一条基本的途径，可复制性为什么应成为一个基本的规范性要求。

或许，有学者不大赞同这些观点。要求研究的操作和写作规范化，是否有些舍本逐末？是否会提倡那些“琐碎的”经验研究？我又要回到“理论创新”的话题了。缺乏理论的创新，再规范的经验研究，再细致的描述，也只能令人读后味同嚼蜡，如刘瑜（2010：185）所概括的，是“精致的平庸”。更进一步，您也说了，新闻传播学是人文与社科交织的学科，甚至可以说，我们这些以大学本科人文专业为底色的人，给这个学科带来了人文的气息和关怀。这不是学科“自恋”（陈力丹，张月，2023）的表达，而是说，如同其他人文和社科领域，新闻传播学关心的不仅是客观世界的规律，更是人们建构和共享意义这个主体性介入和生成的过程。强调“可复制性”是否在以科学作为认知的唯一模式？是否意味着以之取代人文的获知途径？是不是在倡导“科学主义”呢？

潘：非常犀利！好问题啊！关于“理论创新”、可复制性是否与人文学科相关，以及如何相关，我就不重复了。我来谈谈“科学主义”、“平庸”和“内卷”这组问题。对我们思考这些问题有很大启发的是李金铨教授（2004）的一篇文章。不过，他大致持平周到的论述，常被人引用来以批判美国“主流传播学”，反对“实证主义”的琐碎。被忽略的，是他对“论多证少”“只论不证”的批评。

确实，新闻传播学界不时会听到一些反科学的声音。有学者宣称，我们不能囚禁于自然科学的方法和逻辑，因为社会科学和人文学科是不同的，我们的研究对象是有主体意识的人，是有“主体性”的人所展开的行动，以他/她们的行动所推动以及构成的社会过程，它有文化、政治、经济等多个方面，包括它们的相互交织。这些观点我感觉在一般层面上看没什么问题，但以这样的泛泛之谈为逻辑起点，有些人会得出令人惊讶的结论，譬如新闻传播学被“科学模式”带歪了，经验真实不存在，真相只是话语的建构，等等。

核心的问题在于，我们究竟如何理解“科学的方法和逻辑”？当然，作为“人学”的一个分支（这个名号有待进一步讨论，但为与“自然学”相区分，姑且用之），新闻传播学不可能追求以粒子物理学运用的超导超级对撞机为工具、以控制粒子高速碰撞为实验干预等方法，来回答本学科的问题，想来也没有人会倡导用天体物理学运用的詹姆斯·韦伯太空望远镜来观察人们交往所生成的电磁波或光波。从这个角度讲，显然，新闻传播学没有也不应（也似乎没有人）追求以科学的方法和逻辑展开知识生产。但是，作为人类获知的取向之一（不是唯一！）的科学，却不是由任何具体方法、手段和步骤所界定的，它是一套相互关联的认识论原则（epistemological principles）以及体现它们的操作程序，它主要包括如下几点：

第一，经验的，同时也是逻辑的。这也许是某些人理解的逻辑的经验主义（甚至是“实证主义”）。它的基本内容是，科学生产的是对外在世界的描述型知识，它同时需要满足两个要求，一是知识宣称结构内部的逻辑一致，二是与来自多个独立渠道的经验观察相匹配。也就是说，它逻辑地连接理论的抽象和经验的观察。

第二，系统的，同时也是客观的。一提“客观的”，有些同事就会敏感了，这怎么可能？客观性只是一种话语的策略、权力的表演！其实不然，所谓客观的，是指对外在世界存在（无论它是外在于人的自然规律，还是人们通过自己的实践建构的社会现实）的基本尊重，以一种公开、透明、可被审视、检测、批判、矫正的方式展开的观察、解读和分析；所谓系统的，就是有清晰可循的步骤。这两者结合起来，就是对研究结果报告的可复制性特征应有的期待，并将此作为知识生产中的一个认知规范原则。若摆脱了这一点，那就等于说，有些人，由于某种神秘的原因，具有掌握真知的秘诀，这是不可学的、不可探究的，也是不可置疑的。若如此，我们就走向了认知神秘主义，也就瓦解了经验知识的社会化生产和分享的基础。

第三，累积的和相互矫正的。这其实是对第二条特征的一个时空扩大了的重新阐述，它说的是，科学研究是公开的、服务公众的探索（public inquiry），它必须透明，对同行在公开的场合（譬如学术期刊、学术研讨会）开放，也对公众开放（通过科学素养教育、各种形态的科学传播等），只有如此，才有可能将复制某项研究或其成果作为科学获知路径中的必要组成部分，才有可能以相互间的三角印证，排除个人、团体、具体场景（如某实验室或惯用的方法）所带来的观察和解读的偏误。相互纠错、纠偏是科学知识实现其所谓“客观性”特征的必要途径，而以之作为认知规范和知识生产的制度之一，是对“客观性”原则的操作化。

由此构成的，是科学的求知途径，它容纳了不同学科体现其特定研究对象的特征而创造的相应方法与程序（包括测量手段和工具，以及分析的方法和技术）。社会科学作为科学，不是必须采用自然科学的具体方法、工具和手段，而是采纳上述几条与自然科学共享的认识论原则并落实于研究操作当中。我不认为这些科学的认知原则，因为人文社科的研究对象不同而不适用；我同样不认为任何学者会傲慢地宣称自己的获知之路独一无二，毋需他/她人审核。我认为，以“社会科学”或“人文学科”独特性、时空场景独特性为基点，反对科学的求知路径是不可取的。至于有人以“我反对科学主义”自辨，我感觉只是在用一个貌似深奥的标签贬损（gaslight）质疑者。很多情况下，如此宣称的人对何为“科学主义”的理解模糊、指称游移，因此其批判有些盲目射杀，经不起细究（Hietanen et al.，2020）。

所谓“平庸”，在身为知识精英的学者们眼里，显然是个负面词。但是，既为学者，我们就得多问一句：“何谓平庸？”在学术评价的语境中，它可能是指没有亮点、缺乏新意、缺乏创新、立意不高、视野狭窄、理论抽象层次低、平淡无奇等。与这些状态相对，我们追崇理论创新、范式革命，至少是作出某种“转向”，等等。还有就是追求新技术、新工具，以之生产和分析新型数据。但是，探求经验知识，借用英语里常见的比喻，是个香肠制作的过程，并不光鲜亮丽；它更是一个细致活儿，其中的微小失误，就可能产生误导的结果。所谓“失之毫厘，谬以千里”并非耸人听闻之说。众多貌似“平庸”的学者，在从事一些平凡无奇的活动，以精益求精的过程观察现象、分析数据、写出报告，这是科学求知的常态。正是这种常态，才使得令我们眩目的库恩式“范式革命”有可能偶尔发生，并且是在坚实的经验数据的基础上。

我这不是在反对“创新”作为一个学术评判的标准，我同样反感那些用一堆复杂模型论证一句废话的论文（咱们在编码过程中遇到一些）。我要说的是，第一，精致不导致平庸，它们之间没有逻辑相关；第二，如果“平庸”意为平凡和常态，为知识生产中的点滴进步，那么，它在学术知识生产中不可被看轻，它为知识积累所必需；第三，缺乏具体指向的、压倒一切的“创新”、“革命”和“转向”，都是在想象可以不断出现的海市蜃楼，在特定场景下，这种知识生产的话语，生成的可能不是可验证的知识，而是“创新疲惫”，是名利场；第四，精致的平庸，“总好过粗糙的平庸”（刘瑜，2010：185），更好过假大空。

至于“内卷”这个词，现在非常流行，早已出了学术圈，进入了通俗文化。当年李金铨教授（2004）用这个词来批评他眼中的美国传播学领域，说其内部分工精细，相互恶性竞争，但缺乏开阔的视野和知识的创新力。也就是说，在有限的家园里竞争谁更“精致地平庸”。但细读其全文，似乎他批评的不是美国传播学的全部，也未必是它的“主流”（李金铨，2004：11），而是这个领域的某些生态特征。我要说的是，这个概念，要在知识生产社会学的意义上来使用，那还需要更清晰的阐释，将其操作化，搭建连接知识生产过程的经验世界的桥梁。

於：您说的我基本都能接受，当然，我内心还是有些存疑。我想，其他/她同行们可能也是如此。这样的疑虑，或者不同的观点，应当是很正常的。我也希望我们这次对谈，能够引发同行们的讨论，在期刊和学术会议这样的学术共同体的“公共空间”展开。这样的讨论，会十分有助于学术规范的进一步完善。

我能完全接受的是，学术研究需要接受同行们的相互检验，以提升一个学科以及学术本身的公信力。以此为目标，我们从对2023年五大刊刊载的经验论文的分析中，也许可以提出一些实际运作中可行的建议。

我觉得作为研究者和论文作者，我们得有操作和写作两方面的规范意识，至少把我们编码包括的5项基本要素在论文中呈现出来，它们是：（1）明确界定研究对象，也就是经验现象，包括其涵盖范围；（2）明确陈述针对这一现象所提出的研究问题，或从用以解释这一现象的理论推导出的假设；（3）清晰陈述从该现象涵盖范围内筛选数据或经验观察的载体（样本）的过程；（4）清晰陈述如何与筛选出的这些载体（样本）接触，采取哪些手段和工具展开并记录观察或测量；（5）清晰描述对所得的观察的分析步骤，并提供采用这些步骤的根据。

我还觉得，期刊编辑和匿名评审专家是重要的学术规范的把关者。也许，期刊可以提出要求？譬如，要求每篇投稿以适合自己领域和方法论特色的方式，提供这5个方面的信息。当然，一项研究的具体操作过程，所采用的原始资料和工具，展开分析的中间过程等，可能非常繁复，完全呈现在有限的期刊版面上，是不太可能的。因此，也许期刊可提供网上空间或链接，让作者可以将操作过程、所用材料、资料来源以及对之的评估等内容，以线上附录的形式公开。其次，也许期刊可建议甚至要求评审，将一项研究的操作和写作分解为它的构成元素，包括这5个方面，对它们一一作出点评，提出建设性意见，并在此基础上，提出接受、拒稿、修改后再投等整体意见。

潘：好建议！应当都是切实可行的，希望能引起学界的关注并转换成为行动。另外再补充一点：对论文评审人的期待，应当也是对我们每个人作为导师和答辩委员会成员的要求。这些具体建议，以及在此展开的探讨，都体现了“开放学术”的理念。它的指向是提升新闻传播学科领域的知识生产、学术共同体的建设，以及与之相应的社会认可度和公信力。

本文参考文献从略，原文刊载于《国际新闻界》2024年第8期。

本期执编/赵冉

订阅信息

全国各地邮局均可订阅《国际新闻界》，国内邮发代号：82-849，欢迎您订阅！

您也可通过下方二维码或网址https://mall.11185.cn/h5/#/bkGoodsDetails?spuId=113613&from=imgShare&dsId=zxSWChat&dsModule=c3df4964-af5d-40a8-d6cc-a768b5306e52 ，进入中国邮政微商城订阅本刊。

您还可访问《国际新闻界》官方网站 http://cjjc.ruc.edu.cn/ ，免费获取往期pdf版本。

点击↓阅读原文

进入官网下载原文