专栏名称: 知识分子
《知识分子》是由饶毅、鲁白、谢宇三位学者创办的移动新媒体平台,致力于关注科学、人文、思想。我们将兼容并包,时刻为渴望知识、独立思考的人努力,共享人类知识、共析现代思想、共建智趣中国。欢迎关注。
目录
相关文章推荐
环球科学  ·  NASA等了11年的观测,被一根破裂的水管逼停了 ·  19 小时前  
科学世界  ·  城市和乡村,哪里鸟类更多? ·  3 天前  
51好读  ›  专栏  ›  知识分子

为什么deepseek没有诞生在顶尖科研机构和大公司?

知识分子  · 公众号  · 科学  · 2025-02-28 08:27

正文

2.28 ‍‍‍‍‍‍‍‍
知识分子
The Intellectual

图源:pixabay


撰文 | 王立铭



DeepSeek的诞生,也许标志着人工智能的“爱迪生时刻”已经到来。尽管法拉第早在1831年就发现了电磁感应现象,为发电机和电动机的出现提供了理论基础,但直到半个世纪后爱迪生发明了耐用便宜的电灯并建立了稳定输出电能的珍珠街电站,人类世界才整体性的进入了电气时代。DeepSeek的独特技术方案,可能标志着人工智能真正具备了走进千家万户、改变各行各业的能力。


而我想在这里讨论的问题是,为什么DeepSeek没有诞生在为大语言模型投入数百亿元的互联网大厂和“AI六小虎”,也没有诞生在承担大量人工智能国家级课题的大学和研究院,却诞生在深度求索这家规模不大、此前在决策者和公众视野中默默无闻的小公司——尽管前者掌握的资源要远多于后者?


也许,我们可以从现代科学技术的组织制度中可以找到几条明确的线索。


互联网大厂和传统科研机构的性质和定位差异甚大,但其组织特点却高度相似,都是马克思·韦伯笔下的“科层制”组织。这类组织有两个明确的特点: 第一,组织模式上,有明确的权威、上下层级和专业分工;第二,工作流程上,有明确的规则、流程和绩效考核方式。


正是依靠这两个特点,科层制组织能够将成千上万人组织起来,高效实现特定的目标。从古代的水利工程到现代的高铁5G,从载人航天到人类基因组计划,科层制组织都证明了巨大的威力和价值。在人工智能领域同样如此:尽管大语言模型最早并非诞生于中国,但在科层制组织的驱动下,中国机构在大语言模型的开发方面取得了惊人的进展。早在DeepSeek诞生前,全球各大榜单中都能找到中国大模型的身影,例如通义千问,豆包、Kimi,智谱清言等等。


但需要注意的是,科层制组织想要发挥威力也有两个明确的前提: 目标清晰,实现路径明确——换句话说,项目目标是“工程化”的。 因为只有目标和路径确定的时候,科层制组织才能将目标沿路径进行拆分和细化,最终落实到组织内部每一层级,才能将目标和路径落实到每一个组织成员的绩效考核。


同样需要注意的是,科层制组织显然无法用于创造从0到1的源头创新。 因为源头创新从本质上就是无法事先定义目标,更无法事先规划路径的。庞大的人类基因组计划固然可以层层分拆,但这一切的前提是Watson和Crick在1953年首先理解基因的分子本质;国产大模型固然可以层出不穷,但没有卷积神经网络、Transformer和Llama的铺垫,国产大模型们围绕规模和性价比的激烈竞争根本无从谈起。


更有甚者,科层制组织不光无法主动孕育源头创新,实际上还会 (有意无意的) 破坏源头创新。 因为源头创新究其本质就是无法准确预测的、随机的、甚至是不务正业的。它的出现需要天马行空的探索,需要对事物本源的狂热追求,需要个性,需要灵光一闪。科层制组织的层级制度、严格分工和绩效考核,做的越是严格和彻底,就越是没有源头创新的机会和土壤——后者会被组织认定为是无效的、浪费的、破坏性的。在ChatGPT成功后,OpenAI公司的成员写出了《为什么伟大不能被计划》。恰如书名所提示的那样,OpenAI的一系列源头创新,究其来源都是意外、热情、大胆设想,勇于试错的产物。


打个比方,科层制组织就像是现代工业,只要目标明确、路径清晰,它就可以通过严密的分工和考核制度全力推进,无坚不摧。但孕育真正的源头创新,却需要传统的农业,一把种子撒下去,我们能做的只有浇水施肥,耐心等待。


说到这里,让我们重新回到中国科研制度的讨论上来。


从某种程度上说,尽管人们谈及科研都会提到“兴趣导向”“自由探索”之类的词汇,但全球的现代科研活动都是科层制组织的领导下进行的。这本身不足为奇。一方面,现代科研活动的主要支持者是政府 (也就是老百姓的纳税) ,理所应当有严格的组织模式和工作流程以应对纳税人和监管者的审查;另一方面,现代科研活动经常需要组织大量科研人员进行长期的团队攻关,明确的分工和绩效管理也无可避免。


而真正的问题在于, 在这种严密的组织模式势在必行的背景下,我们是否为真正的源头创新留出了足够的 弹性空间?


这方面的成功案例也有不少。谷歌独特的20%时间政策允许员工投入20%的工作时间进行自由探索,为他们带来了诸如Gmail和AdSense这样的重要创新。贝尔实验室固然是个庞大的传统科研机构,但允许自由探索的文化也孕育了诸如晶体管这样的伟大发明。


但熟悉国内科研体制的人可能立刻会意识到,这种空间即便不是完全消失,也是非常逼仄和零散的。


在组织模式上,我们的科研人员有着极其复杂的分工和层级。作为金字塔顶端的院士们基本彻底脱离了研究一线,但却掌握着巨额的研究资源分配权利。而刚刚入行的科研人员,又被困在研究生-博士后-青年教师-教授-四青人才-杰青/长江等高级“帽子”构成的复杂链条中。相比到底关注哪些重要的科学和技术问题,研究人员们更关心的往往是链条上更高级别的头衔如何获取。


在工作流程上,复杂动态的科研活动同样被纵横切割成稀碎的片段。每一笔经费的计划和实际报销;每一项研究课题的申报、开题、年度总结和结题汇报;科研发现被量化为研究论文的影响因子和引用次数;教育创新被量化为课时数量和教学奖励。相比到底准备怎样解决一个重要的科学和技术问题,研究人员们的时间和精力被大量消耗在满足各种各样复杂量化的过程性绩效考核指标中。


公平的说,这样的问题并不是仅仅出现在中国。以美国为例, mRNA疫苗的发明者Katalin Kariko长期得不到经费支持和永久教职,有史以来最为成功的抗癌药物Keytruda被长期冷落在大公司的角落。同样公平的说,我们也必须承认,即便有着这样那样的限制,原始创新仍然持续诞生在中华大地上。我无需一一例举,关注科技新闻的读者们自然能如数家珍。


但我更想追问的是,我们的科研制度能否再松松绑,让同样的资源投入,能更高效的用于原始创新的孕育中?


比如,科研共同体内部,复杂的分工和层级是不是真的无法避免? 每年到了科研项目申报和评审的季节,我们都会看到大量的资源和精力被投入到无谓的混圈子、打招呼、套近乎上。是不是取消了帽子,取消了一层层晋级的阶梯,我们就没有能力评估科研人员的工作了?当然不是!来自同行的评价是最能直击本质的。在DeepSeek诞生后,OpenAI的CEO公开承认“我们站在了历史的错误一方”;而微软和亚马逊的云计算服务快速部署和开放了DeepSeek的模型入口——来自同行的反馈,就是对DeepSeek能力的直接认可。难道说,基金评审机构不给个帽子头衔,好的科技成果就会被埋没和无视么?


再比如,当目标和路径明确的时候,“有组织的科研”当然能体现效率和规模的威力。人类基因组计划就是很好的证明:当基因的分子本质已经揭示、基因测序技术已经成熟时,组织全世界的科学家和科研组织集团攻关是合理的选择。但面对大量目标仍然无法定义、路径仍然晦暗不明的重要问题——例如如何攻克癌症和衰老,如何理解人脑的工作原理,怎样用AI技术预测复杂生命活动等等—— 我们是否应该放下对效率和规模的执念,让对这些问题有巨大热情的科学家们,遵从自己的灵感,去做有巨大可能失败的探索?


总结和几个具体建议:


· 科层制组织只适合管理目标清晰、实现路径明确的工程化项目,不适用于充满不确定性的源头科学技术研究


· DeepSeek这样的源头创新项目,难以诞生在科层制组织中,不管是互联网大厂还是传统科研机构。


· 源头科学技术研究从本质上就难以通过定点支持的方式制造,但却可以通过广泛支持的方式孵育;源头创新需要农业视角,而非工业视角。


· 现代科研制度逐渐走向科层制难以避免,但要害在于还留出了多少给源头创新的伸展空间。


· 国内的科研管理制度在科层制下走得太远太深,需要强有力的扭转。在需要源头创新的领域,大面积取消帽子,取消大多数量化考核指标,减少有组织科研的覆盖范围,可能是必须的。


亲爱的读者们,不 星标《知识分子》公众号 ,会错过每日科学新知! 星标《知识分子》 ,紧跟前沿科学,一起探索科学的奥秘吧!

请戳上图卡片添加星标







请到「今天看啥」查看全文