春节前后,中国“80后”梁文锋旗下的产品DeepSeek成为网络焦点。他主导的这款带着蓝色小鲸鱼图标的AI应用,在1月超越了ChatGPT,下载量登顶美国区等全球多个苹果应用商城的榜首。
稍早前,中国人的社区REDnote(小红书)迎来了不少TikTok用户。全球网友在这个以中文为主的社交APP上互动,就不同国度里的工作、生活、医疗等一一“对账”。
像爱丽丝梦游记里一样,挖开兔子洞以后,人们惊喜地发现,世界可以如此平静与美好。“如果真的有不可抗力的因素导致我们的联络再次断开,我们也一定要记住此刻对彼此的爱与信任。”一个中英双语的小红书帖子获得高赞。
2025年,来自中国的“神秘力量”陆续在全球涌现。背后是中国算法的一路高歌。算法(Algorithm),这个最早由波斯数学家的名字衍生的词,指解决(数学)问题的一种抽象方法。在计算机领域,有了算法,计算机才可以自动执行大量指令,进行大量计算,精准推荐,涌现智能。
人们想知道,中国应用势如破竹背后,究竟有什么样的算法以及发展路径?
1940年代,费城,美国。
在美国宾夕法尼亚大学摩尔学院地下室,一排排从地板延伸到天花板的柜子里,装载着约17468个电子管。它们看上去毫无章法,由散落四处的电缆连接。实际上,一场史无前例的军事计算正在进行。
1年后,1946年,全世界第一台计算机、重达30吨的ENIAC第一次在公众面前亮相。为了让在场的记者了解其速率,现场主灯被关掉了。闪烁着亮光的计算机,用20秒算出了炮弹飞到目标地的轨迹,这比炮弹飞行速度还快。
1946年,美国费城,宾夕法尼亚大学,第一台电子计算机“Eniac”/图源:视觉中国
相比之下,人工计算弹道轨迹,得耗时3天。
这是人类第一次了解计算机算法的威力。当时的媒体感叹称:“‘电子大脑’在2小时内,计算完本需要100年才能算完的问题。”但这个创世纪的发明由美国人发明、美国人主导,主宰了接下来半个世纪的全球硬科技。而大洋彼岸的中国,直至1958年,才根据苏联提供的M-3小型机技术资料,制造出第一台国产计算机——103机。
了解这样的起点,也许就能理解外国友人、科技从业者,为什么对如今中国应用火遍全球充满着不解。“中国人已经找到了吸引人类注意力的最佳计算机算法,这是我们应该好好学习的。”美国科技人士在社交媒体上感叹。
中美互联网巨头正式争夺全球注意力,始于21世纪的第二个十年。2012年春,福建宁德人、连续创业者张一鸣在北京知春路的咖啡厅,在几张餐巾纸上写下了他的畅想。凭借纸上的移动互联网蓝图,他获得了投资人的青睐,给予其200万的启动资金。
谁也不曾预料到,一个由中国定义的“算法”悄然诞生。
在这张“餐巾纸”上,张一鸣提出,要解决人们在移动互联网上获取信息的痛点—不够高效。传统门户网站即使再快,输出的内容依然是中心化的,无法高效地满足每一个用户的需求。
而他希望,用户一打开手机,就能获得个性化的、独属于自己的内容。事实上,这个想法并不算新颖,早在2006年许,扎克伯格就在脸书推出了信息流(NewsFeed)功能。他们根据用户的喜好在主页推荐和排序内容,已经初获成效。
但张一鸣却是将个性化信息推荐发挥到极致的人。有人用16字总结字节跳动起家的秘诀,“遍地撒网,确定爆款,获取流量,集聚平台”。围绕着推荐算法,字节跳动早期推出了数十个手机APP,看起来有所联系,却又各自不同。它们以各种渠道,大量出现在潜在用户的面前。
经过一番“田忌赛马”后,2012年暑假,张一鸣把发展重心放在了新闻资讯上——这促成了“今日头条”的迅速崛起。
接下来的故事大多数人都有印象,今日头条在2016年日活量达到了惊人的6000万,成功超越四大门户网站。抖音也在这一年问世,接着势不可挡地成为中国短视频巨头。
从这时开始,全球的互联网从业者都意识到,由今日头条开创的推荐算法,正在改变世界。曾任Uber和Netflix产品负责人的尼尔·亨特在论文中提到,算法推荐系统让Netflix每年省下超过10亿美元的费用。80%的奈飞用户都会在“推荐列表”里观看视频。
张一鸣的推荐算法,区别于很多先前算法,满足了用户自己都不清楚的需求。
过去,以微博、脸书、微信为代表的社交媒体,主要依赖熟人网络以及考验忠诚度的订阅模式。但今日头条和抖音开创的推荐算法时代,建立在预测用户需求的前提上。在这类APP上,互关的好友不再是用户停留的重点,算法的“为你推荐”才是留住用户的关键。
今日头条资深算法架构师曹欢欢,曾公布其算法原理。所谓的推荐系统,形象地说,“实际上是拟合一个用户对内容满意度的函数”。本质上,现在的算法和1940年代的超大计算机没什么不同,都是为了解决一个数学函数的问题而生。
但今日头条的“函数”显然复杂、庞大得多。曹欢欢介绍:“这个函数需要输入三个维度的变量。第一个维度是内容。第二个维度是用户特征,包括用户的兴趣标签,职业、年龄、性别,以及各类模型发掘的隐式用户兴趣等。”
第三个维度是环境。“这是移动互联网时代推荐的特点,用户随时随地移动,在工作场合、通勤、旅游等不同场景,信息偏好有所偏移。”
结合三方面的维度,模型会给出一个预估,即用户对哪类内容可能感兴趣。与此同时,算法系统还会实时处理样本数据,包括用户点击、展现、收藏、分享等动作,来实现对用户的精准推荐。
“推荐系统比你妈更了解你。”种种因素背后,各个推荐算法都在追求同一个目标:帮用户发现自己都未察觉的感兴趣内容,让他们的注意力留得越久越好。
1950年代,达特茅斯,美国。
有了算法的计算机毋庸置疑地精通数学与计算,但人类早已不满足于此。上世纪50年代,人工智能(AI)的概念由美国数学教授麦肯锡在达特茅斯会议上率先提出。意思是,万能的计算机,也许可以拥有像人一样的智能。
至于什么是智能,多年来学术界纷争不断。人工智能先驱艾伦·图灵的说法很有代表性。他说:“最初的那个问题——机器会思考吗?我认为它太没意义了。”对于图灵来说,如果机器的行为与人类已经无法进行区分,无论机器是否像人般思考,我们已经可以得出结论——机器能思考。
21世纪以后,有了算法的加持,拥有学习能力的计算机早已通过了“图灵测试”。在自动驾驶、人脸识别、蛋白质结构预测、药物设计等领域,AI经常拥有比人类更高一筹的能力与效率。
首先掀起第四次AI革命的,是大洋另一头的科学家。2012年,加拿大籍教授杰弗里·辛顿(2024年诺贝尔物理学奖得主)和学生伊利亚(Ilya Sutskever,前OpenAI首席科学家)和亚历克斯(Alex Krizhevsky)组成团队,设计了名为“AlexNet”的卷积深度网络程序。他们设计的AI系统,以最低的误差,在华裔科学家李飞飞举办的ImageNet图像识别竞赛中夺冠。
三人身价随即水涨船高,导师辛顿收到了来自百度、谷歌、微软以及DeepMind等巨头的橄榄枝。最重要的是,他们在短短几年时间,打败了主宰过去半个世纪的模式识别研究,在全球掀起了深度学习的海啸。
彼时,中国的移动互联网正在兴起,中国进入4G时代。2013年,中国搜索引擎巨头百度想挖辛顿无果,于是率先在国内建立了深度学习研究院和自动驾驶研究院。
两个研究院为中国业界培养了大批AI人才。
后者更被外界称为,中国自动驾驶界的“黄埔军校”。
百度2013年开始布局自动驾驶/图源:百度Apollo官网
主导百度参与辛顿竞拍的负责人、现自动驾驶企业“地平线”的创始人余凯回忆:“尽管(百度)竞拍(辛顿)失败,但我还是很开心的。我想我的目的也达到了,因为李彦宏亲眼见证了国际巨头不惜花费巨资来投资深度学习研发,这让他下定决心自己把深度学习做起来。”
4年后,阿里巴巴创始人马云也宣布成立科学研究机构“达摩院”,立下目标——“三年投入1000亿元”,用于机器学习、自然语言处理等多个前沿AI领域。同一时期,字节跳动人工智能实验室、腾讯AI Lab等相继成立。
这些不缺资金的互联网巨头,拥有海量数据以及国际化视野与人才团队,同时有搜索、语音、电商等数字化业务与数据,拥抱深度学习算法成为了必然。以BAT等互联网大厂为首的大笔投入,加上各类高等院校的科研研究,合力推动了中国AI这些年的飞速发展。
只是,相比于起步很早、资金和资源高度充裕的美国硅谷,中国发展AI始终面临内部资源有限和外部环境恶劣的困局。所谓的深度学习,是受到人脑神经系统的启发,通过算法建立更深层次的网络,让机器拥有学习的能力。这依赖大量的数据进行预训练,也非常考验计算硬件并行计算的算力。
但在2022年10月,美国政府首次实施了先进半导体向中国出口的限制措施,禁止英伟达向中国出售A100和H100等高性能AI芯片。
2025年1月13日,美国商务部发布新规,将AI芯片出口限制范围从中国扩展至全球。在这份霸道的、高傲的禁售榜单中,中国被其列为高风险国家,无法通过任何正式渠道进口英伟达AI芯片。
从元器件、光刻机到AI芯片,来自全球霸主的封锁措施已经全面升级。但此时,美国也许也没预料到,中国的科技团队和工程师,正以无法量化的努力,用精妙的算法与工程设计,实现了后来者的超越。
杭州,中国。
2025年1月20日,正值特朗普就职典礼前后,成立2年多的中国AI公司DeepSeek(深度求索)引发了中美科技圈人士的持续讨论。这个坚持开源、背后是一家量化金融公司的AI小厂,在1月20日发布了推理大模型DeepSeek-R1。
Appfigures的数据显示,DeepSeek在1月26日升至苹果美国区应用商店的榜首,此后在全球140个地区名列前茅。在发布后的18天内,其全球下载量达到1600万次,几乎是ChatGPT发布18天时的两倍。
令众人惊叹的,不止是中国AI超绝的效果,而是DeepSeek以不可思议的低成本拥有了世界顶尖水平的智能。根据创始团队的披露,训练DeepSeek-R1背后的大模型——DeepSeek-V3,共计耗费557.6万美元,涉及2048张H100的GPU集群。有专业人员指出,同等水平之下,世界AI大厂至少要用1.6万张以上的GPU并行训练。
DeepSeek以不可思议的低成本拥有了世界顶尖水平的人工智能/图源:Unsplash
1月20日,同样年轻的北京AI公司“月之暗面”,发布了Kimi k1.5多模态思考模型。该模型在数学、编程和通用推理领域,赶超OpenAI新发布的o1,还能处理文本和视觉等多模态数据,支持跨模态推理任务。这一新模型的发布,再度让中国年轻AI公司惊艳世界。
AI圈此前的生态,是完全由美国人定义的。近年流行的AI大模型,首先是由8位谷歌工程师提出Transformer架构引发的创新;2022年OpenAI发布的ChatGPT,向世人证明AI模型大的重要性——参数越大,计算机处理复杂问题的能力越好,越可能涌现智能。
而要想在AI圈不可战胜,OpenAI首先背靠微软,拥有无尽的云计算资源。他们也很早便是英伟达的合作伙伴,训练AI的芯片和算力因此源源不断。先发优势一旦形成,与之合作的公司也纷至沓来,形成了美国主导的全球AI信仰。
面对各方领先的对手,中国公司只能另辟蹊径。以DeepSeek为例,无论是其坚持的技术理想,还是“多token预测”(Multi-Token Prediction, MTP)、混合专家模型(MoE)架构的创新,都在穷尽各种方式,证明此前美国人定义的AI也可能是低效的。大模型不一定要比大、比量,还有更多来自算法、工程上的优化与创新,从而以小成本实现大理想。
中国AI应用的出圈说明,相比于巨无霸式的投资,看不见的算法和工程,也可以起重要作用。美国AI知名学者吴恩达发文感慨:“2022年11月推出ChatGPT时,美国在生成式AI方面远远领先于中国。我一直听到美国和中国的朋友都说,他们认为中国落后了。但实际上,这种差距在过去两年里迅速缩小了。”
至于为什么是中国公司取得了这一进步,硅谷AI公司Perplexity的CEO斯里尼瓦斯提供了一个较符合现状的解释。他说:“需求是发明之母。因为DeepSeek必须找到解决办法,最终他们创造出了更高效的技术。”
始终在夹缝中突围的中国科技公司,正是从中国14亿用户的市场中孕育出生命力和创新力。要想在竞争高度激烈的市场中存活,中国公司学会了将需求放在第一位,尤其擅长从恶劣的外部环境以及激烈的竞争中,做出最接地气的、满足市场需求的产品。
而共享着相同文化和语言的十多亿中国用户,深度参与着中国互联网与智能化的进展。
他们将个性化数据给了互联网巨头,在丰富的应用场景中对算法和产品积极反馈,使得中国算法在反复迭代和优化中,实现了在世界的领先。
在迈向中国特色社会主义现代化的进程中,我国长期被认为擅长从1到多的创新。但2025年,中国公司以算法和卓越产品告诉世界,勤奋的中国人不仅擅长模仿、学习、超越,也乐于做从0到1的创新。
中国人不缺理想,更不缺从0到1的耐心。这是2025年让人欣喜的开端。
文中配图部分来源于视觉中国,部分来源于网络
本文首发于《南风窗》杂志2025第4期
欢迎购买南风窗2025年第4期
《国联民生证券:产业投行新力量》
👇