专栏名称: GGV纪源资本
不止是VC。
目录
相关文章推荐
温度新闻  ·  李准基涉嫌逃税,被追缴9亿韩元! ·  2 天前  
温度新闻  ·  李准基涉嫌逃税,被追缴9亿韩元! ·  2 天前  
51好读  ›  专栏  ›  GGV纪源资本

2025人工智能十大变局:新一波工业革命的“曙光”在哪里?|亮马桥小纪严选

GGV纪源资本  · 公众号  ·  · 2025-01-23 10:30

正文




小纪有话说:


历史上每一次工业革命中,天才发明工具,大众使用工具,带来社会生产力全面提升,新生产供给打开了更大规模的社会商品需求。基于科学知识的大量发明,孕育了工业革命的“工具潮”,并最终带来了以蒸汽机为代表的通用技术革命。人工智能既是科学革命、技术革命,更是产业革命。

在2022年ChatGPT问世以来,生成式AI工具大量扑面而来,而底层人工智能算法架构、芯片技术仍在高速发展,叠加新能源、卫星通讯、机器人、量子计算等技术群落效应,人类社会“忽如一夜春风来,千树万树梨花开”,全民的希望、焦虑、迷茫、欲望都集中在滚滚向前、势不可挡的科技变革巨轮上。

2025年开年,我们站在科技与文化的交叉路口,一起掀开未来人类文明巨变大幕的一角,探索新一波工业革命的“曙光”。我们将从AI产业增长潜力、关键技术突破、全球竞争格局等方面,观察及总结AI的发展,预测AI领域未来的关键变量,并在每个部分的结尾,推荐可供读者深入阅读和思考的书籍。
文章来源:腾讯科技 公众号
特约作者:快思慢想研究院院长 田丰

编辑:郭晓静

硬科技为王,
全球AI产值5年4倍增长


首先,从人工智能产业的增长潜力来看,可以说人工智能的“雪道”又长又厚。按照约瑟夫·熊彼特(Joseph Schumpeter)的“长波创新周期”来分析,从1785年至今的6波科技革新浪潮,创新周期从60年持续逐步缩短到25年,最近以人工智能、物联网、机器人和无人机、清洁(能源)技术为代表的新一波科技浪潮,起步于2020年,新质生产力蓬勃发展到2045年。

全球进入新一轮硬科技创新周期,“应用为王”让位于“硬科技为王”。截至2024年12月底,商业航天公司 SpaceX 估值跃升至3500亿美元,超过3000亿美元估值的视频平台字节跳动,赢得全球独角兽排行榜第一,而第三名OpenAI估值达1570亿美元,也是最近两年估值飞速增长的AI独角兽。

人工智能尚处于商业爆发前期。据Statista数据分析,未来5年,人工智能对全球GDP具有重大影响,按“中等情况”分析,2025年AI直接带动全球2.92%的GDP,约3.2万亿美元,到2030年则直接带动9.54%的GDP,约12.4万亿美元,即5年AI产值增长近4倍(3.87倍)。

另一个例证就是法国Aventis Advisors的《2024年人工智能估值倍数报告》显示,2015年AI投融资大爆发时,OpenAI创立,虽然最近3年全球投资频次持续下滑,但仍高于2015年水平线,2024年全球AI融资逾5000次,且60%以上处于A轮以前。

布拉德福德·德龙在讲述全球工业革命经济史著作《蹒跚前行》一书中讲到:“工业研究实验室、现代公司与全球化掀起了发现、发明、创新、应用和世界经济一体化的浪潮,极大地提高了我们的全球有用经济知识指数。”那么在可预见的未来20年中,人工智能实验室、智能协同网络、联盟生态化,将掀起另一场世界经济变革的浪潮。

人工智能的“细分赛道”


在这个爆发初期的大产业中,如何找到最值得关注的细分赛道?在柏拉图《理想国》书中提出的洞穴思想实验,从前有一个洞穴,洞穴内的囚犯只能看到墙壁上洞外世界物体的影子,久而久之囚犯就把影子当成了对现实的认知,但影子并不是真实世界的准确表达。

当今“单模态”的语言类大模型正如洞穴中的囚犯,出现了幻觉、偏见等原生问题,要想从根上解题,必须让AI走出“洞穴”,像人类一样多模态地与物理世界交互、学习、纠偏,所以多模态AI将成为2025年的兵家必争之地。

AI无处不在,感知大千世界。在2024年底的OpenAI、微软的系列发布会中,我们发现AI能够系统性感知“三个世界”:

(1)  感知“物理世界”:OpenAI 4o模型通过摄像头,指导程序员做手工咖啡,体现了对物理环境、人物动作、任务阶段性结果的感知能力。

(2)  感知“数字世界”:微软Copilot办公助手能够识别、记忆、分析电脑屏幕,主动发现用户屏幕上的图表、数字、文字的问题、特征。

(3)  感知“精神世界”:OpenAI 4o模型通过手机摄像头感知用户通宵加班的精神状态,主动嘘寒问暖,给出充满温度的关心建议。

因此从GPT-4之后的下一代生产力模型,是以猎户座为代表的多模态模型、以Operator为代表的多模态智能体,相当于给AI装上了“眼睛”和“耳朵”,甚至具身机器人为AI装上了有触觉的“手”和“脚”。

据Statista最新数据预测,在2025-2030年期间,AI机器人、自主与传感技术,将会快速发展,甚至反超机器视觉,成为新兴赛道;另一方面,机器学习、自然语言也将保持快速发展态势。

斯坦福大学李飞飞教授在《我看见的世界》一书中有两段有趣的感知智能描述:
“5.43亿年前......这种感官剥夺的影响是深远的,由于(海洋生物)什么都看不到,听不到,摸不到,早期的生命形式没有任何可思考的对象。”“在一个没有感官输入的世界里,生物没有能力收集关于世界的信息,因此大脑完全没有存在的必要。”由此可见,无感知,无智能。

复杂推理,孕育“因果式AI”


未来高水平推理应用,正在推动“生成式AI”向“因果式AI”升级。图灵奖得主、美国国家科学院院士Judea Pearl旗帜鲜明地指出:“虽然概率体现了我们对静态世界的信念,但因果关系告诉我们,当世界发生变化时(无论是通过人为干预还是想象行为),概率是否会改变以及如何改变。”简而言之,相关性为主的生成式AI只能描述静态世界特征,而因果性为主的因果式AI能够认知判断世界动态发展规律。所以2024年AI科学家赢得诺贝尔物理奖、化学奖,只是一个开始,今后将会有越来越多的跨学科奖项花落AI。

GPT-4之后,全球大模型的研发形成了“分叉”的两条路径。一是像科学家一样严谨的强推理模型,如o1(草莓)、o3等;二是具有多模态感知和生成能力的生产力大模型,如4o、猎户座Orion等。

圣人无常师,AI弟子未必不如人类师傅,推理领域AI正在逼近超越人类专家。以2024年底OpenAI最新发布的o3模型分析,在AIME 2024国际奥数比赛题中o3考试拿下96.7分,接近满分;在以物理、化学、生物等科学题的GPQA基准测试中,o3考出87.7分的高分,超过人类平均水平69.7分;在Codeforces编程题考试中,o3得分2727分,超过了99.99%的人类程序员,而且超过了研发o3的OpenAI首席科学家Jakub Pachocki(雅库布·帕乔基)的2655分。在通用人工智能题库ARC-AGI基准测试中,o3最高取得了87.5考分,已经超过了人类专家的85分,并在2025-2026年向人类最高的95分攻坚。

读者朋友们,若想对逻辑推理有更深一步的理解,推荐阅读亚里士多德《工具论》:“大致来说,命题和问题分为三种。有些命题是伦理的,有些是自然哲学的,有些则是逻辑的。”当今人工智能正在通过学习人类科学家的“思维链”来实现这三类命题的复杂推理。

人工智能是重资本的

“科研军备竞赛”


重资本的长期投入是人工智能基础科研的“铺路石”。人类历史上每一次科技创新,都带动了世界范围的重资本基础设施建设,铁路网、高速公路网、电网、互联网、AI数据中心都如此,所以拿美国举例,通过基础科研不断逼近“AGI时刻”(通用人工智能)的四骑士背后都有异常强大的金主持续投入:

(1)  OpenAI的赞助方是3.4万亿美元的微软;

(2)  DeepMind的收购方是2.4万亿美元的谷歌;

(3)  Anthropic的投资方是2.5万亿美元的亚马逊;

(4)  xAI背靠1.5万亿美元的特斯拉。

AGI竞赛,不出钱,就出局。在下一代通用人工智能的“军备竞赛”中,仅算力一项,研发投资门槛就高达5年1000亿美元。例如2024年微软、字节跳动、腾讯、Meta、特斯拉、亚马逊几家大厂就从英伟达购买了大量GPU芯片,各家的年度投资都是100亿美元起步,而在AI算力、人才上的投资半途而废就意味着退出AGI竞争。微软总裁布拉德·史密斯(Brad Smith)宣布2025年将投资800亿美元建设AI数据中心,以训练AI大模型。

“算力常胜”的初期AI盈利模式也脱颖而出。第一类赚钱的公司是AI芯片厂商,以英伟达为例,2017至2024年,数据中心业务7年实现10倍营收增长,市值9年增长215倍。第二类赚钱的公司是AI云算力商,以微软云Azure为例,从2019年到2024年,季度营收5年实现2.6倍增长,微软市值同期增长3倍。第三类赚钱的公司是已经实现规模化供给的AI服务商,以特斯拉为例,2019至2024年,特斯拉年度营收5年增长3.3倍,市值增长17倍。

穆斯塔法·苏莱曼,迈克尔·巴斯卡尔在《浪潮将至》一书中认为:“这场浪潮由两大核心技术所定义:人工智能和合成生物学。它们将共同开启人类的新黎明,创造出前所未有的繁荣和富足。”我们正在接近人类命运的关键节点,这一节点决定着人类命运的未来走向。我们已被人工智能包围,生活中的一切都将改变。或许这才是全球科技巨头们超大规模押注人工智能的根本原因。

从“数字AI”到“物理AI”


大模型科技创新的上半场是“知识工程”,下半场是“工业革命”。谷歌DeepMind、OpenAI尝试从知识密集型的“数字AI”走向AGI,而特斯拉、英伟达在努力探索制造业、交通运输业的“物理AI”。人类从婴幼儿开始,就是不断与物理世界交互学习的过程,然后进入学校学习抽象的知识传承,属于“自然选择”机制。而目前人工智能恰恰相反,先学习海量数字化知识,再以机器人身体进入物理世界“进修”,属于“人类选择”机制。这可能就是“莫拉维克悖论”的原因。(注释:“莫拉维克悖论”指要让AI如成人般地下棋是相对容易的,但是要让电脑有如一岁小孩般的感知和行动能力却是相当困难甚至是不可能的)

虽然“数字AI”和“物理AI”的AGI科研路线尚无定论,但诸多企业家、科学家们都纷纷预判通用人工智能AGI将在6年内到来。

AGI时刻预测时间点各不相同,是因为AGI的定义不同。OpenAI用5级能力体系定义AGI,L1是聊天机器人,例如ChatGPT,L2是推理者,例如o1、o3,L3是代理型智能体,例如尚未发布的Operator,L4是创新者,能给出人类没想到的科研与产业创新方案,L5是组织者,一组AI能形成有效协同的生产力组织。

谷歌DeepMind则依照弱人工智能升级路径,相应提出了6级AGI能力体系框架,即按照AI等同于专业领域的专家水平,来定义跨领域的通用人工智能,例如等同于不熟练人员学徒级、等同于50%人类技能的合格级、等同于90%技能的专家级、等同于99%技能的大师级、超过100%技能的超级人工智能(ASI)。需要说明的是AGI不止是在一个垂直领域达到分级水平,而是在跨领域实现高水平通用智能。

我更倾向于谷歌对AGI的定义,即从整体能力上来评估,AGI应具有各个领域的通用智能、同时在垂直领域具有等同于人类大师水平的专业能力。如下图所示,目前只存在单一领域超过人类大师水平的专业弱人工智能,例如AlphaZero打败了所有人类围棋选手,或者存在学徒级水平的通用知识智能,例如ChatGPT,所以AGI或将迎来新一波架构革新、理论创新。






请到「今天看啥」查看全文