专栏名称: CDCC
数据中心标准、技术沟通交流平台
目录
相关文章推荐
51好读  ›  专栏  ›  CDCC

斯坦福2025 AI指数出炉!AI推理成本降低至1/280,中美AI终极对决差距仅剩0.3%

CDCC  · 公众号  ·  · 2025-04-09 13:31

正文

请到「今天看啥」查看全文


导读

2025年斯坦福HAI报告重磅发布,456页深度剖析全球AI领域的最新趋势:中美顶级模型性能差距缩至0.3%,以DeepSeek为代表的模型强势崛起,逼近闭源巨头;推理成本暴降,小模型性能飙升,AI正变得更高效、更普惠。

斯坦福大学正式发布了《2025 AI Index》报告!
每一年的斯坦福 AI Index 报告都会对领域的发展进行系统的梳理,今年也是如此。《2025 AI Index》报告总共456页,涵盖了研发、技术性能、负责任的人工智能、经济影响、科学和医学、政策、教育和公众舆论等主题的图表和数据。

关于今年AI Index报告的核心内容,我们通过以下12点了解

1

美国领跑顶尖模型研发

虽然衡量国家在人工智能竞赛中「领先」的方式多种多样(如期刊文章发表或引用数量、专利授权等),但一个直观的评估指标是观察哪些国家发布了具有影响力的模型。数据显示,去年美国发布了40个知名模型,中国发布了15个,欧洲仅有3个(均来自法国)。另有数据表明,2024年发布的这些模型几乎全部来自产业界,而非学术界或政府部门。

2

中美顶级AI模型的性能差距持续缩小

在已发布的知名模型数量上仍然保持领先地位,但中国模型在质量方面正在迅速赶上。数据显示,在聊天机器人基准测试上的性能差距正在不断缩小。2024年1月,顶尖美国模型的表现比最优中国模型高出9.26%;到2025年2月,这一差距已缩小至仅1.70%。报告在推理、数学和编程等其他基准测试中也发现了类似趋势。

3

训练成本的全面上涨,但未包含DeepSeek

关于2023年至2024年知名模型发布数量减少的现象,AI Index认为可能是由于技术复杂度提高和训练成本持续攀升所致。

斯坦福研究人员与Epoch AI合作,基于训练时长、硬件类型和数量等详细信息,估算了部分模型的成本。在可评估的模型中,最昂贵的是谷歌的Gemini 1.0 Ultra,训练成本约达1.92亿美元。训练成本的全面上涨与报告中的其他发现相符:模型在参数数量、训练时间和训练数据量等方面持续规模化扩张。

值得注意的是,DeepSeek并未包含在这一分析中。这家公司在2025年1月声称仅用600万美元训练出了DeepSeek-R1,引发金融市场震动,虽然部分行业专家对此说法持怀疑态度。

4

大模型使用成本持续走低,年降幅最高900倍

尽管大多数 AI 模型的训练成本持续攀升,但报告中强调了几个积极趋势:硬件成本降低、硬件性能提升及能源效率提高。

在MMLU基准测试中达到GPT-3.5水平(MMLU准确率64.8%)的AI模型调用成本,已从2022年11月的20美元/每百万token,骤降至2024年10月的0.07美元/每百万token(谷歌DeepMind的Gemini-1.5-Flash-8B模型),18个月内AI成本下降280倍。

视具体任务需求,LLM推理服务价格的年降幅可达9-900倍不等。

5

AI模型已成为算力巨兽

从2010年代初开始,模型的参数量就蹭蹭往上涨,这背后是因为模型设计得越来越复杂、数据更容易获取、硬件算力也更强了。

更重要的是,大模型确实效果好。

下图用了对数刻度,方便大家看清楚AI模型参数和算力近年来的爆炸式增长。

随着模型参数数量的增加,训练所需的数据量也在暴涨。

2017年发布的Transformer模型,掀起了大型语言模型的热潮,当时它用了大约20亿个token来训练。

到了2020年,GPT-3 175B模型的训练数据已经飙到了约3740亿个token。

而Meta在2024年夏天发布的模型Llama 3.3,更是用了大约15万亿个token来训练。

根据Epoch AI的数据,大型语言模型的训练数据集规模大约每八个月翻一倍。

训练数据集越来越大,导致的训练时间也变得越来越长。

像Llama 3.1-405B这样的模型,训练大概需要90天,这在如今已经算是「正常」的了。

谷歌在2023年底发布的Gemini 1.0 Ultra,训练时间大约是100天。

相比之下,2012年的AlexNet就显得快多了,训练只花了五六天,而且AlexNet当时用的硬件还远没有现在的先进。

6

知名AI模型的算力消耗呈指数级增

据Epoch AI估计,知名AI模型的训练算力大约每五个月翻一番。这种趋势在过去五年尤为明显。

7

美国的顶级AI模型通常需要多得多的计算资源

去年12月,DeepSeek V3一经推出就引发了广泛关注,主要就是因为它在性能上极其出色,但用的计算资源却比许多顶尖大型语言模型少得多。

下图比较了中国和美国知名AI模型的训练算力,揭示了一个重要趋势:美国的顶级AI模型通常比中国模型需要多得多的计算资源。

8

企业资金持续涌入人工智能领域

过去五年,企业界已为人工智能投资敞开了资金闸门。虽然2024年的全球总体投资未能达到2021年的疯狂高峰,但值得注意的是,私人投资规模达到了前所未有的水平。在2024年1500亿美元的私人投资中, 相关指数 的另一项数据表明,约330亿美元流向了生成式AI领域。

9

大厂ALL in AI,投资与采用率创双纪录

科技大厂们,正全力押注AI。2024年,美国私营AI投资达1091亿美元,约为中国(93亿)的12倍、英国(45亿)的24倍。生成式AI势头尤猛,全球私募投资达339亿美元(同比增18.7%)。

与此同时,企业AI采用率从55%升至78%。研究证实,AI不仅能提升生产力,多数情况下还可缩小劳动力技能差距。

更引人注目的是,将生成式AI应用于至少一项业务职能的企业数量激增——从2023年的33%跃升至去年的71%,增幅超一倍。

10

全球监管力度持续加强

2024年美国联邦机构颁布59项AI法规,涉及部门数量翻倍。

75个国家立法机构提及AI频次同比增长21.3%,较2016年增长九倍。

投资方面:加拿大承诺24亿美元,中国设立475亿美元半导体基金,法国投入1090亿欧元,印度拨款12.5亿美元,沙特启动千亿美元级的「超越计划」。

11

全球AI乐观情绪上升,但地区差异显著

中国(83%)、印尼(80%)和泰国(77%)民众对AI持积极态度,而加拿大(40%)、美国(39%)等发达国家则相对保守。

值得关注的是,德国(+10%)、法国(+10%)等原怀疑论国家态度明显转变

12

大多数人并不感到受到人工智能的威胁

关于人工智能是否以及何时会取代你的工作,社会上已有广泛讨论。然而,最近一项关于人工智能态度的全球调查显示,大多数人并不感到受到人工智能的威胁。

来自32个国家的60%受访者认为人工智能将改变他们的工作方式,但仅有36%的人预期会被替代。 Gil表示:这些调查结果确实让我感到惊讶。人们认为人工智能将改变我的工作,但我仍将创造价值,这种观点非常令人鼓舞。

更多细节,可参考报告原文。

关注我们获取更多精彩内容


往期推荐

● “液冷”牵线多元融合,2025中国数据中心液冷技术大会铸就行业新里程碑!

● 创新矩阵璀璨登场,深度解码产业协同进阶新蓝图

● 华信设计院闪耀液冷大会!2025中国数据中心液冷技术大会全程高能

● 微软叫停多个在建数据中心,正重新评估AI战略







请到「今天看啥」查看全文