专栏名称: 瞭望智库
2015年底,新华社获批为党中央、国务院、中央军委直属的首批10家国家高端智库试点之一。瞭望作为新华社国家高端智库的公共政策研究中心,是国家高端智库建设的重要组成部分。公共政策研究中心与先期成立的瞭望智库一体化运作。
目录
相关文章推荐
底线思维  ·  尹锡悦出狱,这次他能回家呆多久? ·  昨天  
新法治报  ·  江西一设区市任命1名副市长 ·  2 天前  
新法治报  ·  江西一设区市任命1名副市长 ·  2 天前  
底线思维  ·  特朗普和美国,只能“成功”一个 ·  2 天前  
半月谈  ·  提振消费,向新提质 ·  2 天前  
51好读  ›  专栏  ›  瞭望智库

只要几十美元?“低成本”小模型背后的真相……

瞭望智库  · 公众号  · 政治  · 2025-03-07 07:30

正文

继DeepSeek R1以有限算力,凭借强大算法创新“惊艳”全球之后,大模型研发领域似乎也开始打起“价格战”。美国斯坦福大学、加利福尼亚大学伯克利分校等机构的研究团队,先后宣布仅以几十美元成本,开发出性能可媲美前沿推理模型的人工智能(AI)模型。这是否意味着大模型研发成本正逐渐下探,动辄数千亿美元的研发费用将成为过去?

图片
1月8日,在美国拉斯维加斯,人们在展区观看运用AI技术的新款电视   新华社发 (曾慧摄)

文|彭茜
本文转载自微信公众号“环球杂志”(ID:GlobeMagazine),原文首发于2025年3月6日,原标题为《AI大模型的价格被“打下来”了?》。

1
低成本玩转高级推理


“这是开源模型对闭源模型的胜利。 ”正如法国计算机科学家、图灵奖得主杨立昆此前在个人社交媒体评价DeepSeek时所说,开源模型正不断推进AI领域的诸多突破性进展。 微调、蒸馏等建立在开源模型基础上的低成本创新技术,似乎正在挑战大模型的烧钱逻辑。

美国斯坦福大学和华盛顿大学的研究团队日前宣布研发出名为S1的模型,在衡量数学和编码能力的测试中,表现出与OpenAI o1和DeepSeek R1等前沿推理模型不相上下的性能。

这一研究可以算是“站在巨人肩上摘果子”。根据论文,S1的核心创新在于采用了知识“蒸馏”技术和“预算强制”方法。“蒸馏”技术就好比对别人酿好的酒进一步提纯。该模型的训练数据是基于谷歌Gemini Thinking Experimental模型“蒸馏”出的仅有1000个样本的小型数据集。

在算法上,S1则是对阿里云的通义千问开源模型进行监督微调,并通过“预算强制”方法,控制训练后的模型计算量。最后,使用16个英伟达H100 GPU仅进行了26分钟的训练便达成目标。

美国加利福尼亚大学伯克利分校研究团队最近也开发出一款精简的AI模型TinyZero,宣称实现了DeepSeek R1-Zero在倒计时和乘法任务中的复刻版。该模型通过强化学习,实现了3B(30亿模型参数)的大语言模型的自我思维验证和搜索能力。

两个研究团队都以“低成本”为卖点,对外宣称训练成本仅为几十美元。 参与S1项目的斯坦福大学研究人员尼克拉斯·米尼霍夫告诉科技媒体TechCrunch,训练租用所需的计算资源大约只需20美元。而TinyZero团队核心成员加利福尼亚大学伯克利分校博士潘家怡也在其个人社交媒体上发文称,其项目训练成本不到30美元。

2
“低成本”小模型背后的真相


清华大学计算机系长聘副教授刘知远接受记者采访时说,部分海外研究团队采用DeepSeek R1、OpenAI o1等高性能推理大模型构建、筛选高质量长思维链数据集,用这些数据微调小模型,可以低成本快速获得高阶推理能力。 这些研究进展进一步验证了DeepSeek R1论文中提出的观点: 利用大模型进行知识蒸馏可有效提升小模型的推理性能,这是AI前进方向的有益尝试,但成本和整体性能都有夸张之嫌。

首先,超低成本只是局部费用。AI智库“快思慢想研究院”院长田丰告诉记者,几十美元成本只是最后一个环节的算力成本,并没有计算基模型的预训练成本、数据采集加工成本,与DeepSeek、GPT o1的完整训练周期成本不具有可比性。此外,二者的成功均建立在其他成熟开源模型的微调基础之上,而非从0到1的原始创新,底座大模型高昂的训练成本并未被计入。 这就 好比盖房 子,只算了最后装修的钱,却没算买地、打地基的钱。

其次,整体性能尚无法比肩成熟大模型。TinyZero仅在简单数学任务、编程及数学益智游戏等特定任务中有良好表现,但无法适用于更加复杂、多样化的任务场景。而S1模型也只能通过精心挑选的训练数据,在特定测试集上超过GPT o1-preview,而远远没有超过o1正式版或DeepSeek R1。在使用“预算强制”方法时,当思考的时间和内容越来越多时,S1模型还会有点“后劲不足”,性能提升不太明显。

不过田丰认为,新研究中延长模型思考时间的方法、强制模型反思发现答案错误、高质量蒸馏数据集的推理提升等探索,都对科研群体有启发性。

以“二创”方式构建小模型的探索,也增强了AI的普惠性。 这对采用基础模型微调的二次开发企业具有现实价值,可快速根据自身实际情况微调出小模型,以更低成本将AI技术应用于业务中,推动更多领域的智能化变革。

3






请到「今天看啥」查看全文