专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
软件定义世界(SDX)  ·  北京大学DeepSeek内部资料 ·  3 天前  
CDA数据分析师  ·  Deepseek来袭,数据分析师会失业吗? ·  4 天前  
数据派THU  ·  【ICLR2025】VEVO:基于自监督解耦 ... ·  5 天前  
数据派THU  ·  ICLR 2025 | ... ·  5 天前  
51好读  ›  专栏  ›  大数据文摘

封闭AI已到头?!阿里、DeepSeek引领开源猛攻,OpenAI、谷歌、微软狂送福利应对

大数据文摘  · 公众号  · 大数据  · 2025-02-27 12:16

正文

大数据文摘受权转载自头部科技
文丨谭梓馨

AI大模型的发展已经到了一个新的分水岭。

过去两天,DeepSeek通过“开源周”把压箱底儿的技术公之于众,据悉其下一代R2模型即将到来,同样在开源领域狂奔的阿里巴巴日前推出了基于Qwen2.5-Max的开源推理模型QwQ-Max-Preview,旗下视频生成基座模型Wan2.1也正式开源,开始发力多模态。

面对来自中国选手发起的强劲开源攻势,今天,OpenAI、谷歌、微软等纷纷宣布推出免费功能、降价以及降低用户对高阶智能使用的门槛。

新一轮市场洗牌正在加速转动,AI模型的商业模式如何演变成为一个新命题。

01 “开源队”强势攻城


DeepSeek在“开源周”第三天推出了DeepGEMM,一个支持密集和MoE GEMM的FP8 GEMM库,为旗下的V3/R1模型训练和推理提供支持。

据了解,DeepGEMM目前仅支持NVIDIA Hopper张量核心,该库用CUDA编写,在安装过程中无需编译,而是使用轻量级即时(JIT)模块在运行时编译所有内核。

优点是,该库的设计非常简单,只有一个核心内核函数,包含大约300行代码,这使其成为学习Hopper FP8矩阵乘法和优化技术的干净且易于访问的资源,DeepSeek团队表示,尽管DeepGEMM设计轻量,但其性能却与各种矩阵形状的专家调整库相当或超过后者。
此前,DeepSeek已接连开源了FlashMLA(一款基于NVIDIA Hopper GPU开发的高效MLA解码内核)和DeepEP(第一个用于MoE模型训练和推理的开EP通信库),在开发者社区引起了广泛好评,对于行业其他开发者充分利用AI算力,在资源受限的硬件上部署LLM或扩展到更大的模型尤其有用。
接力DeepSeek,阿里旗下Qwen系列模型在开源方面也有大动作。
2月25日凌晨,阿里巴巴宣布开源推理模型QwQ-Max-Preview,根据LiveCodeBench评估,QwQ-Max-Preview的性能与OpenAI的o1-medium相当,且还要优于DeepSeek R1。
QwQ-Max-Preview是一个基于Qwen2.5-Max的推理模型,该模型目前为预览版,但开发者测试它具有很强的数学理解、编码、代理等能力,基于该模型阿里还在Qwen Chat中发布了“思考(QwQ)”功能。
阿里通过社交平台表示,将很快发布QwQ-Max的正式版本,并且承诺会在Apache 2.0许可下完全开源QwQ-Max和Qwen2.5-Max。此外,他们还将提供较小的模型变体,例如QwQ-32B,可部署在本地设备上,在开源QwQ-Max的同时推出Android和iOS APP。
不仅如此,阿里今天还开源了名为“万相”的Wan2.1基座模型,定位为开放且先进的大规模视频生成模型,比DeepSeek在视频生成领域更快一步进行了布局。
全球基于阿里Qwen系列衍生的模型数量目前已超过10万个,成为开源社区最大的AI模型家族。
值得关注的是,DeepSeek之所以在“开源周”敢于释放很多关键技术细节,可能是因为其下一代模型R2已经在来的路上了。
据路透社援引三位熟悉该公司的相关人士消息称,DeepSeek可能会在今年5月前发布R2模型,新模型将在编程能力和多语言推理方面超过目前的R1,有望将开源AI模型再次推向新的极限。
对此,DeepSeek关联公司幻方量化相关人士回复媒体称:“以官方消息为准。”
关于R2的发布时间表,目前并没有具体细节,但5月份是一个关键节点。此前,业内已传出消息称OpenAI的跨代模型GPT-5可能也会在5月亮相,今年5月份还聚集了微软的Build开发者大会和谷歌I/O开发者大会,行业最新一代AI模型之间的PK大战正在酝酿之中。
02 被逼出来的“福利”
面对DeepSeek和阿里Qwen来强劲攻势,OpenAI、谷歌、微软等AI巨头的应对策略目前是“送送送”。
今天,OpenAI对旗下的深度研究(Deep Research)功能进行了大派送,正式向ChatGPT Plus、Team、Edu和Enterprise用户开放,此前,只有每月200美元(约1451元人民币)的Pro订阅用户才能体验。
目前,Plus、Team、Enterprise和Edu用户每月将有10次深入研究查询,专业用户现在每月可进行120次深度研究查询。
OpenAI还有一些其他功能福利打包。即日起,推出由GPT-4o mini提供支持的Advanced Voice版本,所有ChatGPT免费用户有机会在各个平台上每天预览它。
该功能的对话节奏和语调与GPT-4o版本相似,同时服务成本更低。用户将能以现有的每日速率限制使用由4o提供支持的Advanced Voice,还可以访问Advanced Voice中的视频和屏幕共享,Pro用户则能继续无限制地使用高级语音以及更高的视频和屏幕共享限制。
谷歌方面,坐不住的首席执行官Sundar Pichai今天亲自发帖助阵,宣布面向开发人员推出全新Gemini 2.0更新:免费使用Gemini Code Assist。
据了解,Gemini Code Assist支持每月18万次代码补全,是其他同行产品目前提供的90倍左右,其他流行的免费编程助手通常每月限制2000次,而且支持公共领域的所有编程语言,128K令牌上下文窗口。
目前,全球开发人员已可以免费获得Gemini Code Assist的AI辅助编码帮助以及代码审查帮助,且能以最高的使用权限使用。
谷歌Gemini 2.0 Flash-Lite也正式发布,对于使用较长上下文窗口的项目来说,它具有非常可观的成本效益,128K个令牌之外的定价比较实惠,用户可以在Google AI Studio中的Gemini API中找到它。
为了跟上OpenAI和谷歌的节奏,微软Copilot今天也推送了一波免费福利。
微软向所有Copilot用户推出可以免费、无限制地访问的Voice和Think Deeper,据悉,这些功能由OpenAI的o1模型提供支持,便于用户用高级推理模型来解决更复杂的日常问题或任务。
此外,微软会支持Copilot Pro付费用户在高峰使用期间优先访问其最新模型、提前访问实验性AI功能等,以及可以在Microsoft 365应用中额外使用Copilot。
而马斯克旗下xAI最近发布的Grok3市场竞争策略更是简单粗暴:世界上最智能的人工智能Grok 3现在免费提供,直到服务器崩溃。X Premium+和 SuperGrok用户可以更多地使用Grok 3,此外还可以提前使用语音模式等高级功能。
综合来看,来自中国开源AI竞争者的倒逼和封闭模型之间本身就存在的激烈竞争,正在让AI模型下一步的商业模式展现出新范式。
03 “半开源”模式探索

2025年开局,AI领域开源与封闭模式碰撞之激烈超乎想象,牵扯到技术创新、透明度、安全性和商业化竞争等多方面,顶尖计算机科学家们也表达了多元化观点。
如“AI教父”Geoffrey Hinton近期表示对开源AI的担忧,他认为封闭AI才能更好地控制潜在危害,特别是在AI智能程度接近人类水平时。开源AI类似于“开源核技术”,可能会被非法利用带来社会安全风险。






请到「今天看啥」查看全文