专栏名称: 瞭望智库
2015年底,新华社获批为党中央、国务院、中央军委直属的首批10家国家高端智库试点之一。瞭望作为新华社国家高端智库的公共政策研究中心,是国家高端智库建设的重要组成部分。公共政策研究中心与先期成立的瞭望智库一体化运作。
目录
相关文章推荐
学习大国  ·  习近平在贵州黔东南州考察调研 ·  昨天  
政知道  ·  俄军官:已控制库尔斯克州几乎所有定居点 ·  22 小时前  
内蒙古生态环境  ·  坚持以实践检验为标准——以改革创新精神完成全 ... ·  2 天前  
内蒙古生态环境  ·  坚持以实践检验为标准——以改革创新精神完成全 ... ·  2 天前  
半月谈  ·  3·15曝光问题,多地连夜查处! ·  3 天前  
51好读  ›  专栏  ›  瞭望智库

“开源双雄”:创新摘得人工智能满天繁星

瞭望智库  · 公众号  · 政治  · 2025-03-18 19:52

正文

图片 图片

从2017年首次写入政府工作报告,到2025年全国两会,“人工智能”7次出现在政府工作报告中,且表述越来越具象化。

“加快技术的研发、转化和应用”“培育壮大人工智能等数字产业”“创新成果不断涌现”……如果说2023年之前人工智能仅是与大数据、量子信息等一众关键核心技术一同被提及,进入2024年之后,随着“人工智能+”行动的出现,持续的高关注度让人工智能从强调技术发展的层面快速演进为推动人工智能大模型广泛应用的新阶段。

今年政府工作报告提出,持续推进“人工智能+”行动,将数字技术与制造优势、市场优势更好结合起来,支持大模型广泛应用,大力发展智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端以及智能制造装备。

一系列变化凸显国家高度重视新一代人工智能发展的同时,还体现出中国公司在人工智能领域的强势崛起,以及对国家相关重大决策部署形成的强力创新支撑。

特别是近段时间以来,先有杭州深度求索公司(DeepSeek)横空出世,在全球引发广泛关注,后有阿里旗下通义系列大模型多次登顶国际榜单,成为全球最大开源模型族群。

一系列由中国企业带来的持续性创新突破,不仅实现了自身业务的成功,还激活了国内外市场对中国人工智能发展前景的期待,更坚定了人们以技术创新支撑经济增长的长期信心,凸显了民营企业在推动创新和技术自强方面的重要作用。

1
DeepSeek 到通义系列模型, AI 领域开源逐渐占据上风



2025 年开年, DeepSeek 率先点燃国内外各界人士对人工智能的热情。媒体报道中, DeepSeek 推出的 R1 模型,几乎以一己之力改变了“美国 AI 断崖式领先”的预期。

未等DeepSeek热度下降,阿里云又在一个月内,先后发布旗舰模型Qwen2.5-Max 和视觉模型Qwen2.5-VL,开源了旗下最新的视觉生成模型万相2.1和推理模型QwQ-32B。其中,前述两款旗舰模型性能全面超越GPT-4o和Claude 3.5,万相2.1和QwQ-32B在短时间内先后登顶全球最大AI开源社区Hugging Face模型趋势榜单,并在多项性能测评中领先。

(千问QwQ-32B开源当日即登顶Hugging Face趋势榜,第四位为阿里旗下万相2.1视觉模型。图源|Hugging Face社区截图)

如在测试数学能力的AIME24评测集上,及评估代码能力的LiveCodeBench中,仅有320亿参数的QwQ-32B,整体性能与6710亿参数的满血版DeepSeek R1相当,在以更小尺寸比肩当前最强性能模型的同时,延续了DeepSeek给全球AI界带来的“中国震撼”。

从DeepSeek到阿里,作为全球前三且同在杭州的AI开源公司,能在全球范围引起巨大波澜,核心点就六个字:开源、便宜、好用。

开源与否,一直是AI大模型行业中争论的焦点,而争论的背后,其实是领先者和追赶者对未来发展主动权的争夺。以领先者的视角看,闭源模型能通过技术“黑箱”,维持技术领先的“护城河”,以限制技术扩散、迟滞追赶者脚步,同时通过“算力堆砌”造成追赶过程中可能面临的高昂成本。哪怕追赶者不计成本,主动权也不掌握在手中,因为一旦领先者实现了由领先优势向垄断优势的进化,那留给追赶者的局面就不言而喻了。

可反观追赶者视角,开源情况下,技术“黑箱”将不复存在,通过开放换来的是全球开发者和研究者的共同参与,从而形成强大的技术发展与创新生态。对内推动模型的持续迭代,形成数据与业务的正循环,对外激发更丰富的应用场景、取得更显著的应用,并实现生态参与者的共赢。但对于领先者来说,选择开源意味着技术优势无法最大程度转化为竞争优势,甚至不得不重新调整模型发展策略,加速模型优化工作。

对此,DeepSeek创始人梁文锋曾公开表示,创新才是公司的长久“护城河”。事实上,爆火后DeepSeek的开源行动依旧频繁,2月24日“开源周”启动,计划连续5天每天开源一个项目。从针对Hopper GPU优化的高效MLA解码内核FlashMLA,到首个用于MoE模型训练和推理的开源EP通信库DeepEP,再到支持稠密和MoE模型的FP8计算库DeepGEMM,以及优化并行策略的DualPipe和EPLB,还有为应对人工智能训练和推理工作负载挑战而设计的3FS(Fire-Flyer File System)文件系统,涵盖了训练、推理、通信等大模型开发的关键环节。

在引领开源的路上,DeepSeek并不独行,作为同样坚持走开源路线的中国AI头部企业,阿里的起步甚至更早,开源力度更是无出其右。2023年8月,阿里云宣布开源通义千问模型Qwen-7B,成为国内首个加入自研大模型开源行列的企业。

到目前为止,阿里已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,开源囊括文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等“全模态”,覆盖从0.5B到110B等参数的“全尺寸”,屡次斩获Chatbot Arena、司南Open Compass等权威榜单冠军。

(Hugging Face开源大模型榜单的前10名都是来自通义系列的衍生模型。图|Hugging Face截图)

数据显示,在海内外AI开源社区中,通义系列模型的衍生模型数量已突破10万,超越美国Llama系列模型,成为全球最大的开源模型族群。截至2025年2月中旬,由阿里牵头发起的AI模型社区“魔搭”模型总量超过4万个,涵盖LLM、对话、语音、文生图、图生视频等多个领域,已服务超1000万名开发者。

中国开源模型的速度,也倒逼全球AI企业加速创新,他们在农历春节后动作频频:Open AI推出了o3-mini,免费开放使用;马斯克推出“最聪明的AI” Grok3;Anthropic更新了混合推理模型 Claude 3.7 Sonnet。

Open AI的首席执行官萨姆·奥特曼反思说:没有开源,是站在了历史错误的一边。Meta首席人工智能科学家杨立昆说,与其说是中国打败了美国AI,不如说是开源战胜了闭源。

可见,从DeepSeek到通义系列模型,持续热议下,开源大模型正在AI领域逐渐占据上风。甚至已有AI企业从闭源路线开始掉转车头,走上大模型开源路线。

2






请到「今天看啥」查看全文