专栏名称: OSC开源社区
OSChina 开源中国 官方微信账号
目录
相关文章推荐
程序员的那些事  ·  国产 DeepSeek V3 ... ·  2 天前  
程序员的那些事  ·  趣图:“微软穷疯了?上架的 ... ·  11 小时前  
程序员小灰  ·  这款AI编程工具,将会取代Cursor! ·  昨天  
OSC开源社区  ·  DeepSeek-V3满血版在国产沐曦GPU ... ·  3 天前  
51好读  ›  专栏  ›  OSC开源社区

2024年中国开源模型:崛起与变革

OSC开源社区  · 公众号  · 程序员  · 2025-02-07 15:11

正文

OSCHINA

↑点击蓝字 关注我们

最近,开源中国 OSCHINA、Gitee 与 Gitee AI 联合发布了《2024 中国开源开发者报告》
报告聚焦 AI 大模型领域,对过去一年的技术演进动态、技术趋势、以及开源开发者生态数据进行多方位的总结和梳理。

在第二章《TOP 101-2024 大模型观点》中,Hugging Face 工程师 Tiezhen 、Hugging Face 中文社区项目经理 Adina 以及 Hugging Face Fellow Lu Cheng ,从崛起与变革两个维度,探讨中国开源模型在这一年取得的重大成就和未来展望。

全文如下:

2024 年中国开源模型:崛起与变革

文 / Tiezhen、Adina、Lu Cheng

2024 年,中国在开源人工智能模型领域的崛起和变革成为全球瞩目的焦点:从学术到产业,从技术到生态,中国通过自主研发和协同创新,逐步完成了从 “追随者” 到 “引领者” 的转变。

这种转变不仅是技术实力的体现,更是中国人工智能生态系统快速完善的真实写照。以下,我们将从崛起与变革两个维度,探讨中国开源模型在这一年取得的重大成就和未来展望。

崛起

从 “追随者” 到 “引领者”
2024 年,中国学术界和产业界大力推进自主研发,在技术创新和模型能力上实现了显著飞跃,并在全球范围内取得了显著成就。Hugging Face Open LLM 排行榜数据显示,从智谱的 GLM 系列、阿里巴巴的 Qwen 系列到深度求索的 DeepSeek 系列,这些自主研发的模型在国内外各项评测中表现卓越。
每个月来自中国主要研究机构和公司的开源模型 / 数据集数量。

图片源自 Hugging Face 中文社区模型社群:
https://huggingface.co/spaces/zh-ai-community/zh-model-release-heatmap
其中,Qwen 系列凭借灵活的多尺寸选项,强大的多语言支持以及友好的模型授权功能,赢得了社区开发者的高度评价。DeepSeek 通过引入多头潜在注意力(Multi-head Latent Attention, MLA)技术,在性能和成本上实现了革命性突破,开创高性价比的 AI 新纪元。
智谱的 CogVideoX 系列文生视频模型,成为全球首批开源的文生视频模型之一,不仅在技术方面让中国视频生成模型列入领先梯队,强化了中国模型在全球范围的竞争力,也为国际开源生态的发展产生了积极的影响,为全球开发者提供了更多创新和应用的可能。
中国开源模型从最初的质疑中崛起,逐步赢得了广泛认可。这不仅彰显了中国开源模型从追随者到行业引领者的跨越式成长,也为全球人工智能发展注入了新的活力与动力。中国开源模型的成功并非偶然。在政府对人工智能产业的持续支持以及国内人工智能行业对模型研发的巨额投入下,从基础算法到行业应用、从算力基础设施到数据资源整合,中国人工智能生态体系正在迅速完善。这一趋势表明,未来中国有可能在全球人工智能领域占据更为核心的地位。
开源生态的繁荣与协作
随着开源模型影响力的提高,中国开源社区的活跃度也明显提升。无论是企业、研究机构还是个体开发者都更加积极地参与到开源工作中。
以阿里巴巴的通义千问 Qwen 为例,据不完全统计,截止 2024 年 9 月,全球已有近 8 万基于 Qwen 的衍生模型,超越了 Meta 的 Llama。该系列模型已被集成到 Hugging Face Transformers、Hugging Chat 和阿里自家的百炼平台中,极大促进了全球开发者的交流和协作,形成了国际化开源生态。
北京智源研究院和上海人工智能实验室等研究机构,通过与企业和高校合作及开源平台的建设,建立了更完善的协作机制,从而在开源模型 (如 InternLM) 和数据集 (如 Infinity-MM) 领域贡献了大量有影响力的基础工作和资源。
2024 年,中国开源社区涌现出众多高质量的自发研究成果。其中,MAP 团队推出的全开源模型 Map Neo 引人瞩目。该模型在训练数据、脚本以及模型对齐工作上实现了全面公开,成为国内少有的真正意义上完全开源的项目。
而 InstantX 团队的 InstantID 则作为中国模型在国际开源社区的 2024 年首秀,一经发布便获得了广泛关注,为中国模型在全球开源生态中赢得了更多认可。
平衡发展与合规创新
中国在推动人工智能技术发展的同时,也在监管层面努力建立了完善、透明的治理机制。这种监管创新为开源模型的发展提供了稳定的政策环境,同时确保技术应用符合社会价值导向。比如 《人工智能示范法 2.0(专家建议稿)》对于免费且已开源方式提供人工智能研发的个人和组织给予减轻或免承担法律责任;《生成式人工智能服务管理暂行办法》 则明确了人工智能技术的使用和合规要求,促进了开源模型在合规框架下良性发展。

变革

端上模型的兴起与隐私保护
随着小型模型的性能逐步增强,更多高级 AI 正转向在个人设备上运行。这一趋势不仅显著降低了云端推理成本,还提升了用户隐私控制。
中国 AI 社区在这一领域也做了重要贡献,推出了如 Qwen2-1.5B、MiniCPM 系列和 DeepSeek Janus 等多款移动友好型模型。其中,最新发布的 GLM Edge 1.5B 模型通过与高通 GenAI 扩展的联合优化,在搭载骁龙 8 Gen 4 处理器的手机上实现了每秒 65 个 tokens 的推理速度,接近人类语音的平均输出速率。尽管存在电池续航和内存占用过大等挑战,端上模型代表了 AI 技术隐私保护和成本优化的未来方向。中国在这一领域的探索,为行业提供了宝贵经验。
推理扩展法则的潜力释放
通过推理扩展法则,模型性能可通过延长 “思考时间” 而进一步优化。这一技术模拟了人类 “深思熟虑” 的过程,显著提升了模型在逻辑推理和复杂任务中的表现。
中国开源社区在逻辑推理领域推出了许多创新项目,包括阿里巴巴国际的 Macro-o1、通义千问团队的 QwQ、上海人工智能实验室的 LLaMA-O1 和清华大学的 Llama-3.2V-11B-cot。这些模型不仅在技术上各具特色,还通过开源策略分享了大量研究细节,为整个开源社区提供了丰富的资源,在这一过程中,小模型不仅在推理能力上有了显著提升,也推动了行业整体技术水平的进步。
结合当前人工智能产业界的 “人工智能 +” 计划,小模型在特定任务优化上的优势愈发突出,预计将在金融、医疗和工业自动化等热门领域发挥引领作用,以更高效、更精准的方式满足多样化需求,帮助人工智能在实际应用场景中落地。
开源多元化与应用细分
中国开源模型的发展不仅体现在技术突破上,还在生态建设中展现出巨大的活力。中国开源模型从竞争激烈的 “百模大战” 逐步迈向多元化和深度细分,国内社区在今年发布了大量高质量开源模型,尤其是多模态理解与生成模型:
多模态理解 :Qwen2-VL、Ovis、InternVL2、DeepSeek JanusFlow、GOT-OCR2_0;
图片生成 :PixArt、Lumina、Kolors、Hunyuan-DiT、VAR、Meissonic;
视频生成 :AnimateDiff-lightning、Latte、OpenSora、open-sora-plan、Pyramid Flow、CogVideoX;
TTS :GPT-SoVITS、ChatTTS、CosyVoice、FishAudio、MaskGCT、F5-TTS 。
这一趋势表明,模型的竞争已经从单纯的规模比拼转向应用场景细化。为了更好地展现这一演进路径,我们在 Hugging Face 的中文模型社群( https://huggingface.co/zh-ai-community )中对各个领域的开源模型进行了系统整理。

展望

2024 年,中国开源模型的发展展现了技术、生态和社会价值之间的深度协同。无论是从技术创新到社区建设,还是从行业实践到合规探索,中国开源生态体系的完善正在为全球人工智能发展注入源源不断的动力。
在 Hugging Face,我们坚信开源是推动人工智能技术进步和生态繁荣的核心力量。开源不仅能够打破技术壁垒,促进全球开发者之间的协作与创新,还能推动技术的普惠化,让更多的人能够平等地享受人工智能带来的便利与机遇。
在未来,中国开源模型有望继续为全人类的智能化生活提供更丰富的解决方案与可能性。我们希望看到更多来自中国的开源 AI 团队通过开放协作推动技术边界的不断拓展,共同构建一个更加包容、多元与可持续发展的人工智能的未来。

作者简介
Tiezhen






请到「今天看啥」查看全文