专栏名称: 知识图谱科技
务实的人工智能布道者。跟踪介绍国内外前沿的认知智能技术(知识图谱,大语言模型GenAI)以及医药大健康、工业等行业落地案例,产品市场进展,创业商业化等
目录
相关文章推荐
疯狂区块链  ·  是骑手需要社保,还是社保需要骑手? ·  昨天  
疯狂区块链  ·  英伟达就是下一个苹果 ·  昨天  
白话区块链  ·  突发:Bybit平台15亿美金资产被盗,7大 ... ·  3 天前  
51好读  ›  专栏  ›  知识图谱科技

DeepSeek与其他大模型的差异化以及对企业级AI市场的影响

知识图谱科技  · 公众号  ·  · 2025-01-31 10:02

正文

人工智能行业长期以来一直由 OpenAI、Google 和 Meta 等美国公司主导。 然而,最近出现的中国 AI 初创公司 DeepSeek 颠覆了全球 AI 格局。

DeepSeek 的最新模型 DeepSeek-R1 因其有竞争力的性能、开源特性和经济高效的开发而成为头条新闻。随着人工智能成为技术创新中越来越关键的部分,了解 DeepSeek 如何与其他领先模型区分开来至关重要。

‍‍‍‍ 1. 开源模型与闭源模型 ‍‍‍‍

DeepSeek 采取了与 OpenAI 等美国 AI 巨头不同的方法,优先考虑开源开发。在 MIT 许可下发布的 DeepSeek-R1 模型使研究人员、开发人员和企业可以自由访问、修改和部署该技术。

‍‍‍‍‍‍‍‍ 另一方面,OpenAI 已经摆脱了其最初的开源理念,保留了较新的 GPT 模型的专有性。这种开源方法提供了更高的透明度,促进了协作改进,并降低了 AI 采用的障碍,使 DeepSeek 成为不想被锁定在专有生态系统中的企业和独立开发人员的有吸引力的替代方案。 ‍‍‍‍‍‍‍‍

2. 模型参数和架构

DeepSeek-R1 采用 Mixture-of-Experts (MoE) 架构,显著提高了计算效率。 该模型拥有 6710 亿个参数,但由于其 MoE 设置,在任何给定时间都只有 370 亿个参数处于活动状态。 这使它能够实现高水平的性能,同时保持比传统的基于 transformer 的架构更低的计算成本。

相比之下,OpenAI 的 GPT-4 估计有大约 1.8 万亿个参数,需要更多的计算能力并导致更高的运营成本。DeepSeek 的方法使其能够优化资源,同时保持基于文本的任务的准确性和效率。

3. 成本效益和资源利用率

DeepSeek 已经实现了与 OpenAI 的 GPT-4o、Meta 的 Llama 3.1 和 Anthropic 的 Claude 3.5 Sonnet 等领先模型相当的 AI 性能,但成本只是其中的一小部分。该公司声称已经训练了 DeepSeek-R1,估计预算为 560 万美元,明显低于竞争对手花费的数亿美元。

这种成本效率主要归功于其采用的专家混合(Mixture-of-Experts,MoE)架构,该架构通过在每次交互时仅激活模型中最相关的部分来优化计算。

据报道,DeepSeek 使用 H800 GPU 训练其模型,H800 GPU 是 Nvidia 高性能 H100 GPU 的略微降级版本,由于美国的制裁,这些 GPU 被限制出口到中国。尽管存在这些硬件限制,但 DeepSeek 已经证明,它可以以较低的计算需求开发极具竞争力的 AI 模型。

4. 推理和编码能力

DeepSeek 的 AI 模型,尤其是 DeepSeek-R1,在推理、编码和数学等技术任务中表现出色。在第三方基准测试中,DeepSeek-R1 在逻辑问题解决、数学计算和代码生成方面的表现优于 GPT-4o 和其他领先的 AI 模型。据报道,它在编码竞赛平台 Codeforces 上获得了 2,029 Elo 的分数,超过了 96.3% 的人类参与者。

它集成了思维链 (CoT) 推理,使其能够将复杂的问题分解为分步解决方案,这是 OpenAI 的 o1 模型也关注的关键领域。虽然 OpenAI 的 ChatGPT 在创意写作、对话能力和微妙的类人互动方面仍然表现出色,但 DeepSeek 已经开辟了一个利基市场,成为需要精确、逻辑驱动输出的开发人员、工程师和研究人员的首选 AI。

5. 语言和市场重点

DeepSeek 在服务中文和英文市场方面具有得天独厚的优势。与主要针对英语用户优化的 OpenAI 不同,DeepSeek 在设计上是双语的,在英语和中文任务方面都表现出色。在中文基准测试中,它的表现也优于美国模型,使其成为在中国和其他普通话地区工作的企业和开发人员的有吸引力的选择。

然而,DeepSeek 确实表现出语言混合的倾向,有时甚至在以不同语言给出提示时,也会生成混合英语和中文的响应。这仍然是公司不断改进的限制。

6. 定价

与竞争对手相比,最大的优势是其实惠的定价模式。DeepSeek-R1 以每百万个代币 0.14 美元的价格提供 API 访问,这使其比 OpenAI 的 GPT-4o 便宜得多,后者每百万个代币收费 7.50 美元。这种具有成本效益的定价策略使 DeepSeek 成为寻求高性能 AI 模型的开发人员和企业的有吸引力的选择,而没有与竞争对手相关的高额运营费用。

7. 安全和审查问题

作为一家中国公司,DeepSeek 必须遵守中国严格的互联网法规,DeepSeek 不会回复违反中国法律的查询。

DeepSeek 最近也遇到了麻烦,因为在意大利数据监管机构 Garante 进行隐私调查后,其应用程序被从意大利商店下架。 当局正在调查其数据收集做法,这引发了对遵守欧盟隐私法和潜在安全风险的担忧。

美国已经开始限制Deepseek,中美AI竞争加剧


8. 市场影响和行业颠覆

DeepSeek 的出现已经震撼了全球 AI 市场。DeepSeek-R1 的推出引发了人工智能相关股票的大规模抛售,英伟达的市值损失了 6000 亿美元,原因是担心低成本的人工智能模型可能会减少对昂贵人工智能芯片的需求。







请到「今天看啥」查看全文