专栏名称: 西部财经融媒
西部时报社融媒体中心帐号
目录
相关文章推荐
量子位  ·  AI ... ·  昨天  
宝玉xp  ·  能捡狗屎就更好了//@t0mbkeeper: ... ·  2 天前  
科技美学官方  ·  抹黑小米SU7事件迎来结局 ·  3 天前  
量子位  ·  DeepSeek-R1持续震撼硅谷:跻身竞技 ... ·  3 天前  
51好读  ›  专栏  ›  西部财经融媒

DeepSeek超越ChatGPT,中美科技差异缩小?全球AI大模型陷入军备竞赛

西部财经融媒  · 公众号  · AI 科技自媒体  · 2025-01-27 11:19

主要观点总结

中国人工智能初创公司深度求索(DeepSeek)开发的DeepSeek应用近期在苹果应用商店下载量超过ChatGPT,引发全球关注。其最新推出的推理大模型DeepSeek-R1凭借性能与开源特性在海外开发者社区引起热烈反响。DeepSeek的大模型脱颖而出之处在于其完全开源的代码和训练方法,提高了技术透明度,降低了开发者迭代成本,并有助于防止垄断。全球人工智能大型语言模型数量持续增长,中国在这一领域的作用日益显著,中美在人工智能领域的差距正在缩小。然而,专家也提醒关注从0到1的创新能力。

关键观点总结

关键观点1: DeepSeek应用登顶苹果应用商店下载排行榜

深度求索公司开发的DeepSeek应用在美国和中国地区应用商店免费App下载排行榜上取得领先位置,特别是在美区下载榜上超越了ChatGPT。

关键观点2: DeepSeek-R1大模型性能与开源特性引发关注

DeepSeek发布的推理大模型DeepSeek-R1在数学、代码、自然语言推理等任务上的性能比肩OpenAI模型,并完全开源,允许用户任意使用和修改,引发海外开发者社区的热议。

关键观点3: 开源模型的优势

开源模型能提高技术透明度,降低迭代成本,防止垄断。DeepSeek的服务器局部服务波动问题迅速得到解决,反映了新模型发布后访问量的激增。

关键观点4: 全球人工智能大型语言模型增长与中美差距缩小

全球人工智能大型语言模型数量增长迅速,中国在这一领域的贡献显著。中美在人工智能领域的差距正在缩小,但专家提醒仍需关注从0到1的创新能力。


正文

点击蓝字,关注我们

全球AI大模型的开发长期以来陷入了一场关于顶尖人才、先进算力和巨额投资的军备竞赛,而DeepSeek横空出世,以“四两拨千斤”的方式快速突进。


在过去的一周中,中国的人工智能大模型是硅谷乃至全世界科技人士热议的话题。而引爆这一讨论的是中国的人工智能初创公司深度求索(DeepSeek)。


据澎湃新闻,1月27日,由国产大模型公司杭州深度求索开发的DeepSeek应用登顶苹果中国地区和美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。


Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。

1月20日,该公司正式发布推理大模型DeepSeek-R1。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。

目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。

“开源的胜利”

除了极致性价比,让DeepSeek的大模型脱颖而出的是其代码和训练方法的完全开源。


开源即将模型的源代码和技术细节公开,并允许用户根据其自身需要对模型进行任意使用和修改,这被认为有提高技术透明度,让用户更容易、更便宜地使用,惠及开发者降低迭代成本,防止垄断等好处。而闭源模型的源代码和技术细节则完全被其提供商控制,不对外进行公开,也不允许用户对这些模型本身进行更改。


目前,DeepSeek-R1已经一跃成为开源社区Hugging Face上下载量最高的大模型,下载量达10.9万次,这意味着全球的开发人员正在试图了解这一模型以辅助他们自己的AI开发。DeepSeek的服务器也于26日出现了局部服务波动。这一问题在数分钟内得到解决,或与新模型发布后的访问量激增有关。


DeepSeek创始人梁文锋在接受媒体采访时也表示:“在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。”


梁文锋认为:“开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。”


根据中国信息通信研究院去年发布的白皮书,全球人工智能大型语言模型数量已达 1328个,其中36%来自中国。这使中国成为仅次于美国的第二大人工智能技术贡献者。阿里云已发布100多个新的开源AI模型,支持29种语言,并满足各种应用需求,包括编码和数学。同样,中国的Minimax和01.AI(零一万物)等初创公司也开源了它们的模型。


中美科技差异缩小


随着中国公司陆续发布兼具性能与价格优势甚至开源的大模型,中美在人工智能上的差距正在缩小。斯托伊卡表示,“我认为这一趋势已经非常明显了。根据LLM Arena的结果,在过去的一年里,中国的开源模型从垫底者一跃成为排行榜上的佼佼者,至少在Meta发布其新的Llama模型之前是这样。”


很多反馈显示,DeepSeek的动作让Meta的生成式AI团队“陷入恐慌”。Meta CEO扎克伯格宣布加速研发Llama 4,计划投资650亿美元扩建数据中心,并部署130万枚GPU以“确保2025年Meta AI成为全球领先模型”。


不过,多名专家表示,仍需要关注中国的人工智能实现“从0到1”的能力。


以DeepSeek-V3为例,根据其技术报告,该模型的正式训练成本约为558万美元,但这一数据并不包括架构、算法、数据相关的前期研究和消融实验的成本。而对于大模型训练来说,尽管无效路径和探索会浪费大量算力,但没有这种“浪费”也难以取得最后的突破。


目前看来DeepSeek的大模型起到了加速创新的作用,但这种创新目前只在对从1到10的“复现”类工作得到验证。


“中国的复现是很快的。” 有关人士表示“复现”的难度低于做“新发现”级别的难度。未来中国的人工智能研究者需要更加关注从0到1的工作。


上述人士表示,中国跟美国目前在人工智能上的差距,在最前沿大模型上,存在着6个月到9个月的差距,但多种大模型之间的良性竞争,能更好地促进人工智能在全世界的使用。



来源:第一财经、财联社

排版:西部小柴

审核:溪溪








关注西部

财经融媒


视频号:西部财经融媒

头条号:西部财经融媒

百家号:西部财经融媒