专栏名称: 人工智能那点事
专注国内外AI人工智能、机器人、AR/VR、无人驾驶、深度学习、5G、智能制造、新零售等前沿科技报道。
目录
相关文章推荐
宝玉xp  ·  Andrej Karpathy ... ·  昨天  
爱可可-爱生活  ·  【[118星]OpenLDK:用Common ... ·  2 天前  
新智元  ·  微软官宣All in智能体,SWE ... ·  2 天前  
爱可可-爱生活  ·  通俗版解读 查看图片-20250207091030 ·  3 天前  
51好读  ›  专栏  ›  人工智能那点事

彻底爆发!DeepSeek超越ChatGPT登顶,中国“神秘力量”震动美国科技圈!

人工智能那点事  · 公众号  · AI  · 2025-01-27 12:26

正文


近日,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”,在外网,DeepSeek被不少人称为“神秘的东方力量”。


1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜, 在美区下载榜上超越了ChatGPT。 同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。


苹果美国区应用商店


苹果APP Store中国区免费榜


1月27日

相关微博热搜刷屏



游戏科学创始人、CEO

《黑神话:悟空》制作人冯骥

评价DeepSeek:

可能是个国运级别的科技成果



DeepSeek是啥?


DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。


去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发帖称, DeepSeek-V3是中国科技界带给美国的苦涩教训。 “当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”


不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。


据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。 在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。


这一模型发布后,引发了海外AI圈众多科技大佬的讨论。例如,英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”


证券时报

DeepSeek为何突然爆火?


26日, DeepSeek出现了短时闪崩现象。 不少网友反映,使用时遇到 “服务器繁忙” 的提示。


对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后, 用户访问量激增, 服务器一时无法满足大量用户的并发需求。不过,官方状态页并未将这一事件标记为事故。



据了解,此前DeepSeek在美区榜单的排名并无特别突出表现,处于稳步上升阶段,但未进入前十。此次突然蹿升,与其近期一系列突出表现有直接关系。


据悉,“DeepSeek爆火的原因主要可以归结为两点: 性能和成本。 ”萨摩耶云科技集团首席经济学家郑磊告诉记者。DeepSeek解释称,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。这种卓越的性能不仅吸引了科技界的广泛关注,也让投资界看到了其巨大的商业潜力。


更为关注的是,DeepSeek R1真正与众不同之处在于它的成本——或者说成本很低。DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek公布了API的定价,每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一,也因此, DeepSeek被称为AI界的“拼多多”


郑磊直言, DeepSeek对硬件市场产生了重大影响,因为它可能会降低人工智能模型的硬件成本,从而推动人工智能技术的发展。


团队不到140人

都来自国内顶尖高校


DeepSeek之所以能取得这些创新并非一日之功,而是“孵化”数年之久,长期谋划后的结果。DeepSeek创始人梁文锋也是头部量化私募幻方量化的创始人。Deepseek充分利用了其幻方量化积累的资金、数据和卡。

梁文锋本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。 2023年7月,DeepSeek正式成立,进军通用人工智能领域,至今从未对外融资。







请到「今天看啥」查看全文