主要观点总结
本文介绍了DeepSeek公司在人工智能领域取得的突破性成果,通过其开源模型V3和R1的表现,打破了李彦宏关于开源模型将越来越落后的预言。DeepSeek的崛起得到了硅谷顶级大佬和机构的高度评价。同时,文章还提到了DeepSeek所面临的竞争对手的质疑以及马斯克、黄仁勋等相关话题。
关键观点总结
关键观点1: DeepSeek公司打破李彦宏的预言
DeepSeek公司通过其开源模型V3和R1的卓越表现,证明了开源模型的巨大潜力,打破了李彦宏关于开源模型将越来越落后的预言。
关键观点2: DeepSeek的崛起得到硅谷大佬的高度评价
DeepSeek公司的成功得到了硅谷顶级大佬如马克·安德森、亚历山大·王等人的高度赞誉,其开源特性被认为是全人类的财富。
关键观点3: DeepSeek面临的挑战与争议
尽管DeepSeek赢得了广泛赞誉,但也面临一些质疑和争议,比如竞争对手对其抄袭的担忧以及马斯克推特上的一种隐晦表达等。
关键观点4: 开源模型的重要性与中国科技界在AI领域的实力展示
DeepSeek的崛起不仅证明了开源模型的巨大潜力,也展示了中国科技界在AI领域的强大实力,在深度学习和人工智能领域的竞争力正在不断提高。
正文
李彦宏曾预言开源模型会落后,DeepSeek 却用实力打破预言在人工智能领域,开源模型与闭源模型的争论一直存在。百度创始人李彦宏曾放言,开源模型会越来越落后,这一观点引发了业界的广泛讨论。然而,不到一年的时间,中国的 AI 初创公司 DeepSeek 用其卓越的表现证明了开源模型的巨大潜力,甚至赢得了硅谷顶级大佬的盛赞。百度创始人、董事长兼首席执行官李彦宏在 2024百度Create AI开发者大会上表示,在当今的大模型生态下,开源模型会越来越落后。他的观点基于开源模型在资源投入、技术更新和商业化应用方面的相对劣势。开源模型通常依赖社区贡献,缺乏集中资源进行大规模优化和迭代的能力,而闭源模型则可以集中资源进行快速迭代和优化。但是李彦宏没想到的是,一年时间不到,来自中国的一个开源模型会横扫大模型圈,那就是DeepSeek V3和DeepSeekSeek R1!
DeepSeek 的崛起可以分为三个阶段:从默默无闻到 V3 一举成名,再到 R1 震惊世界。DeepSeek 由对冲基金经理梁文峰创立,最初并不为人所知。梁文峰在 2021 年开始为他的人工智能副项目购买数千个 Nvidia GPU,同时经营他的量化交易基金幻方。业内人士最初并未对 DeepSeek 抱有太大期望,认为这只是一个亿万富翁的新爱好。2024 年 12 月,DeepSeek 发布了 V3 模型,评测成绩不仅超越了 Qwen2.5-72B 和 Llama 3.1-405B 等顶级开源模型,甚至能与 GPT-4o 和 Claude 3.5-Sonnet 等顶级闭源模型相媲美。V3 模型在数学推理上表现尤为突出,研发成本仅为 558 万美元,训练成本不到 GPT-4o 的二十分之一。2025 年 1 月 20 日,DeepSeek 发布了 R1 推理模型,性能直逼 OpenAI 的 o1 模型。R1 在高难度提示词、代码和数学等技术性极强的领域表现优异,甚至在某些方面超越了 o1 模型。R1 的预训练费用仅为 557.6 万美元,仅是 GPT-4o 模型训练成本的不到十分之一。DeepSeek 的崛起不仅在技术上取得了突破,还赢得了硅谷顶级大佬和机构的高度评价。风险投资巨头马克·安德森(Marc Andreesen)在 X 平台上公开赞赏 DeepSeek R1,称其为“最令人惊叹和印象深刻的突破之一”,并强调其开源特性对全世界都是一份大礼。AI 数据服务公司 Scale AI 创始人亚历山大·王(Alexandr Wang)表示,DeepSeek 在他们的测试中表现最佳,与美国最好的模型相当。他称 DeepSeek-V3 是中国科技界带给美国的苦涩教训,强调中国科技界以更低的成本、更快的速度和更强的实力赶上了美国。亚历山大的意思就是打不过就酸别人是违法用了他们美国最先进的显卡
硅谷知名投资机构 A16z 的合伙人 Anjney Midha 表示,DeepSeek-R1 几乎在一夜之间成为美国顶尖大学研究人员的首选模型。德国马克斯·普朗克量子光学研究所 AI 科学家实验室负责人马里奥·克伦(Mario Krenn)盛赞 DeepSeek-R1 的开放性,相比之下,OpenAI 旗下的模型“本质上都是黑箱”。尽管 DeepSeek 赢得了广泛赞誉,但也引发了一些竞争对手的酸评。OpenAI CEO 萨姆·奥特曼(Sam Altman)曾发推文暗示 DeepSeek 可能抄袭了其他先进成果,但很快被回怼“是指把 Google 发明的 Transformer 架构拿过来用么?”。尽管如此,DeepSeek 收获的赞誉确实是广泛而真诚的,尤其是在开源社区,开发者用脚投票。DeepSeek 的崛起不仅证明了开源模型的巨大潜力,也展示了中国科技界在 AI 领域的强大实力。从默默无闻到 V3 一举成名,再到 R1 震惊世界,DeepSeek 用实际行动打破了李彦宏的预言,赢得了硅谷顶级大佬和机构的高度评价。DeepSeek 将继续在开源模型领域探索,为全球 AI 技术的发展贡献力量。