专栏名称: 混沌学园
咨询服务
目录
相关文章推荐
混沌学园  ·  DeepSeek开启“开源周”,与我们有什么关系? ·  7 小时前  
孤独大脑  ·  一生赚多少钱才算“足够”? ·  20 小时前  
混沌学园  ·  戴建业混沌开讲:我们为什么爱宋词? ·  昨天  
51好读  ›  专栏  ›  混沌学园

DeepSeek开启“开源周”,与我们有什么关系?

混沌学园  · 公众号  · 学习  · 2025-02-25 20:07

正文


就在刚刚,DeepSeek宣布,从下周开始,他们将开源 5 个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展,并将这一计划定义为“开源周”。

DeepSeek正以开放的姿态参与重构全球AI生态格局。置身于AI时代的我们,不得不思考,如何让DeepSeek参与到我们的事业之中。

“早在这次DeepSeek破圈之前,AI整体的能力就已超过99%的人类。”

“我越研究AI越感觉痛苦,就像举着锤子找钉子,每天都在思索要做点什么。

在长时间的迷茫之后,我才惊觉,最大的机会往往都在自己的认知、自己的专业领域里。”

“如果你开发的功能只能帮企业替换掉10个员工,最好不要做”。

前天,Monica.im产品合伙人张涛老师坐客混沌,以技术演进为脉络,揭示了DeepSeek如何通过「格式激励和结果激励」实现思维链自主进化,并在博士级难题上做到了跨越式突破,其底层逻辑恰似“AI觉醒思考本能”。

张涛老师曾任神策数据副总裁、飞书海外产品负责人、光年之外产品负责人,是一个热爱技术的产品人。 春节之后第一周,他以万字深度拆解DeepSeek R1是怎样炼成的,在创投圈引起广泛讨论。

在这场技术革命中,创业者如何抓住时代红利?张涛的演讲不仅是对DeepSeek的深度解码,更是创业者的行动指南。他提醒我们,在这场AI浪潮中,唯有抓住行业痛点,将AI转化为解决问题的工具,才是定义未来的关键所在。

我们摘取了本次课程中的部分精彩观点,希望深度学习的用户,请前往混沌APP查看课程。

授课老师 | 张涛 MONICA.IM产品合伙人



DeepSeek惊艳全球在于“非共识”的模型训练方法


OpenAI发布了o系列的模型,它在博士级别的难题上的表现远超之前几款,基本上可以达到83分。从以前的13分到现在的83分,这是一个十分夸张的进步, 推动它进步的原因正是我刚刚提到的思维链。

既然思维链这么厉害,那么全世界的AI公司应该都会竭尽全力实现。但是该如何实现? OpenAI从2023年年终开始,基本不再对外发布任何的技术报告,在他们发布的最后一篇报告里,有一个很关键的内容,叫过程激励模型(process reward model)。

在提出过程激励模型的同时,OpenAI还放出了过程激励的数据集。自这次报告之后,全球很多厂商都在研究如何通过过程激励复现o1,但做起来才发现极其困难。但是与此同时,有两家厂商却找到了不一样的路径,它们都是我们中国的厂商,一个是Kimi,一个是DeepSeek。

其实这条路径并不复杂,它基于两个最简单的规则: 准确度激励和格式激励。 通俗来说,准确度激励意味着它做对了就奖励,做错了就不奖励;格式激励意味着它在得出最终答案前,还需要进行思考。它们都指向了一个最基本的激励原则——要求做对,并且有好的思考。在给定这两个激励的预设下,训练模型的过程中就发生了一个非常神奇的现象: 随着学习过程的强化,模型产生的思维过程越来越长。这说明由于这两种激励的约束,模型自动意识到了要把题做对的前提是思考的过程要更严谨。


不得不说,这是一个令人震撼的现象。

DeepSeek的出现带给全世界非常大的震撼,因为之前大模型基本上被OpenAI一家统治,而它很大程度上松动了OpenAI一家独大的局面。并且DeepSeek采取了一个开源的姿态,面向全世界,这一举措基本上改变了整个AI行业的底层生态,撬动了整个行业的板块。




AI 创业最好不要先从“降本”切入


我相信从ChatGPT到DeepSeek,AI已经一次又一次地让我们为它震颤。比如它的图像理解能力,能够做到立即做出准确的判断。再比如图像生成能力,也能做到生成惟妙惟肖的人像模型,让我们分不清虚实。甚至现在很多人已经用AI的视频生成能力创作视频内容,讲述一个完整的、有趣的故事。

可以说,三年前的我们都难以想象当前的世界会发生这样的巨变。那么,它带给我们哪些新的可能性?

最直观的影响是降本。比如以前某个岗位需要十个员工接电话,现在只需要一个AI就能搞定。 但这里有一个关键要点,降本从来不是企业思考的核心,没有企业是通过降本实现业务增长的。因为当企业在赚钱的时候,其实不会关心降本,而一旦它开始关注降本,大概率就意味着进入了下行周期。

因此每当有创业者来问我AI创业应该做些什么,我给他们的建议都是“如果你开发的功能只能帮企业替换掉10个员工,最好不要做”。因为中国的劳动力成本本来就不高,替换掉10个员工对企业来说算不上刚需。我们真正需要寻找的是以前10个员工在做的岗位,如果并不是因为公司只想让10个员工做,那么这背后受限于什么要素?比如招不到人,比如管理难度大。如果这个岗位有500人在做就能够带来业务线性增长,就很适合成为AI创业的领域。

所以除了降本增效之外,我认为对于创业者来说, AI最重要的价值是他创造了一种全新的商业模式的可能性,让以前一些因为单位不经济因此无法实现的创业设想变得可行。 这正是这个新时代里赋予我们的机会,而不是用AI换掉几个员工、省掉一点开支,这都是小钱,找到新的商业机会才能赚到真正的大钱。

听到这里,可能会有人想,AI领域这么大有可为,不做AI的话是不是无路可走?其实完全不是这样的。我做AI相关行业已经两年了,这一期间我越研究AI越感觉痛苦,就像举着锤子找钉子,每天都在思索要做点什么。在长时间的迷茫之后,我才惊觉,最大的机会往往都在自己的认知、自己的专业领域里。

给大家举个例子。前年在我研究图像技术时,我发现有种技术可以做到1秒钟生成几十张图,对于我来说这个技术并没有太多用处。所以即使我有这样的技术,但我却并不知道怎么用。后来回重庆的时候我把这项技术演示给当地一个做建筑师的朋友,他十分震惊,立即投入使用。以前他们做一张渲染图是以小时为单位计算时间成本,现在只需要几秒种,并且是实时的。据他反馈,虽然最后的渲染图无法用于施工,但现在与甲方沟通的时候可以从各个角度给出方案,如果有需要修改的部分,可以立即修改。可以说,通过使用AI,极大地提升了他们工作和沟通的效率。






请到「今天看啥」查看全文