就在刚刚,DeepSeek宣布,从下周开始,他们将开源 5 个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展,并将这一计划定义为“开源周”。
DeepSeek正以开放的姿态参与重构全球AI生态格局。置身于AI时代的我们,不得不思考,如何让DeepSeek参与到我们的事业之中。
“早在这次DeepSeek破圈之前,AI整体的能力就已超过99%的人类。”
“我越研究AI越感觉痛苦,就像举着锤子找钉子,每天都在思索要做点什么。
在长时间的迷茫之后,我才惊觉,最大的机会往往都在自己的认知、自己的专业领域里。”
“如果你开发的功能只能帮企业替换掉10个员工,最好不要做”。
前天,Monica.im产品合伙人张涛老师坐客混沌,以技术演进为脉络,揭示了DeepSeek如何通过「格式激励和结果激励」实现思维链自主进化,并在博士级难题上做到了跨越式突破,其底层逻辑恰似“AI觉醒思考本能”。
张涛老师曾任神策数据副总裁、飞书海外产品负责人、光年之外产品负责人,是一个热爱技术的产品人。
春节之后第一周,他以万字深度拆解DeepSeek R1是怎样炼成的,在创投圈引起广泛讨论。
在这场技术革命中,创业者如何抓住时代红利?张涛的演讲不仅是对DeepSeek的深度解码,更是创业者的行动指南。他提醒我们,在这场AI浪潮中,唯有抓住行业痛点,将AI转化为解决问题的工具,才是定义未来的关键所在。
我们摘取了本次课程中的部分精彩观点,希望深度学习的用户,请前往混沌APP查看课程。
DeepSeek惊艳全球在于“非共识”的模型训练方法
OpenAI发布了o系列的模型,它在博士级别的难题上的表现远超之前几款,基本上可以达到83分。从以前的13分到现在的83分,这是一个十分夸张的进步,
推动它进步的原因正是我刚刚提到的思维链。
既然思维链这么厉害,那么全世界的AI公司应该都会竭尽全力实现。但是该如何实现?
OpenAI从2023年年终开始,基本不再对外发布任何的技术报告,在他们发布的最后一篇报告里,有一个很关键的内容,叫过程激励模型(process reward model)。
在提出过程激励模型的同时,OpenAI还放出了过程激励的数据集。自这次报告之后,全球很多厂商都在研究如何通过过程激励复现o1,但做起来才发现极其困难。但是与此同时,有两家厂商却找到了不一样的路径,它们都是我们中国的厂商,一个是Kimi,一个是DeepSeek。
其实这条路径并不复杂,它基于两个最简单的规则:
准确度激励和格式激励。
通俗来说,准确度激励意味着它做对了就奖励,做错了就不奖励;格式激励意味着它在得出最终答案前,还需要进行思考。它们都指向了一个最基本的激励原则——要求做对,并且有好的思考。在给定这两个激励的预设下,训练模型的过程中就发生了一个非常神奇的现象:
随着学习过程的强化,模型产生的思维过程越来越长。这说明由于这两种激励的约束,模型自动意识到了要把题做对的前提是思考的过程要更严谨。
DeepSeek的出现带给全世界非常大的震撼,因为之前大模型基本上被OpenAI一家统治,而它很大程度上松动了OpenAI一家独大的局面。并且DeepSeek采取了一个开源的姿态,面向全世界,这一举措基本上改变了整个AI行业的底层生态,撬动了整个行业的板块。
AI 创业最好不要先从“降本”切入
我相信从ChatGPT到DeepSeek,AI已经一次又一次地让我们为它震颤。比如它的图像理解能力,能够做到立即做出准确的判断。再比如图像生成能力,也能做到生成惟妙惟肖的人像模型,让我们分不清虚实。甚至现在很多人已经用AI的视频生成能力创作视频内容,讲述一个完整的、有趣的故事。
可以说,三年前的我们都难以想象当前的世界会发生这样的巨变。那么,它带给我们哪些新的可能性?
最直观的影响是降本。比如以前某个岗位需要十个员工接电话,现在只需要一个AI就能搞定。
但这里有一个关键要点,降本从来不是企业思考的核心,没有企业是通过降本实现业务增长的。因为当企业在赚钱的时候,其实不会关心降本,而一旦它开始关注降本,大概率就意味着进入了下行周期。
因此每当有创业者来问我AI创业应该做些什么,我给他们的建议都是“如果你开发的功能只能帮企业替换掉10个员工,最好不要做”。因为中国的劳动力成本本来就不高,替换掉10个员工对企业来说算不上刚需。我们真正需要寻找的是以前10个员工在做的岗位,如果并不是因为公司只想让10个员工做,那么这背后受限于什么要素?比如招不到人,比如管理难度大。如果这个岗位有500人在做就能够带来业务线性增长,就很适合成为AI创业的领域。
所以除了降本增效之外,我认为对于创业者来说,
AI最重要的价值是他创造了一种全新的商业模式的可能性,让以前一些因为单位不经济因此无法实现的创业设想变得可行。
这正是这个新时代里赋予我们的机会,而不是用AI换掉几个员工、省掉一点开支,这都是小钱,找到新的商业机会才能赚到真正的大钱。
听到这里,可能会有人想,AI领域这么大有可为,不做AI的话是不是无路可走?其实完全不是这样的。我做AI相关行业已经两年了,这一期间我越研究AI越感觉痛苦,就像举着锤子找钉子,每天都在思索要做点什么。在长时间的迷茫之后,我才惊觉,最大的机会往往都在自己的认知、自己的专业领域里。
给大家举个例子。前年在我研究图像技术时,我发现有种技术可以做到1秒钟生成几十张图,对于我来说这个技术并没有太多用处。所以即使我有这样的技术,但我却并不知道怎么用。后来回重庆的时候我把这项技术演示给当地一个做建筑师的朋友,他十分震惊,立即投入使用。以前他们做一张渲染图是以小时为单位计算时间成本,现在只需要几秒种,并且是实时的。据他反馈,虽然最后的渲染图无法用于施工,但现在与甲方沟通的时候可以从各个角度给出方案,如果有需要修改的部分,可以立即修改。可以说,通过使用AI,极大地提升了他们工作和沟通的效率。