专栏名称: 经纬创投
经纬创投公众平台,创享汇,新闻发布官方平台
目录
相关文章推荐
创伙伴  ·  欢迎你也加入创伙伴知识星球 ·  昨天  
铅笔道  ·  北京杀出超级独角兽:一把融资10亿 ·  3 天前  
经纬创投  ·  从 Northvolt ... ·  3 天前  
贵州省通信管理局  ·  工信部组织开展算力强基揭榜行动 ·  3 天前  
贵州省通信管理局  ·  工信部组织开展算力强基揭榜行动 ·  3 天前  
51好读  ›  专栏  ›  经纬创投

DeepSeek开源Day 1,我们聊聊背后的开源精神 |【经纬低调分享】

经纬创投  · 公众号  · 科技投资  · 2025-02-24 11:42

主要观点总结

本文主要介绍了DeepSeek开源工作代码的意义和影响。DeepSeek亮出核弹级技术——FlashMLA正式开源,用于Hopper GPU的高效MLA解码内核,针对可变长度序列进行了优化,并已投入生产。文章深入探讨了开源精神,结合《大教堂与集市》一书的内容,解释了开源的“命运齿轮开始转动”的深层逻辑。DeepSeek的开源举措对行业发展注入了新的活力,并可能引发更大的技术海啸。文章还提到了DeepSeek开源对所有普通用户和企业的影响,包括个性化体验的提升和企业AI应用门槛的降低。最后,强调了开源的重要性,并引用了DeepSeek团队的话作为结尾。

关键观点总结

关键观点1: DeepSeek开源工作代码的意义

DeepSeek将工作代码开源,展示了其工作的全过程,为行业带来了全新的活力,推动了技术的发展。

关键观点2: 开源精神的核心

开源精神是开放、共享、协作的精神,推动了技术的快速发展和创新。

关键观点3: DeepSeek开源的影响

DeepSeek的开源举措对普通用户来说,提高了个性化体验;对企业来说,降低了AI应用的门槛,将渗透到各个场景。

关键观点4: 开源的底层逻辑

开源的底层逻辑是“早发布,常发布”,好的开源项目往往源自开发者的个人需要,而并非单纯的高尚道德。


正文

DeepSeek又「炸」出圈了,这次不是因为功能和逻辑,而是因为一个震撼业界的举动——开源工作代码。


开源第一天,DeepSeek亮出核弹级技术——FlashMLA正式开源!这是用于 Hopper GPU 的高效 MLA 解码内核,针对可变长度序列进行了优化,现已投入生产。


具体亮点:


  • BF16精度全解锁
  • 64位分页KV缓存(内存焦虑退退退!)
  • H800实测炸裂:3000GB/s内存吞吐 + 580T算力天花板!

许多网友发问:为何要将辛苦研发的成果免费分享?背后其实蕴含着深刻的“开源精神”。

提到开源精神,不得不说起经典著作《大教堂与集市》。书中以“大教堂”和“集市”代表两种截然不同的开发模式,为我们展现了开源世界的独特魅力。Linux操作系统的诞生,便是开源精神的生动诠释。1991年,芬兰大学生李纳斯·托瓦兹出于个人对UNIX操作系统的向往,课余用家用电脑编写内核,并分享到互联网社区,吸引众多程序员参与,最终让Linux成长为全球重要的开源操作系统。这一过程完美体现了开源的底层逻辑:源于个人需求、早发布常发布、并非单纯出于高尚道德,而是开发者与社区相互成就。

如今,DeepSeek的开源举措,恰似复刻Linux的传奇之路,却又青出于蓝而胜于蓝。它不仅开源工作成果,还将工作细节毫无保留地公开,让全球开发者能清晰看到其研发过程。这种极致的“早发布,常发布”,为行业发展注入了新的活力。DeepSeek掀起的这场技术海啸才刚刚开始,本篇文章,将深入探究DeepSeek开源背后的故事。 以下,Enjoy:

本文授权转载自公众号“快刀青衣” ‍‍‍‍


最近DeepSeek很火,已经火到了各行各业,以至于有一些很多年没有跟我联系过的好朋友,都开始在微信上私信我:“DeepSeek到底是个啥?”


我大部分时候都会说:“就是一款超强的开源模型,能自己推理、自己思考。开源就是把代码全放出来,大家随便用。”


当我这么说了之后,下一个问题一般都是:“为啥啊?他们做出来的东西为啥免费给别人用啊?”


其实,这背后就是“开源精神”。


可能听到这里,你也好奇,什么是“开源精神”?


对于这个问题,我推荐大家去读一本经典老书,名字叫《大教堂与集市》。


今天,我将结合《大教堂与集市》这本书的内容,跟你科普一下什么是开源精神,也进一步聊聊这轮DeepSeek开源模型的爆火,将对整个社会的技术发展带来什么影响。


01

这里没有象牙塔,只有纯粹的车库精神


在分享本书之前,我先跟大家分享一个最近看到的信息。


昨天中午,2025年2月21日12点,DeepSeek团队在X平台发布了一段英文内容。


我用DeepSeek把它翻译过来了,给大家分享一下:“我们是一个探索通用人工智能(AGI)的小型团队。我们将开源5个代码仓库,以完全透明的方式分享我们微小但真诚的进展。这些在在线服务中经过完整文档记录、部署和生产环境实战检验的基础模块,虽然谦逊但足够坚实。作为开源社区的一员,我们相信每一行共享的代码都将转化为加速探索进程的集体动能。每日解锁即将到来——这里没有象牙塔,只有纯粹的车库精神与社区驱动的创新。”


图片


有些同学可能不是从事软件行业的,我来简单解释一下,DeepSeek说的其实就是:从本周开始,他们将把每天的工作代码开源出来。


能做出这样的行动,是非常有魄力的。


你可能要问,这跟之前开源DeepSeek R1模型有啥区别?


我给你打个比方,之前开源的是工作成果,就像一个老师傅,把他所有的经验无私传授给你。而现在,你不但能拿到老师傅的秘籍,还能看到老师傅在过程中是怎么干活儿的。这对很多人来说,会比结果更有价值。


不出所料,看到这条内容的各国网友都反响热烈。第一条评论就写道:“这才是真正的Open AI!”他们故意把“Open”和“AI”之间加了个空格,这话说得恰到好处,不仅是对DeepSeek的赞美,还顺便对山姆·奥尔特曼率领的OpenAI发起了一波嘲讽。


02

开源的“命运齿轮开始转动”


接下来,咱们进入正题。


咱们先从书名说起,大家可能都会好奇,一本讲技术文化的书,为啥会有“大教堂”和“集市”这两个词?到底是什么意思?


其实,作者是用“大教堂”和“集市”这两种形态,来代表两种不同的开发方式。 “大教堂模式” 就像是一个宏大的规划,先列好长远的目标和计划,可能是五年、十年的打算。然后,一小部分领导或资深专家来主导,下面一层层管理、协作,直到最后按部就班地完成某个任务,等到发布的那一刻,才一鸣惊人。


“集市模式” ,你可以把它想成一个热闹的菜市场,里面有卖菜的、卖鱼的,也有买东西的、闲逛的。这里没有统一的领导,也没有明确的开发目标或盈利方向。大家在这里各自为营,杂乱无章,却依然保持着独特的生命力,充满了无限的可能和活力。

那什么是开源精神呢?


开源,简单来说,就是一个技术人或者团队将自己的所有代码无私公开,全球的开发者都可以免费获取、学习,甚至修改和应用到自己的项目中。 我之前提到过的GitHub就是全球最大的开源社区。


回到《大教堂与集市》这本书,作者埃里克·史蒂文·雷蒙德(通常称为ESR),他不仅是经验丰富的程序员,同时也是开源运动的旗手。


图片


这本书的核心案例是开源操作系统Linux的故事。虽然大部分普通用户对微软的Windows系统或苹果的MacOS更为熟悉,但实际上,我们生活中用到的很多网站服务器、智能家电,甚至路由器的底层系统,都在使用Linux。而且,安卓手机的底层内核也是基于Linux的。所以说,事实上,我们几乎都是Linux的用户,只是很多人并不知情。


而Linux的背后,其实有一段非常有意义的故事。


1991年,一个名叫李纳斯·托瓦兹的芬兰大学生,在课余时间用自己的家用电脑,想体验一下类似早期大型机上才有的UNIX操作系统,于是他开始重新编写内核。


乍一看,这只是个大学生的玩票项目。但他并没有止步于此。他把自己写的源代码上传到了互联网社区上,并且邀请其他程序员一起来改改看。


用一句特别俗套的烂梗,那就是“命运的齿轮开始转动”。 这件事,成了开源运动的重要里程碑。随着越来越多的程序员参与其中,大家一起修复Bug、改进代码,Linux逐渐变得越来越强大。因为每个人都可以看到源代码、修改代码,并将自己的修改贡献回来。随着时间的推移,Linux社区从最初的一个“学生项目”成长为全球最活跃、最成熟的开源操作系统之一。


03

开源,让我印象深刻的三大底层逻辑


当然,除了讲述Linux的故事,这本书还深入探讨了开源的核心理念,并详细解释了为什么开源运动能够取得成功,其中有三条底层逻辑让我印象深刻:


1.好的软件品,往往源自开发者的个人需要


在开源世界里,无论是项目的发起者,还是遍布全球、不计报酬地提交Bug反馈、修复代码的贡献者,很多人参与的动力其实都很简单,就是因为他们自己需要这个工具。


要知道,现实中有大量程序员对自己开发的软件并没有太多热情,他们只是把编程当作一份糊口的工作,每个月拿着不菲的薪水,完成任务就好。但在开源社区,情况完全不同。很多程序员大神,哪怕已经身家千万,依然会无偿更新和维护一些开源项目。 因为他们真正喜欢、真正在乎这个东西,这就是“兴趣使然”的最佳例子。


2.早发布,常发布,倾听用户的反馈


在开源项目的开发模式中,尽早发布和频繁发布是至关重要的。刚开始时,许多成熟的开发者习惯性地认为,软件的早期版本往往会有很多问题。如果提前发布给用户,用户可能会因为体验不佳而流失。


因此,传统的开发模式通常是“大教堂式”的。它们集结精英、集中开发,经过六到八个月的测试,最终才推出一个稳定版本。


而Linux的创新就在于快速发布,最初阶段,甚至一天会发布多次更新。这样,许多早期测试者和项目贡献者能够迅速发现问题并进行修复。


正因如此,Linux的发起人Linus曾提出一句很有趣的话: “只要眼睛多,Bug容易捉。”


在“大教堂”开发模式下,Bug通常藏得很深,难以发现。需要经过多人、几个月的投入和检查,才能揭示出来。


但在集市模式下,如果上千个开发者都在热衷地研究每个新发布的版本,每个人都在不同的设备上运行该系统,那么问题就能被更快发现。而且,发现Bug的人为了自己的使用需求,通常会顺手修复它。

3.免费开源软件,不是因为道德高尚


这本书的作者还强调,千万不要把开源的技术人员或团队当作“利他者”,去夸赞他们的高尚品格。他指出,好的开源项目发起人其实也从中收获了很多,比如圈子里的影响力,或者帮助解决技术难题的人。这与闭源项目一样,只是一种开发选择,并不意味着开源项目比闭源项目更高尚。


当然,作者这样说,显得有些谦虚。在分享自己的开源项目时,他提到,如果你真心承认自己欠了别人很多,你就会发现整个开源社区会认为你是这个软件的发明者,并且在项目运行过程中,收到大量赞美邮件,这些正向反馈会不断涌来。来自全球各地的人会告诉你,你的项目如何帮助了他们。同时,当你采纳了其他人的测试报告或修改的代码时,给予每个贡献者的正反馈也非常强烈。


所以,我相信,DeepSeek这次愿意在本周将他们的代码仓库和工作细节公开出来,一定是因为在过去一个月里,他们收到了大量正向反馈,这激励他们作为开源社区的一员,愿意将自己的每一步探索都贡献出来。


那么,就像当初的芬兰大学生李纳斯·托瓦兹推动“开源”的命运齿轮开始转动一样。你有没有想过,DeepSeek这波操作,又会给全世界带来怎样的影响?会不会新的齿轮已经开始悄然转动?


我认为,一切才刚刚开始。


04

DeepSeek掀起的海啸才刚刚开始


在具体聊DeepSeek开源之前,我想先插播一个题外话。


2024年12月,一部挪威制作的灾难剧集《逃离火山岛》在奈飞上线,讲的是虚构的拉帕尔马岛火山喷发的故事。最开始,山顶的裂缝冒出白烟,裂缝越来越大,最终火山爆发。但奇怪的是,火山爆发并不是整个灾难的高潮。火山灰带着岩石滑入海中,最初就像泥石流一样。但随着波浪不断传递,最后竟然变成了滔天巨浪,席卷邻近的岛屿。


我为啥要说这个评分不高的小众剧集呢?因为当时看到火山爆发的时候,我以为那就是最大的灾难,完全没想到后面竟然会有海啸。现在回头看,DeepSeek的情况其实也差不多,目前的进展就像火山爆发,而真正对各行各业带来的巨大冲击,才刚刚开始。


就比如 DeepSeek要开源他们所有的代码库,这件事对我来说,比之前开源的R1模型更有价值。


为什么呢?很简单,R1只是他们内部训练的成果,拿出来让大家用,你可以在R1的基础上开发自己的产品,这本身就很厉害。但现在,他们不仅仅开源了成果,更是把每天的工作细节都放出来。这意味着什么?如果他们的训练方法行不通,全球的团队可以立马调整方向;如果方法有效,其他团队会立刻受到启发,推动更大的创新。这就体现了“早发布,常发布”的精神, 而DeepSeek做得更极致,他们直接每天都开源代码,持续推进创新。


去年年底,我们还在说,这个AI领域一直没有出现杀手级应用,现在DeepSeek就是第一个杀手级应用了。


在我看来,DeepSeek掀起的海啸主要有以下两波大浪。


第一波,是对普通用户来说,个性化体验将大幅提升。


现在,很多独立开发者或普通用户,都能基于DeepSeek的模型,做很多以前根本无法实现的任务。就像之前开源的AI图像模型Stable Diffusion(我们通常简称SD),它在2022年8月发布后,几个月内就衍生出了各种插画生成应用。而且,更牛的是,在GitHub开源平台上,和SD相关的项目疯长到1000多个。这意味着一个开源项目的成功,激发了更多开源项目的诞生。







请到「今天看啥」查看全文