专栏名称: 天涯时事
热点事件,经典美文,欢迎关注
目录
相关文章推荐
财宝宝  ·  为什么人到中年了,就没有什么朋友了? ... ·  22 小时前  
龚新宇看楼市  ·  在郊区工作,应该买哪里自住? ·  23 小时前  
财宝宝  ·  这是哪里口音?-20250203131050 ·  2 天前  
51好读  ›  专栏  ›  天涯时事

deepseek震撼登场,中国AI颠覆全球算力市场!

天涯时事  · 公众号  ·  · 2025-02-05 10:06

正文

春节期间最大的新闻莫过于中国出了一款“逆天”的软件:深度求索(deepseek)。

这款软件是我目前见到的最牛的人工智能软件,没有之一。

这个软件出来后,我立刻就进行了试验,我首先试验的就是利用它来写时政类的文章——就我自己感受来说,那肯定是不可能达到我要求的,但是我完全可以把它作为参考。

简单的说就是:它不能完全满足我的需求,但是对我来说具有极大的参考意义。

大家千万不要小看“参考”的价值,你做任何原创性的东西都要参考各种资料——就像大学论文一样,你怎么可能完全不参考别人的?

试验完时政文后,我想到有很多同学都是小学初中的老师,以前和他们聊天的时候总听他们说累,备课累、出试题累,然后我就尝试了下:让deepseek备课和出试题。

结果让我震惊了,只要几分钟时间就能原创一套试卷,就能完成备课:

然后,我就把这个软件的功能发给4个小学老师,他们也都被震惊了,甚至有人发出“担忧”:有了它,还要老师做什么?

这只是这个软件的“缩影”之一,我相信还有很多职业都完全可以在deepseek的帮助下,要么工作量大幅度降低、要么会直接导致一些职业的消失。

我相信很多人也都在网络上看到这个软件的众多“逆天”功能了,但也有一些人根本不知道这个软件(我发给4个老师的时候,他们还都不知道这个软件),所以虽有“狗尾续貂”的嫌疑,我还是想再写点东西,尽量用最容易懂的例子让大家知道这个软件。

这个软件出来后,在极短的时间内就在140多个国家移动应用下载量排行榜上位居榜首。

试问:如果这个软件没有逆天的功能,怎么能在如此短的时间内占据众多国家下载量的榜首的?

由于其功能逆天,6天内让英伟达的股价从142美元跌到116美元,跌幅近20%,市值直接跌掉5500亿美元(约4万亿人民币)——等于两个贵州茅台的市值。

为什么deepseek的出现会让全球市值排名第二的英伟达市值暴跌呢?

英伟达(NVIDIA)的核心业务之一是通过其硬件和软件技术为全球提供高性能的算力支持,尤其是在人工智能(AI)、图形渲染、科学计算等领域。英伟达GPU占据全球AI算力市场约80%份额(2023年数据)。

算力有多重要呢?

举个简单的例子:算盘计算器都可以用来计算,但是它们的算力是完全不一样的。普通人拿着算盘肯定是算不过拿着计算器的,尤其是那种超级大数据的计算。

英伟达芯片的算力非常强大。比如,英伟达的A100、H100等数据中心级GPU,单卡可提供每秒数千万亿次。

说到这,肯定有人会问:英伟达芯片的算力可以达到数千万亿次,有什么东西需要这么大的算力吗?

我们绝大多数人都是普通人,当然用不到如此庞大的算力。但是,很多领域需要用到的算力是异常庞大的,庞大到你无法想象的地步。

我以前在油田工作,我就见识过油田在勘探领域需要用到超级计算机——在涉及地震勘探数据处理的时候,处理一次偏移,一个高算力的工作站需要计算几周,甚至几个月的时间。

很多人不知道,在以前,除了油田,绝大多数领域的数据处理量都没有那么高,所以超级计算机都是首先用于油田的。

比如,1983年中国进口的第一台超级计算机就是由美国克雷公司(Cray)生产制造的Cray-1超级计算机(运算速度每秒1亿次,当时全球顶尖水平)。进口它的最重要的作用之一就是为了提升在石油勘探等领域的数据处理能力。

我们再举个简单的例子:微信图片。

中国微信用户数量非常庞大,有10亿用户,每天每时每刻都要处理大量的文字和图片,1TB的文字需要的计算量就达到10的12次方,千亿级别;而百万图片的计算量更是达到10的15次方,等于100兆。

微信每秒钟都有成千上万的图片需要发送,如果这些图片里面有黄色图片,你说微信能在毫秒级别的时间内识别出它们并禁止发送吗?你说这个算力需要多么强大?

你在微信发黄图的时候,绝大多数时候都能成功发出(慎发,犯法),原因可能就是微信不具备那么强大的算力。

另外,在自动驾驶领域,L4级自动驾驶需在10毫秒内处理8个摄像头、5个雷达、1个激光雷达的TB级数据流,算力需求超过500 TOPS(处理器每秒钟可进行500万亿次操作)。

……

所以,你别看一些芯片的算力非常强大,但在很多时候,它们的这点算力根本是不够用的——单个芯片的算力不够,那么就需要购买无数的芯片组合起来提高算力。

很多公司需要非常庞大的算力,而单个芯片的算力是有限的,所以就需要购买很多英伟达的芯片。

比如,GPT-4等大模型的训练需要数万张GPU并行计算数月,单次训练能耗相当于数百家庭一年的用电量。神经网络参数量从百万级(早期模型)增长到万亿级(如GPT-4),算力需求每3-4个月翻倍(远超摩尔定律)。

所以,你别看很多芯片的算力很强大,但在很多领域,这些算力压根就不够看的。

算力固然重要,但是算法有时也很重要。

同样的一个计算题,采取不同的算法,需要的算力和时间可能差异非常大。

举个简单的例子:1+2+3+4……+99=?

这时就有两种算法:

一种就是按顺序相加1+2=3,3+3=6,6+4=10……4851+99=4950;还有一种就是(1+99)×49+50=4950。

很明显,后面的一种算法需要的算力和时间是非常小的。

deepseek做了一件什么事呢?

对的,就是算法的优化。

deepseek用很小的算力就能达到别人需要很大算力才能得到的正确答案。

这会导致什么后果?

原本你需要用两个计算器才能在规定的时间内计算出正确的结果,但是经过算法优化后,你只需要一个计算器就可以完成了。

虽然英伟达的GPU芯片的算力非常大,但在很多应用背景下,这个算力还是不足的,所以你需要购买很多芯片。但是,通过算法优化后,原本需要100块英伟达芯片才能完成的任务,现在只需要50块就能完成了,这样一来你就可以少买50块的芯片。

市场对英伟达芯片的需求下降了,英伟达的利润是不是就少了?股价是不是就下跌了?

除此以外,以前用“算盘”是计算不过来的,但是通过算法优化后,用“算盘”也可以算了,你说美国禁止将“计算器”卖给中国,我们就能被它阻碍前进的步伐了吗?

deepseek最重要的贡献之一就是:我们不需要高端芯片也能达到同样的目标,这让美国对我们的“禁售”失去意义。

中国出现一款deepseek这样强大的智能软件,你说美国人会干啥?

对的,很无耻,美国说deepseek抄袭、偷盗美国公司的技术,并对deepseek进行制裁。另外,网络上的一些殖人、跪族和“二鬼子”也对deepseek进行各种抹黑……

在这样的背景下,deepseek做出一个非常举动:开源。

开源是什么意思呢?

我们举个“饺子的配方”,大家就容易懂了。

比如,你家是开餐馆的,你有一个祖传的饺子配方,做出来的饺子非常好吃,但是这个配方被你锁在保险柜里,除了你自己,谁也不知道你这个饺子是如何做出来的。这就叫做“闭源”。

什么叫“开源”呢?

我把饺子的配方直接公布出来,所有人都可以按照这个配方来调制饺子皮、菜肉馅、水烧到多少度下饺子、蘸料如何制作……所有的东西全部公开。

deepseek开源以后,所有人都知道“饺子”的配方了——你说我的“饺子”配方是抄袭你、偷盗你的,我把配方都公开出来了,抄没抄、偷没偷,是不是一眼就能看出来了?

我的“饺子”就是比你的好吃,我的“饺子配方”就是和你不一样。

deepseek开源以后对美国的一些企业有什么打击呢?

你有一个祖传的饺子配方,做出来的饺子很好吃,别人家的饺子就是不如你家的好吃,你自然可以卖贵点。但是,我的饺子比你更好吃,而且我把配方公布出来了,所有饺子店都可以做出比你家更好吃的饺子,你凭什么还卖那么贵?

所以,deepseek开源后对美国的一些企业会形成重大打击。比如,OpenAI采取闭源商业模型,另外还有Anthropic、WS/Azure、Hugging Face等。

以前你要花很多钱才能吃到他家的“饺子”,现在你只要花很少的钱就能自己包出更好吃的饺子。

说到这,肯定有人会发出一个疑问:deepseek把“配方”都公布出去了,自己岂不是吃亏了?如果deepseek不公布配方,自己卖“饺子”岂不是能赚很多钱?deepseek为什么要公布配方?难道只是为了争一口气?

我们也不知道deepseek的高层到底是如何考虑的,但是原因无非三种:

第一,deepseek高层的格局非常大;

好吃的饺子很贵,我们公布配方后,大家都可以用极低的价格吃到好吃的饺子,这是造福全人类的事情。

第二,我可以损失点,但让你遭受更大损失才是目的;

根据新闻,deepseek的模型训练成本仅约558万美元,仅为GPT-4o的二十分之一。我公开配方后损失很小,但是你的损失就大了。自损100伤敌2000,在中美“敌对”的背景下,这是一件划算的买卖!

第三,免费的往往并不便宜。

依旧以上面的“饺子配方”为例。

deepseek把自己的配方公布出来后,肯定有很多大厨开始使用这个配方,所有人都使用这个配方,那么就会有很多的创新——每个国家,甚至不同地区的人口味可能都不尽相同,他们就会在你家配方的基础上进行创新,最终会形成适合各个国家、地区特有的风味。这会让deepseek更加的强大。

除此以外,deepseek之所以开源肯定有它的过人之处,有别人做不到的地方,它可以依靠那些方面赚钱。虽然配方公开了,但是高筋面粉只有我家能生产——我不卖饺子了,但是我可以卖高筋面粉啊。

还有,我公布饺子配方以后,大家都能看到这个饺子是怎么做出来的,你是不是就不担心里面有各种对人体有害的添加剂了——你使用美国的闭源软件,你怎么知道它没有安装“后门”偷窥你的隐私?

试想,如果你仅仅卖比别人更好吃的饺子,这固然能赚到很多钱。但是,如果全世界的饺子都用你的高筋面粉,你说哪种赚得更多?

有时,免费是为了让你更多的消费。

第四,deepseek公开的并不是最先进的模型。

我有理由怀疑deepseek有更先进的模型没有开源,开源的只是次级版本——我有两种饺子配方,公开的那个很好吃,但更好吃的那个配方我还没有公开。

deepseek开源的目的到底是哪种呢?

我相信,不同的人或许有不同的倾向,但我认为这四种可能都是原因。

不管deepseek的真实目的是什么,都值得我们为之骄傲,因为它是中国人开发的智能软件。

我相信,要不了多久,那些白皮能做的,我们也都能做到,而且做得比它们更好!

油,deepseek!加油,中国人!

-----全文到此为止。如果您想看到更多的原创文章,请点击下面的公众号名片,关注即可。