专栏名称: 飞总聊IT
飞总,从事大数据的基础构架研发10余年。本公众号的主要目的是和大家交流我在大数据基础架构,IT前沿发展,职场经验的方面的观点和看法。本公众号仅代表本人的观点,不代表公司观点。
目录
相关文章推荐
三峡小微  ·  这里的绿电“AI”了“AI”了 ·  昨天  
徐州新闻  ·  抖音、快手同日宣布:下架! ·  昨天  
三峡小微  ·  媒体聚焦:梯级电站保供很给力 ... ·  2 天前  
短剧新圈  ·  2月8日短剧榜: ·  2 天前  
三峡小微  ·  来自地下2600米的温暖 ·  3 天前  
51好读  ›  专栏  ›  飞总聊IT

Meta吓死了,中国赢麻了!!DeepSeek大模型震撼登场!!

飞总聊IT  · 公众号  ·  · 2025-01-25 07:50

正文

关注飞总聊IT,了解IT行业的方方面面。


最近,DeepSeek团队的牛逼,从国内迅速传到美国。


DeepSeek是一款最新的开源大模型,由中国公司推出。


DeekSeek 比Meta开源的Llama 3要牛逼,但是训练成本却很低。


在美帝的匿名社交网站Blind上,有人揭秘,Meta内部因为这个事情很多人发疯了。


翻译成中文大概是:


Meta生成式AI部门陷入恐慌模式

这场风波始于Deepseek v3,它使Llama 4在基准测试中已经落后。更雪上加霜的是,这是一家“名不见经传的中国公司,用了仅仅550万美元的训练预算”。

工程师们正在疯狂地解析Deepseek,试图复制其中的一切内容。我并不是在夸张。

管理层对于为生成式AI部门的巨额开支辩护感到担忧。当每一位生成式AI部门的“领导”薪资都超过了训练Deepseek v3的整体成本时,他们该如何面对高层?而我们这样的“领导”还有几十位。

Deepseek r1让事情变得更加令人恐惧。我不能透露机密信息,但很快就会公开。

本来这应该是一个以工程为核心的小型部门,但由于一群人想要参与这一具有影响力的机会,并人为地扩大了招聘规模,最终大家都成了输家。


总结一下,Meta的生成式AI部门恐慌。一家名不见经传的中国公司,用了550万美元,训练了一个比正在训练中的Llama 4还牛逼的模型。


所以Meta工程师在疯狂抄袭。而管理层不知道为什么Llama要花那么多钱训练。


更奇葩的事情是,Meta有几十位这样的领导,每个领导的薪水,都比训练DeepSeek v3的钱还要多。


所以这些高薪领导怎么面对公司管理层,比如小札呢?


小札也慌了。


扎卡伯格说了这样的话:



简单来说,小札说,DeepSeek很牛逼。政府要下场进一步制裁中国才行,不然的话公平竞争,美国没办法赢中国了。


如果LLM需要美国标准统治世界,而不是中国标准的话,那么美国政府赶紧下场来干死中国政府和中国的公司们吧。


可见,扎克伯格这货,只有在美国公司技术能够比中国公司技术牛逼的时候,才会说我们要公平竞争的环境。


一旦自己打不过了,那就赶紧让美国政府使坏,制裁,出盘外招。


所以,Instgram reels搞不过Tiktok的时候,扎卡伯格就让美国政府立法禁了TikTok。







请到「今天看啥」查看全文