关注飞总聊IT,了解IT行业的方方面面。
最近,DeepSeek团队的牛逼,从国内迅速传到美国。
DeepSeek是一款最新的开源大模型,由中国公司推出。
DeekSeek 比Meta开源的Llama 3要牛逼,但是训练成本却很低。
在美帝的匿名社交网站Blind上,有人揭秘,Meta内部因为这个事情很多人发疯了。
翻译成中文大概是:
这场风波始于Deepseek v3,它使Llama 4在基准测试中已经落后。更雪上加霜的是,这是一家“名不见经传的中国公司,用了仅仅550万美元的训练预算”。
工程师们正在疯狂地解析Deepseek,试图复制其中的一切内容。我并不是在夸张。
管理层对于为生成式AI部门的巨额开支辩护感到担忧。当每一位生成式AI部门的“领导”薪资都超过了训练Deepseek v3的整体成本时,他们该如何面对高层?而我们这样的“领导”还有几十位。
Deepseek r1让事情变得更加令人恐惧。我不能透露机密信息,但很快就会公开。
本来这应该是一个以工程为核心的小型部门,但由于一群人想要参与这一具有影响力的机会,并人为地扩大了招聘规模,最终大家都成了输家。
总结一下,Meta的生成式AI部门恐慌。一家名不见经传的中国公司,用了550万美元,训练了一个比正在训练中的Llama 4还牛逼的模型。
所以Meta工程师在疯狂抄袭。而管理层不知道为什么Llama要花那么多钱训练。
更奇葩的事情是,Meta有几十位这样的领导,每个领导的薪水,都比训练DeepSeek v3的钱还要多。
所以这些高薪领导怎么面对公司管理层,比如小札呢?
小札也慌了。
扎卡伯格说了这样的话:
简单来说,小札说,DeepSeek很牛逼。政府要下场进一步制裁中国才行,不然的话公平竞争,美国没办法赢中国了。
如果LLM需要美国标准统治世界,而不是中国标准的话,那么美国政府赶紧下场来干死中国政府和中国的公司们吧。
可见,扎克伯格这货,只有在美国公司技术能够比中国公司技术牛逼的时候,才会说我们要公平竞争的环境。
一旦自己打不过了,那就赶紧让美国政府使坏,制裁,出盘外招。
所以,Instgram reels搞不过Tiktok的时候,扎卡伯格就让美国政府立法禁了TikTok。