专栏名称: 三言Pro
提供新科技、新消费、新未来的前沿资讯,一手消息及深度分析,严肃又活泼。
目录
相关文章推荐
闹闹每日星运  ·  星历0208:仙女注意说话分寸 天秤保护个人隐私 ·  4 天前  
闹闹每日星运  ·  休假后找工作最顺利的星座,开干 ·  4 天前  
闹闹每日星运  ·  蛇年12生肖开运指南 ·  2 天前  
闹闹每日星运  ·  星历0209:天蝎整理衣柜 双鱼适合聚会 ·  3 天前  
51好读  ›  专栏  ›  三言Pro

DeepSeek双杀!一夜干翻英伟达近6000亿市值,再发文生图模型,创始人:中国AI不可能永远处于跟随位置

三言Pro  · 公众号  ·  · 2025-01-28 11:22

正文

近日,DeepSeek发布的R1模型可以说对整个科技圈造成了巨大轰动,尤其是一直处于领先地位的美国AI领域。‍‍‍‍

R1模型以更低的价格实现超越多个美国头部模型,而且还完全开源,甚至有美国Meta员工爆料称公司“感到恐慌”。‍‍‍‍‍‍

而本周一,DeepSeek带来的冲击仍在持续,具体表现在美股大跌,尤其是半导体股,从盘前到收盘,一路“绿灯”。‍‍‍‍‍‍

英伟达更是创下周一收跌16.79%,市值蒸发5900亿美元,创下美国金融史记录。‍‍‍‍‍‍‍‍‍

周一收盘美股重挫

英伟达股价报118.42美元,跌幅16.97%,单日蒸发市值近6000亿美元,创美股最高纪录;

台积电股价报192.52美元,跌幅13.23%;

ARM股价报145.96美元,跌幅10.19%;

阿斯麦股价报690.15美元,跌幅5.75%;

美光科技股价报91.11美元,跌幅11.71%。

此外,美股三大指数收盘涨跌不一,道指涨0.65%,标普500指数跌1.46%,纳指跌3.07%。

DeepSeek给了美国科技巨头一点“中国震撼”,英伟达发言人27日表示,“DeepSeek是一项出色的人工智能进步,也是测试时间缩放的完美例子。”“DeepSeek的工作说明了如何使用该技术创建新模型,利用广泛可用的模型和完全符合出口管制的计算。”

再出杀招

进军文生图:发布新开源多模态AI模型

但DeepSeek显然不准备止步于此。‍

1月28日凌晨,DeepSeek发布了名为Janus-Pro和JanusFlow的一系列开源多模态AI模型。

DeepSeek表示,这款大模型是2024年11月发布的JanusFlow大模型的高级版本;相较前代模型,Janus-Pro优化了训练策略、扩展训练数据,模型也更大。Janus-Pro在多模态理解和文本到图像的指令更总功能方面取得重大进步,还增强了文本到图像生成的稳定性。

DeepSeek的展示图显示,在文生图GenEval和DPG-Bench基准测试中,Janus-Pro-7B的准确率较前代Janus大幅提高,准确率测试结果分别为80%和84.2%,高于包括OpenAI DALL-E 3在内的其他对比模型,Janus的准确率分别为61%和79.7%。

其中,Janus-Pro是统一多模态与生成的创新框架,通过解耦视觉编码的方式,提升模型在不同任务中的适配行与性能。

该模型机可适配视觉问答、图像标注等多模态场景。

而JanusFlow是通过生成流与自回归语言模型融合实现统一框架;不仅能处理理解任务,还能够生成高质量图像。

这标志着DeepSeek将进军文生图领域。

DeepSeek 创始人梁文锋:中国AI不可能永远处在跟随位置‍‍

之所以DeepSeek的R1模型能让美国众科技公司关注,而且还对美股造成巨大影响,主要有两个核心原因。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

一是在目前中美都在AI赛道发力的前提下,DeepSeek撼动了美国一直以来保持领先的地位。‍‍

自2022年底GPT3.5发布以来,无论是OpenAI,还是谷歌、苹果,美国科技公司在大模型领域都是引领者姿态;而中国的科技公司虽然也紧随其后地开发出多个大模型,且也有一定的实际应用,但一直处于追赶者地位似乎是圈里共识。‍‍‍‍‍‍‍‍‍‍‍‍‍‍







请到「今天看啥」查看全文