近日,DeepSeek发布的R1模型可以说对整个科技圈造成了巨大轰动,尤其是一直处于领先地位的美国AI领域。
R1模型以更低的价格实现超越多个美国头部模型,而且还完全开源,甚至有美国Meta员工爆料称公司“感到恐慌”。
而本周一,DeepSeek带来的冲击仍在持续,具体表现在美股大跌,尤其是半导体股,从盘前到收盘,一路“绿灯”。
英伟达更是创下周一收跌16.79%,市值蒸发5900亿美元,创下美国金融史记录。
周一收盘美股重挫
英伟达股价报118.42美元,跌幅16.97%,单日蒸发市值近6000亿美元,创美股最高纪录;
台积电股价报192.52美元,跌幅13.23%;
ARM股价报145.96美元,跌幅10.19%;
阿斯麦股价报690.15美元,跌幅5.75%;
美光科技股价报91.11美元,跌幅11.71%。
此外,美股三大指数收盘涨跌不一,道指涨0.65%,标普500指数跌1.46%,纳指跌3.07%。
DeepSeek给了美国科技巨头一点“中国震撼”,英伟达发言人27日表示,“DeepSeek是一项出色的人工智能进步,也是测试时间缩放的完美例子。”“DeepSeek的工作说明了如何使用该技术创建新模型,利用广泛可用的模型和完全符合出口管制的计算。”
再出杀招
进军文生图:发布新开源多模态AI模型
但DeepSeek显然不准备止步于此。
1月28日凌晨,DeepSeek发布了名为Janus-Pro和JanusFlow的一系列开源多模态AI模型。
DeepSeek表示,这款大模型是2024年11月发布的JanusFlow大模型的高级版本;相较前代模型,Janus-Pro优化了训练策略、扩展训练数据,模型也更大。Janus-Pro在多模态理解和文本到图像的指令更总功能方面取得重大进步,还增强了文本到图像生成的稳定性。
DeepSeek的展示图显示,在文生图GenEval和DPG-Bench基准测试中,Janus-Pro-7B的准确率较前代Janus大幅提高,准确率测试结果分别为80%和84.2%,高于包括OpenAI DALL-E 3在内的其他对比模型,Janus的准确率分别为61%和79.7%。
其中,Janus-Pro是统一多模态与生成的创新框架,通过解耦视觉编码的方式,提升模型在不同任务中的适配行与性能。
该模型机可适配视觉问答、图像标注等多模态场景。
而JanusFlow是通过生成流与自回归语言模型融合实现统一框架;不仅能处理理解任务,还能够生成高质量图像。
这标志着DeepSeek将进军文生图领域。
DeepSeek 创始人梁文锋:中国AI不可能永远处在跟随位置
之所以DeepSeek的R1模型能让美国众科技公司关注,而且还对美股造成巨大影响,主要有两个核心原因。
一是在目前中美都在AI赛道发力的前提下,DeepSeek撼动了美国一直以来保持领先的地位。
自2022年底GPT3.5发布以来,无论是OpenAI,还是谷歌、苹果,美国科技公司在大模型领域都是引领者姿态;而中国的科技公司虽然也紧随其后地开发出多个大模型,且也有一定的实际应用,但一直处于追赶者地位似乎是圈里共识。