专栏名称: AI领域技术栈
人工智能领域技术:计算机视觉、自然语言处理、深度学习、语音识别、生物识别、大数据、图像识别、机器人过程自动化、知识图谱、人机交互、强化学习、神经网络、决策树、语音合成、虚拟代理、自主无人系统技术、自动驾驶、脑机接口、语义理解、遗传算法
目录
相关文章推荐
51好读  ›  专栏  ›  AI领域技术栈

全球AI界掀起DeepSeek复现狂潮,中国AI再次震撼世界!

AI领域技术栈  · 公众号  ·  · 2025-01-27 09:55

正文

在这个科技日新月异的时代,每一个小小的突破都可能引发一场行业的地震。最近,一个名为DeepSeek的AI项目在全球范围内掀起了复现狂潮,不仅让硅谷巨头们感受到了前所未有的压力,更让全世界的目光聚焦在了中国AI的发展上。今天,就让我们一起深入探讨这场由DeepSeek引发的AI风暴,看看它究竟是如何改变我们对AI的认知,以及它背后的意义和影响。

DeepSeek复现狂潮席卷全球

就在不久前,网上突然出现了一波复现DeepSeek的狂潮。UC伯克利、港科大、HuggingFace等国内外知名学府和机构纷纷加入其中,他们用自己的实力证明了DeepSeek的可行性和影响力。这个项目的核心在于,它仅通过强化学习,没有监督微调,就能实现模型的自我验证和搜索。更令人震惊的是,这一过程的成本竟然不到30美元!

这无疑是对传统AI大模型算力战的一次颠覆。在过去,拥有强大算力的公司才能在AI领域占据一席之地。然而,DeepSeek的出现打破了这一规则,它证明了即使在没有顶级芯片的情况下,也能训出具有突破性的模型。这无疑是对美国AI霸权的一次有力挑战,也让全球AI界看到了新的希望。

UC伯克利TinyZero项目:30美元见证“啊哈时刻”

在这场复现狂潮中,UC伯克利的TinyZero项目无疑是最引人注目的之一。该项目由博士生潘家怡和另两位研究人员共同完成,他们在CountDown游戏中成功复现了DeepSeek R1-Zero。
在实验中,他们采用了R1-Zero算法,给定一个基础语言模型、提示和真实奖励信号,运行强化学习。然后,将其应用在CountDown游戏中(这是一个玩家使用基础算术运算,将数字组合以达到目标数字的游戏)。结果令人振奋!模型从最初的简单输出开始,逐步进化出自我纠正和搜索的策略。在消融实验中,他们发现从1.5B开始,模型就学会了搜索、自我验证和修正其解决方案,从而获得更高的分数。

这一过程中最令人兴奋的时刻就是“啊哈时刻”的出现。当模型在训练中突然展现出自我反思和修正能力时,整个团队都为之振奋。而这一切,竟然只花费了不到30美元的成本!这无疑是对传统AI研发模式的一次巨大冲击。

港科大团队复刻DeepSeek-R1:7B模型惊艳表现

港科大助理教授何俊贤的团队同样在这场复现狂潮中表现出色。他们只用了8K个样本,就在7B模型上复刻出了DeepSeek-R1-Zero和DeepSeek-R1的训练。结果令人惊喜——模型在复杂的数学推理上取得了十分强劲的结果。
在AIME基准上,该模型实现了33.3%的准确率;在AMC上,准确率为62.5%;在MATH上,更是高达77.2%。这一表现不仅超越了Qwen2.5-Math-7B-Instruct,甚至还可以和使用超过50倍数据量和更复杂组件的PRIME和rStar-MATH相媲美!

在研究过程中,他们发现模型在训练到第44步时出现了“啊哈时刻”,开始展现出自我反思和更长的CoT推理能力。这一发现无疑为DeepSeek的复现和应用提供了更加坚实的理论基础。

HuggingFace官宣复刻DeepSeek R1:全开源引发热议







请到「今天看啥」查看全文