出品 | 电商头条 作者 | 青云
春节前夕,一股“来自东方的神秘力量”在全球科技界掀起了轩然大波,它就是国产人工智能大模型DeepSeek(深度求索)。
自1月20日正式发布以来,DeepSeek-R1就迅速在海内外爆火。
2月,据彭博社消息,由DeepSeek开发的人工智能助手在全球引发关注,迅速登顶140个国家的苹果App Store下载排行榜首位,在美国的Android Play Store中也位居榜首。
巨大的讨论声背后,自然是因为它好用。据了解,R1模型在技术上实现了重要突破——用纯深度学习的方法让AI自发涌现出推理能力,也就是更懂人话,更会思考。
有业内人士分析,DeepSeek的价值不仅在于技术突破,更在于
DeepSeek以更低的成本、更高的模型性能和对芯片性能更低的要求,以及开源战略,为AI行业带来了“鲶鱼效应”。
DeepSeek好评如潮。游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价道:
可能是个国运级别的科技成果。
冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”
360集团创始人周鸿祎也连发多个视频专门聊了聊DeepSeek,他还宣布将无偿为DeepSeek提供全方位网络安全防护。
与此同时,
DeepSeek也成了各大企业争相合作的香饽饽。
2月5日,京东云已正式上线DeepSeek-R1和DeepSeek-V3模型。此前,包括腾讯云、阿里云、360、华为云、百度智能云等大厂也已经相继宣布牵手DeepSeek。另外,微软、英伟达、亚马逊、英特尔、AMD等科技巨头也已于近日上线DeepSeek模型服务。
另外,
DeepSeek也明显给ChatGPT带来了压力。
2月,据CNBC消息
,在线分析平台
Semrush所追踪到的一项数据动态显示
:尽管
ChatGPT在用户活跃度方面仍然稳坐头把交椅,日均访问量维持在数千万的高位,但其流量却悄然出现了下滑趋势,而与此同时,一个名为DeepSeek的新兴平台正迅速崛起,挑战着ChatGPT的霸主地位。
为了应对压力,OpenAI CEO奥特曼宣布:ChatGPT 的免费用户将获得 o3-mini!(而 Plus 会员将享受大量的 o3-mini 使用权限)。
据媒体消息,当天o3-mini发布会后,奥特曼携众高管,在社交平台Reddit回答了网友们的提问。
被问及对DeepSeek的评价,奥特曼表示,
“这是一个非常好的模型!我们将生产出更好的模型,但领先优势将比前几年有所减弱。”
鉴于DeepSeek在开源领域取得的成功,奥特曼在回答是否会公开一些大模型权重的问题时说,“我个人认为在(开闭源)这个问题上我们站在了历史的错误一方,需要找出一个不同的开源策略。不过不是所有OpenAI的人都同意这个观点,而且目前这也不是我们最高优先级。”
2月6日,OpenAI宣布所有用户无需注册均可免费使用ChatGPT搜索功能。有观点认为
,
OpenAI急于推出免费的搜索引擎与DeepSeek的爆火有一定的关系。
广东85后一鸣惊人
DeepSeek的崛起是中国AI领域乃至全球科技界的一次重大突破与亮点。这一成就的背后,自然离不开创始人和领导团队的智慧与努力。
公开资料显示,Deepseek,全称为杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月,是一家创新性科技公司,专注于开发先进的大语言模型和相关技术。
天眼查信息显示,该公司背后的实控人为梁文锋。
梁文锋正是大模型DeepSeek的创始人。
今年春节,梁文锋也回到了家乡——广东省湛江市吴川市覃巴镇米历岭村过年。据透露,除夕前几天梁文锋就回到了吴川,1月27日下午还与旧时同学、好友一起踢足球。另据媒体消息,梁文锋于1月28日(除夕)回到米历岭村过年,1月29日(大年初一)上午离开家乡。
梁文锋,1985年出生于广东湛江吴川,父母都是小学语文老师。他从小成绩优异,一直是学校里的“尖子生”。据湛江发布消息,梁文锋的老师透露,“他初中就学完高中的数学,甚至已经开始学大学的数学,数学思维能力很强。”
2002年,17岁的梁文锋以吴川一中“高考状元”的成绩考上浙江大学本科电子信息工程专业,于2006年考上浙江大学信息与通信工程专业研究生。
据梁文锋的校友回忆,
“当时,AI在国内仍然是一个冷门领域,但他却坚信这是未来的趋势。连他的毕业论文都聚焦于低成本摄像机的算法优化。”
研究生毕业后,梁文锋先后在网易、阿里巴巴等互联网企业积累了工作经验,随后便选择创业,进入了金融领域。
2013年,他与浙大同学徐进共同创立了杭州雅克比投资管理有限公司。2015年,又成立了杭州幻方科技有限公司(即幻方量化),致力于通过数学和AI进行量化投资。
2016年,幻方量化首次上线AI策略,并在之后实现投资策略全面AI化,同时也是国内唯一公开宣称拥有万张英伟达A100显卡的企业。2018年,幻方量化首次获得私募金牛奖,这是中国私募证券领域的最高奖项。
梁文锋还在金牛奖颁奖仪式上发表了主题演讲《一名程序员眼里中国量化投资的未来》。当时,梁文锋在演讲中表示,
“量化投资的未来,是用技术让市场更有效率”。
图源:中国证券报
最后,梁文锋说幻方量化的使命就是:提高中国二级市场的有效性。
到了2023年,ChatGPT横空出世,搅动风云,不少大佬纷纷开启AI创业。梁文锋也顺应时代潮流,开启了自己的创业之路。2023年4月,梁文锋宣布正式进军通用人工智能领域,
“追寻一直以来的技术理想,超越投资去直面更大的课题”。
很快,2023年7月,DeepSeek成立。紧接着,同年11月,DeepSeek 发布了开源的代码大模型。不过,整体来看,2023年,DeekSeek并没有在市场激起太大水花。
直到2024年5月,DeepSeek发布DeepSeek-V2开源MoE模型,因成本价格低廉,引发关注。
对此,梁文锋表示:“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。”他表示,没想到价格让大家这么敏感。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。
12月26日,圣诞节过后,深度求索发布了大模型DeepSeek V3,靠着不到OpenAI研发费用十分之一的成本,
业内人士将DeepSeek称为“AI界的拼多多”,也被海外称作“来自东方的神秘力量”。
2025年1月20日,深度求索发布了全新的DeepSeek-R1模型,表现惊人,全球资本市场都被这匹来自中国AI圈的黑马震惊到了。在这场AI大战中,DeepSeek的名声已经彻底打响了。
1月20日,梁文锋还以DeepSeek创始人的身份参加了一场我国超高规格座谈会,并现场发言。
图源:新闻联播
梁文锋在接受媒体访谈时曾表示,
在颠覆性的技术面前,闭源形成的护城河是短暂的。
即使OpenAI闭源,也无法阻止被别人赶超。“开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。”
他还表示,
中国AI不可能永远处在跟随的位置
,“很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。”
时至今日,梁文锋的锋芒再也藏不住了。
值得一提的是,
DeepSeek团队也是卧虎藏龙,聚集了一群AI天才。
据了解,DeepSeek包括创始人梁文锋在内,仅有130多名工程师和研究人员。据悉,DeepSeek员工85%以上拥有硕士学位,40%以上有博士学位。团队成员平均年龄约为28岁,90后占比超75%,95后(1995年后出生)员工占比50%以上。
该公司成员大多毕业于北大、清华、中科大等国内顶尖院校,也有少数毕业于麻省理工学院、卡内基梅隆大学等海外知名高校。
另外,据媒体消息,去年年底,雷军开出千万年薪招募的罗福莉也被挖出曾经是DeepSeek的成员,参与研发了大模型DeepSeek V2。不过,罗福莉是否跳槽,加入了小米集团,尚未有明确的消息。
现在,
DeepSeek还在招兵买马。
近日,不少媒体爆料,在招聘平台上,DeepSeek正有超过50个岗位在招人,其中“深度学习研究员-AGI”一职月薪最高甚至达到11万元,年薪百万。
根据该岗位介绍,这还是DeepSeek唯一一个明确提供开放实习的职位,据业内人士透露,顶尖高校的在校生如果通过校招拿到了DeepSeek的Offer,在校实习期间就可以享受到与正式入职时相同的工资。
招兵买马,扩大团队,我们期待梁文锋带领自己的团队不断探索新技术、新应用,努力将DeepSeek打造成为全球AI领域的佼佼者。