放弃英伟达,拥抱DeepSeek,他没有一丝犹豫。
来源:
Rest of the World
编译:
陈骏达
近日科技媒体Rest of the World挖出了DeepSeek团队中多位核心人才的履历。在中国接受本科教育,海外深造,之后又回流中国AI行业,是这些人才们共同的经历。
DeepSeek团队中的潘梓正、Junxiao Song等核心人才都有海外背景。潘梓正曾在英伟达实习,并拿到转正offer,但他
毫不犹豫的选择了加入当时还名不见的经传的DeepSeek
,并成为DeepSeek-VL2、DeepSeek-R1和DeepSeek-R1的核心贡献者。
Junxiao Song则毕业于香港科技大学,加入DeepSeek后他提出了新颖的强化学习算法GRPO,该算法已应用于DeepSeek-R1在内的多款模型的训练。他还在DeepSeek的高效训练、模型蒸馏等工作中扮演重要角色。
Junxiao Song的导师感叹,“
不知何故,DeepSeek吸引了最最优秀的一批人才
”。
DeepSeek凭借独特的公司文化,让员工对自己从事的工作充满热情。创始人梁文锋在采访中透露,与许多中国科技企业不同,DeepSeek不鼓励内部竞争和加班,并给了员工极大的自由度,可以自行选择任务并使用算力。
在南加州大学教授、研究中国科技法规的Angela Zhang看来:“DeepSeek凸显了中国AI人才库的实力,这得益于大量高能力、高技能的软件工程师的支持,我相信这种人才优势将使中国在下一阶段的AI发展中占据强势地位。”
但不在美国公司也能取得成功
2023年,在英伟达实习结束时,潘梓正面临着一个关键抉择:是留在硅谷与世界顶尖的芯片设计师共事,还是回国加入当时还名不见经传的杭州创企DeepSeek?
英伟达高级研究科学家、潘梓正实习期间的导师Zhiding Yu在X平台上回忆,潘梓正几乎没有犹豫,就直接选择了DeepSeek,这件事儿给他留下了极为深刻的印象。Yu在推文中进一步写道,像潘梓正这样的情况越来越普遍,“我们有许多中国的优秀的人才,他们不是非得在美国公司才能取得成功。”
▲Zhidin
g Yu发文回忆他与潘梓正的交集(图源:
X平台)
潘梓正加入DeepSeek不到2年,该公司便因发布了2款先进且成本极低的AI模型而一举成名,这一消息导致英伟达市值蒸发了近6000亿美元。
潘梓正的选择,反映了中国AI顶尖人才中一个日益增长的趋势:
他们拒绝硅谷的工作机会,转而投身中国的AI产业
。在接受Rest of World采访时,有国内科技行业人士认为,在中国工作生活成本更低、离家人也更近,此外,还有机会在职业生涯早期便担任重要职务。DeepSeek的团队中有许多来自中国顶尖大学(如清华大学和北京大学)的年轻毕业生和实习生。
在中国的AI行业中,DeepSeek是一个特例,因为它完全由创始人梁文锋的交易公司幻方量化(High-Flyer)资助。尽管美国禁止中国获取先进芯片,但DeepSeek背后这些年轻、热情的科技工作者仍在努力追赶硅谷的科技巨头。
根据芝加哥智库MacroPolo发布的2023年全球人工智能人才报告,全球近一半的顶尖人工智能研究人员在中国完成了本科学业。中国的大学、国家支持的实验室以及美国科技巨头的在华研究机构(如位于北京的微软亚洲研究院)帮助培养了
大量本土研究人员
。
例如,DeepSeek最新R1模型的核心贡献者Junxiao Song在浙江大学学习自动化,随后于2015年在香港科技大学获得电子与计算机工程博士学位,他的博士生导师Daniel Palomar告诉Rest of World,Junxiao Song坚持不懈,且“非常注重数学”。
▲Daniel Palomar与Junxiao Song的合影(图源:领英)
当Palomar在领英上发帖感叹Junxiao Song在DeepSeek的成就时,另一位前学生评论说,Junxiao Song曾被称为“大师”。Palomar说:“不知何故,DeepSeek吸引了最最优秀的一批人才”。
▲Junxiao Song在实验室的外号是“大师”(图源:领英)
有不少美国科技公司雇佣中国实习生从事AI开发工作,这些实习生要么远程工作,要么在硅谷办公室工作。一位在美国企业工作的中国AI研究员称:“
中国学生工作非常扎实
。”
但当企业向这些实习生提供全职工作机会时,许多人会选择回到中国,许多中国学生对在美国全职工作并不那么感兴趣。近年来,对反移民政策的担忧也阻止了一些中国工程师移居美国。
早期的中国顶尖科技人才更倾向于硅谷的工作,因为那里薪水更高,并且有机会与世界顶级创新者共事,但越来越多的年轻AI工程师选择留在国内。随着中国AI产业的发展,他们也有了更多的机会,可以加入巨头企业或是大量的明星创企。
DeepSeek吸引人才的方式十分独特。根据36氪最近的报道,DeepSeek支付的薪酬甚至要高于字节跳动。与许多中国科技公司不同,
DeepSeek不鼓励内部竞争,也不让工程师长时间工作
。梁文锋在2024年7月接受暗涌采访时称,他让员工自由选择任务并自由使用计算资源。
梁文锋认为,DeepSeek正在解决最困难的问题,所以他们对顶尖人才很有吸引力。
在同一采访中,梁文锋称,开源研究让员工更有自豪感,并提升了公司的声誉。过去几周,一些DeepSeek的研究人员在X平台上获得了数万粉丝,他们讨论研究方法并分享他们的兴奋之情。
当DeepSeek-R1登上大模型竞技场(开启风格控制)榜首时,DeepSeek员工Deli Chan发文感叹:“难以置信的结果,感觉像梦一样——我们的R1模型现在位居世界第一(并开启了风格控制)。我的激动之情难以言表,我只知道我们一直在努力,让开源通用人工智能成为每个人的现实。
当DeepSeek登顶App Store后,他在X平台感叹道:“这一刻对我来说绝对是非凡的。”