专栏名称: 程序员专栏
点击关注,进实战技术交流群!分享技术文章、工具资源、精选课程、视频教程、热点资讯、学习资料等。
目录
相关文章推荐
程序员小灰  ·  疯了!下载 DeepSeek 最高判20年! ·  2 天前  
程序员的那些事  ·  热搜第一!DeepSeek百万年薪招AI人才 ... ·  昨天  
鸿洋  ·  关于 2025 副业探索,DeepSeek ... ·  2 天前  
OSC开源社区  ·  DeepSeek R1已在Gitee ... ·  5 天前  
51好读  ›  专栏  ›  程序员专栏

雷军千万年薪“抢人”!传95后AI天才加盟小米,或将领导大模型团队

程序员专栏  · 公众号  ·  · 2024-12-31 18:00

正文

上周,国产大模型 DeepSeek-V3 的发布在国内外 AI 技术圈掀起热议:可比肩 GPT-4o 的性能 + 仅 600 万美元的极低训练成本,使得 DeepSeek-V3 凭借极高性价比获得一众 AI 大佬的肯定。

而作为 DeepSeek-V2 的核 心开发者之一,近日罗福莉这个名字也再度引起广泛关注:据媒体报道,雷军已开出千万年 薪将罗福莉招至麾下,她将就职于小米 AI 实验室,并领导大模型团队。

(图片来自于罗福莉个人公众号)


DeepSeek-V2 核心开发者,曾在 ACL 2019 上发表 8 篇论文

提起罗福莉,相信许多人对她的初次印象都源自于 2019 年的一次知乎热搜:“如何看待北大硕士生在自然语言处理顶级会议 ACL 2019 上发表 8 篇论文?”甚至在这 8 篇论文中,她还是 其中两篇的一作——自此,罗福莉在国际学术界内声名鹊起,也有更多人开始关注这位 95 后 AI 天才的动向。

在罗福莉的个人公众号中,她曾一度回忆了其步入计算机领域的“坎坷历程”:毫无编程基础的她,本科选择了北京师范大学计算机专业,从大一因迷惘而成绩落后,到大二重新振作、努力爬到排名前几,再到大三开启学术生涯、却受到了“你没有天赋做科研”的质疑……与很多人想象中不同,她的编程之旅并不是那么顺利。

好在凭借优异的成绩,罗福莉顺利保研到了北京大学攻读计算语言学硕士学位。也正是在北大攻读硕士期间,她在 ACL 上发表了这 8 篇论文。其中,她身为一作的“一长一短”两篇论文都关于情感细粒度,另外六篇则是二三作,论文方向包括无监督学习、文本风格转换、自然语言生成等——正是罗福莉自身的研究领域:文本风格转换、控制文本生成情感和词义消歧等几个方面。值得一提的是,除了 2019 年在 ACL 发表的 8 篇论文外,罗福莉还在国际人工智能联合会议(IJCAI)、国际计算语言学会议(EMNLP)等顶会也有一作论文发表。

硕士毕业后,罗福莉的职业生涯同样精彩纷呈。她先是在阿里达摩院从事预训练语言模型相关工作,并主导开发了多语言预训练模型 VECO。到了 2022 年,罗福莉又加入 DeepSeek 担任深度学习研究员,参与了 MoE 大模型 DeepSeek-V2 的研发。

今年 5 月 DeepSeek-V2 的发布,让罗福莉再次站在聚光灯下。当时她在知乎上撰文指出,该模型的中文水平处于国内外闭源模型的第一梯队,且性价比极高,价格仅为 GPT-4 的百分之一。

或许正是因为 DeepSeek-V2 的极致性价比,让小米注意到了罗福莉:毕竟无论是最初的造手机还是近几年的造车, 小米也一直都在强调“性价比”,甚至在组建 AI 大模型团队之初,雷军也介绍了其主力突破方向——轻量化。


小米发力 AI 大模型,想要“后发先至”的雄心

因此对于小米而言,若是罗福







请到「今天看啥」查看全文