专栏名称: 51CTO官微

51CTO官方公众号——聚焦最新最前沿最有料的IT技术资讯、IT行业精华内容、产品交流心得。本订阅号为大家提供各种技术资讯和干货，还会不定期举办有奖活动，敬请关注。

雷军在线挖人，传年薪千万级！DeepSeek 关键骨干罗福莉已离职加入小米，或领军小米大模型团队；小米将在大模型上奋起直追！

51CTO官微 · 公众号 · 程序员 · 2024-12-24 15:46

正文

点击蓝字 关注我们

了解与IT有关的人和事

AI圈的大新闻，雷总在线挖人，小米要发力大模型了！

知情人士称， 雷军认为小米在大模型领域发力太晚，于是亲自挖人，重金招募能够领军小米大模型的人才，支付的薪酬水平在千万元级别。

而且雷总已经初战告捷—— 帮小米赢得了DeepSeek的关键骨干罗福莉。 据报道，作为95后的AI“天才少女”，罗福莉或将供职于小米 AI 实验室，领导小米大模型团队！谁看了不感叹一句年少有为！

目前罗福莉的知乎首页还未修改工作信息

罗福莉是 DeepSeek-V2 的关键开发者之一，在模型发布后，她在知乎回答了相关话题，并且十分“接地气”地宣传V2是“性价比之王”。

不得不说，这种亲切、朴实的互动风格，还挺“米味”满满的。

罗福莉被关注的“传奇人生”自2019年开始，身为北大硕士的她，因在NLP国际顶会ACL 上发表 8 篇论文（其中2篇一作）而迅速走红，受到颇多关注。

毕业后，她又加入阿里达摩院机器智能实验室。罗福莉主导开发的多语言预训练模型 VECO(同时支持多语言理解和生成的跨语言模型)，被纳入阿里达摩院深度语言模型体系 AliceMind。

2022 年，罗福莉离开阿里，在 DeepSeek 担任深度学习研究员。

即将加入小米大展拳脚的罗福莉，正印证着自己“不忘初心，一步一个脚印”的诺言。

那么，她将供职的小米 AI 实验室是什么情况，为什么雷军会急着亲自下场广纳人才？

小米目前大模型现状：发力晚、宣传少、依赖合作

不怪雷总着急，相比友商，小米在大模型上的发力确实晚了。

大家猜一下，小米小爱目前用的哪家模型：小米大模型？文心一言？阿里通义？字节豆包？

大概是：全都有。

2023 年 4 月，小米 AI 实验室下设了专门的大模型团队。同年11月，AI实验室主任王斌接受采访时， 明确表示过小米不做ChatGPT、不搞AI的军备竞赛。

小米对需要大规模“烧钱”的预训练显得尤为谨慎。“内部认为，轻量级模型亦有其存在的市场空间，且在某些特定任务上相比千亿大模型亦能具备一定的优势。”

当时，王斌透露，“专职大模型团队员工30多人，不会马上极速扩张；这个团队的目标还是通用语言大模型， 第一步的目标基座模型参数在几百亿，然后会视前期爬坡结果，再决定下一步投入。”

作为对比，前年11月，vivo已经推出第一代蓝心大模型矩阵，包括十亿、百亿、千亿三个参数量级的五款语言大模型。

并且，在手机厂商中比对，小米大模型也显得太低调，宣传不足。

今年年底的多场旗舰机发布会中，大模型都作为重中之重，使用了大量的篇幅介绍自家的智能技术。而小米15整体的篇幅不足，更别提对大模型的介绍。一方面，这与小米向造车倾斜的转向有关，另外，小米这样做也在考量“产品优先”的原则。

在被询问小米大模型团队，是否会发布阶段性成果时，王斌回复道“跟其他公司不太一样， 小米天生带着产品的属性，我相信小米大模型出来的时候，是由产品带着出来。”

在其他手机厂商All in AI时，小米默默地落后了。可能，当今年国产手机纷纷玩起智能体点餐时，小米才警觉其中的差距。

不过，小米的奋起直追，还有很大机会。毕竟小米的“人车家”战略最不缺大模型的落地场景，一旦储备了丰富的人才和技术积累，把这块短板补上来。

米系的小爱同学、IoT、自动驾驶、机器人等等，无数的应用场景能迅速反哺大模型的能力。这也使得小米大模型的上限会很高。

人才调动：发力大模型的信号

根据资料，小米AI实验室大模型团队的负责人是栾剑，向AI实验室主任王斌汇报。

栾剑此前曾担任小米技术委员会 AI 实验室语音生成团队的负责人。在此之前，他曾担任东芝（中国）研究院研究员、微软（中国）工程院高级语音科学家、微软小冰首席语音科学家以及语音团队负责人等职位。

若罗福莉领军大模型团队的消息属实， 尚不知道栾剑的任职将如何调动。

根据去年的资料，该团队目前AI领域相关人员已超1200人。

相信在雷军给出发力大模型的信号之后，相关人才的招聘会更加如火如荼的进行。