专栏名称: 51CTO官微
51CTO官方公众号——聚焦最新最前沿最有料的IT技术资讯、IT行业精华内容、产品交流心得。本订阅号为大家提供各种技术资讯和干货,还会不定期举办有奖活动,敬请关注。
目录
相关文章推荐
程序员的那些事  ·  “应该禁止所有新项目使用 ... ·  3 天前  
程序员小灰  ·  我的第一个副业是什么? ·  1 周前  
51好读  ›  专栏  ›  51CTO官微

雷军在线挖人,传年薪千万级!DeepSeek 关键骨干罗福莉已离职加入小米,或领军小米大模型团队;小米将在大模型上奋起直追!

51CTO官微  · 公众号  · 程序员  · 2024-12-24 15:46

正文

点击蓝字 关注我们

了解与IT有关的人和事

AI圈的大新闻,雷总在线挖人,小米要发力大模型了!

知情人士称,雷军认为小米在大模型领域发力太晚,于是亲自挖人,重金招募能够领军小米大模型的人才,支付的薪酬水平在千万元级别。

而且雷总已经初战告捷——帮小米赢得了DeepSeek的关键骨干罗福莉。据报道,作为95后的AI“天才少女”,罗福莉或将供职于小米AI 实验室,领导小米大模型团队谁看了不感叹一句年少有为!

目前罗福莉的知乎首页还未修改工作信息

罗福莉是 DeepSeek-V2 的关键开发者之一,在模型发布后,她在知乎回答了相关话题,并且十分“接地气”地宣传V2是“性价比之王”。

不得不说,这种亲切、朴实的互动风格,还挺“米味”满满的。

罗福莉被关注的“传奇人生”自2019年开始,身为北大硕士的她,因在NLP国际顶会ACL 上发表 8 篇论文(其中2篇一作)而迅速走红,受到颇多关注。

毕业后,她又加入阿里达摩院机器智能实验室。罗福莉主导开发的多语言预训练模型 VECO(同时支持多语言理解和生成的跨语言模型),被纳入阿里达摩院深度语言模型体系 AliceMind。

2022 年,罗福莉离开阿里,在 DeepSeek 担任深度学习研究员。

即将加入小米大展拳脚的罗福莉,正印证着自己“不忘初心,一步一个脚印”的诺言。

那么,她将供职的小米 AI 实验室是什么情况,为什么雷军会急着亲自下场广纳人才?

小米目前大模型现状:发力晚、宣传少、依赖合作
不怪雷总着急,相比友商,小米在大模型上的发力确实晚了。
大家猜一下,小米小爱目前用的哪家模型:小米大模型?文心一言?阿里通义?字节豆包?
大概是:全都有。
2023 年 4 月,小米 AI 实验室下设了专门的大模型团队。同年11月,AI实验室主任王斌接受采访时,明确表示过小米不做ChatGPT、不搞AI的军备竞赛。
小米对需要大规模“烧钱”的预训练显得尤为谨慎。“内部认为,轻量级模型亦有其存在的市场空间,且在某些特定任务上相比千亿大模型亦能具备一定的优势。”
当时,王斌透露,“专职大模型团队员工30多人,不会马上极速扩张;这个团队的目标还是通用语言大模型,第一步的目标基座模型参数在几百亿,然后会视前期爬坡结果,再决定下一步投入。”
作为对比,前年11月,vivo已经推出第一代蓝心大模型矩阵,包括十亿、百亿、千亿三个参数量级的五款语言大模型。
并且,在手机厂商中比对,小米大模型也显得太低调,宣传不足。
今年年底的多场旗舰机发布会中,大模型都作为重中之重,使用了大量的篇幅介绍自家的智能技术。而小米15整体的篇幅不足,更别提对大模型的介绍。一方面,这与小米向造车倾斜的转向有关,另外,小米这样做也在考量“产品优先”的原则。
在被询问小米大模型团队,是否会发布阶段性成果时,王斌回复道“跟其他公司不太一样,小米天生带着产品的属性,我相信小米大模型出来的时候,是由产品带着出来。”
在其他手机厂商All in AI时,小米默默地落后了。可能,当今年国产手机纷纷玩起智能体点餐时,小米才警觉其中的差距。
不过,小米的奋起直追,还有很大机会。毕竟小米的“人车家”战略最不缺大模型的落地场景,一旦储备了丰富的人才和技术积累,把这块短板补上来。
米系的小爱同学、IoT、自动驾驶、机器人等等,无数的应用场景能迅速反哺大模型的能力。这也使得小米大模型的上限会很高。
人才调动:发力大模型的信号
根据资料,小米AI实验室大模型团队的负责人是栾剑,向AI实验室主任王斌汇报。
栾剑此前曾担任小米技术委员会 AI 实验室语音生成团队的负责人。在此之前,他曾担任东芝(中国)研究院研究员、微软(中国)工程院高级语音科学家、微软小冰首席语音科学家以及语音团队负责人等职位。
若罗福莉领军大模型团队的消息属实,尚不知道栾剑的任职将如何调动
根据去年的资料,该团队目前AI领域相关人员已超1200人。
相信在雷军给出发力大模型的信号之后,相关人才的招聘会更加如火如荼的进行。
小编在小米招聘的官方页搜索发现,仅北京地区大模型相关岗位就多达59个职位,还开放了众多的负责人等管理岗虚位以待。
其中,大模型技术专家的要求包括,“长期从事自然语言处理、视觉、声学语音等相关领域的研究,对语言大模型或多模态大模型的原理有深刻的理解;”“ 在AI领域的国际顶会或期刊上发表过多篇有影响力的论文”等等。
有兴趣和罗福莉共事的朋友们,可以动手投递了~
https://hr.xiaomi.com/job
有趣的是,我们此前刚刚报道过,阿里通义要发力To C,就是以产品团队从阿里云迁入阿里智能信息事业群为信号的。
而字节在AI上的高举高打,也是从成立Flow新部门,聚焦AI应用层而开始的。
在AI人才对整个产品举足轻重的今天,如何挖到人才,如何设置合理的架构让人才能发挥自己的一技之长,成为大厂们值得思考和研究的课题。

关注51CTO官微

帮助一亿数字化人才终身成长