AI圈的大新闻,雷总在线挖人,小米要发力大模型了!
知情人士称,雷军认为小米在大模型领域发力太晚,于是亲自挖人,重金招募能够领军小米大模型的人才,支付的薪酬水平在千万元级别。
而且雷总已经初战告捷——帮小米赢得了DeepSeek的关键骨干罗福莉。据报道,作为95后的AI“天才少女”,罗福莉或将供职于小米AI 实验室,领导小米大模型团队!谁看了不感叹一句年少有为!
目前罗福莉的知乎首页还未修改工作信息
罗福莉是 DeepSeek-V2 的关键开发者之一,在模型发布后,她在知乎回答了相关话题,并且十分“接地气”地宣传V2是“性价比之王”。
不得不说,这种亲切、朴实的互动风格,还挺“米味”满满的。
罗福莉被关注的“传奇人生”自2019年开始,身为北大硕士的她,因在NLP国际顶会ACL 上发表 8 篇论文(其中2篇一作)而迅速走红,受到颇多关注。
毕业后,她又加入阿里达摩院机器智能实验室。罗福莉主导开发的多语言预训练模型 VECO(同时支持多语言理解和生成的跨语言模型),被纳入阿里达摩院深度语言模型体系 AliceMind。
2022 年,罗福莉离开阿里,在 DeepSeek 担任深度学习研究员。
即将加入小米大展拳脚的罗福莉,正印证着自己“不忘初心,一步一个脚印”的诺言。
那么,她将供职的小米 AI 实验室是什么情况,为什么雷军会急着亲自下场广纳人才?
小米目前大模型现状:发力晚、宣传少、依赖合作不怪雷总着急,相比友商,小米在大模型上的发力确实晚了。大家猜一下,小米小爱目前用的哪家模型:小米大模型?文心一言?阿里通义?字节豆包?2023 年 4 月,小米 AI 实验室下设了专门的大模型团队。同年11月,AI实验室主任王斌接受采访时,明确表示过小米不做ChatGPT、不搞AI的军备竞赛。小米对需要大规模“烧钱”的预训练显得尤为谨慎。“内部认为,轻量级模型亦有其存在的市场空间,且在某些特定任务上相比千亿大模型亦能具备一定的优势。”当时,王斌透露,“专职大模型团队员工30多人,不会马上极速扩张;这个团队的目标还是通用语言大模型,第一步的目标基座模型参数在几百亿,然后会视前期爬坡结果,再决定下一步投入。”作为对比,前年11月,vivo已经推出第一代蓝心大模型矩阵,包括十亿、百亿、千亿三个参数量级的五款语言大模型。并且,在手机厂商中比对,小米大模型也显得太低调,宣传不足。今年年底的多场旗舰机发布会中,大模型都作为重中之重,使用了大量的篇幅介绍自家的智能技术。而小米15整体的篇幅不足,更别提对大模型的介绍。一方面,这与小米向造车倾斜的转向有关,另外,小米这样做也在考量“产品优先”的原则。在被询问小米大模型团队,是否会发布阶段性成果时,王斌回复道“跟其他公司不太一样,小米天生带着产品的属性,我相信小米大模型出来的时候,是由产品带着出来。”在其他手机厂商All in AI时,小米默默地落后了。可能,当今年国产手机纷纷玩起智能体点餐时,小米才警觉其中的差距。不过,小米的奋起直追,还有很大机会。毕竟小米的“人车家”战略最不缺大模型的落地场景,一旦储备了丰富的人才和技术积累,把这块短板补上来。米系的小爱同学、IoT、自动驾驶、机器人等等,无数的应用场景能迅速反哺大模型的能力。这也使得小米大模型的上限会很高。人才调动:发力大模型的信号根据资料,小米AI实验室大模型团队的负责人是栾剑,向AI实验室主任王斌汇报。栾剑此前曾担任小米技术委员会 AI 实验室语音生成团队的负责人。在此之前,他曾担任东芝(中国)研究院研究员、微软(中国)工程院高级语音科学家、微软小冰首席语音科学家以及语音团队负责人等职位。若罗福莉领军大模型团队的消息属实,尚不知道栾剑的任职将如何调动。根据去年的资料,该团队目前AI领域相关人员已超1200人。相信在雷军给出发力大模型的信号之后,相关人才的招聘会更加如火如荼的进行。小编在小米招聘的官方页搜索发现,仅北京地区大模型相关岗位就多达59个职位,还开放了众多的负责人等管理岗虚位以待。其中,大模型技术专家的要求包括,“长期从事自然语言处理、视觉、声学语音等相关领域的研究,对语言大模型或多模态大模型的原理有深刻的理解;”“ 在AI领域的国际顶会或期刊上发表过多篇有影响力的论文”等等。https://hr.xiaomi.com/job有趣的是,我们此前刚刚报道过,阿里通义要发力To C,就是以产品团队从阿里云迁入阿里智能信息事业群为信号的。而字节在AI上的高举高打,也是从成立Flow新部门,聚焦AI应用层而开始的。在AI人才对整个产品举足轻重的今天,如何挖到人才,如何设置合理的架构让人才能发挥自己的一技之长,成为大厂们值得思考和研究的课题。