主要观点总结
本文主要介绍了小米集团招聘AI大模型团队关键成员罗福莉的生平、学术成就以及小米在AI领域的动作。罗福莉是DeepSeek开源大模型DeepSeek-V2的关键开发者之一,被小米以千万年薪招揽。她在学术领域表现出色,被业界誉为“AI新星”。小米为发力AI大模型,不仅招募了罗福莉,还成立了专门的AI平台部,并预计在未来几年内大幅增加研发投入,主要聚焦于AI、OS、芯片三大底层技术的研发。
关键观点总结
关键观点1: 罗福莉的生平及成就
罗福莉是DeepSeek开源大模型DeepSeek-V2的关键开发者,被小米以千万年薪招揽。她本科毕业于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。她在学术领域表现出色,提出了词义消歧方法和文本风格转换框架,并在人工智能领域顶级国际会议ACL上发表多篇论文。她还曾在阿里达摩院和幻方量化从事人工智能研究。
关键观点2: 罗福莉加入小米的重要性
罗福莉的加入是小米全面发力AI大模型的其中一个重要动作。她深耕自然语言处理领域,包括词义消歧、文本生成等,正是小米手机、电脑、车机等设备最常用的场景所需的技术。
关键观点3: 小米在AI领域的动作
小米为发力AI大模型,不仅招募了罗福莉,还成立了专门的AI平台部,并预计在未来几年内大幅增加研发投入。小米集团总裁卢伟冰透露,五年内小米的研发投入将超过1000亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。
正文
本文来源:整理自证券时报、新智元、南方日报、大象新闻等
图源:雷军视频号
据证券时报报道,这次他的目标是DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,其以千万年薪招揽,领导小米AI大模型团队。公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。这位来自四川的的95后女孩,在进入北京师范大学之前几乎未曾接触过计算机领域。从最初的成绩垫底,到后来来以优异表现保研北大计算语言学研究所,她用实力演绎了什么叫「逆风翻盘」。2019年,还在北大读硕士的她在人工智能领域顶级国际会议ACL上发表8篇论文(其中2篇一作),提出的词义消歧方法和文本风格转换框架在业界引发轰动,登上了知乎热搜。罗福莉用本人知乎账号回应称,“这次投稿ACL是我近一年的产出,所以我认为自己是付出了足够的努力的,当然也可能也有运气成分加持。”
在学术领域,罗福莉的表现更是亮眼。从她的谷歌学术主页可以看到,截至目前,被引数2160,今年被引次数最多。硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。
今年5月,在DeepSeek-V2发布以后,罗福莉在知乎上撰文,发表了对于DeepSeek-V2的看法。她表示,“单论DeepSeek-V2模型的中文水平,是真实处在国内外闭源模型的第一梯队”,“外加1元/百万输入Tokens的价格,只有GPT4价格的1/100,性价比之王”。有业内人士分析,罗福莉加入小米,可能会有1+1>2的效果。
她深耕自然语言处理领域,包括词义消歧、文本生成,正是小米手机、电脑、车机这些设备最常用的场景。事实上,罗福莉被重金招入小米,是小米全面发力AI大模型的其中一个动作。2023年4月,小米正式组建了AI实验室大模型团队,并表示将不断挖掘AI相关的用户场景,发挥自身技术优势,并以开放的态度与合作伙伴开拓更多机会。
今年11月,小米成立了专门的AI平台部,小米的元老级技术大牛张铎为负责人。张铎本硕毕业于清华计算机系,曾被雷军公开称赞是“小米的大神”,送以“铎神”的称号。在小米招聘的官方页搜索就可以发现,仅北京地区大模型相关岗位就多达59个除了招募人才以外,近期小米正在搭建GPU万卡集群,规模较其大模型团队成立时的约6500张GPU大幅增加。这一计划已施行数月,由集团董事长雷军亲自领导。对此,21世纪经济报道记者联系小米相关人士求证,对方未予回复。
小米集团总裁卢伟冰透露,预计2024年小米研发费用将达到240亿元,2025年更是将攀升至300亿元。他预计,自2022年至2026年的五年内,小米的研发投入将超过1000亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。在AI团队建设方面,小米自2016年组建AI团队以来,经过多次扩展,相关领域人员规模已达3000多人。
商务合作、广告投放
请联系微信号:mogobd
募格编辑提供专业的英文论文修改、润色服务及科研学术论文翻译服务,拥有超2000名各学科编辑,以英语为母语,具有丰富的文稿修改编辑经验,让您的论文语言更加准确、地道和优美。