主要观点总结
本文主要介绍了国产大模型DeepSeek-V3的发布以及相关的开源信息,以及其背后的开发者罗福莉的成长经历。同时,也提到了小米在AI领域的布局和动作,包括招聘人才、搭建GPU万卡集群等。
关键观点总结
关键观点1: DeepSeek-V3的发布及开源信息
介绍了国产大模型DeepSeek-V3的卓越性能和极低的训练成本,被称为“AI界的拼多多”,并火爆全球。
关键观点2: 罗福莉的成长经历与贡献
介绍了罗福莉从成绩垫底逆袭成为AI领域的优秀人士的经历,以及在DeepSeek大模型中的贡献。
关键观点3: 小米在AI领域的布局和动作
小米全面发力AI大模型,招募人才,搭建GPU万卡集群,预计在未来将投入大量研发经费。
正文
“二十一世纪什么最贵?
人才!”
近日,国产大模型DeepSeek-V3
首个版本上线并同步开源
其卓越的性能
和极低的训练成本
不仅让它被称为“AI界的拼多多”
更让它火爆全球
事实上,DeepSeek并非第一次“出圈”
早在半年前
其发布的DeepSeek-V2
就因性能达GPT-4级别
但开源、可免费商用
且API价格仅为
GPT-4-Turbo的百分之一
而引发业内关注
而与DeepSeek一起进入大家视野的
是一位名叫罗福莉的95后AI“天才少女”
就在DeepSeek-V3发布前几天
小米创始人雷军
开出千万年薪
将罗福莉招至麾下
相关话题瞬间登上热搜
引发网友关注
罗福莉为何会成
“雷军严选”?
据了解,DeepSeek开源大模型DeepSeek-V2的关键开发者之一正是罗福莉,未来她将领导小米AI大模型团队。
公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。
95后天才少女逆袭之路
罗福莉的成长轨迹
堪称励志典范
这位来自四川的95后女孩,在进入北京师范大学之前几乎未曾接触过计算机领域。然而,命运的齿轮总是青睐有准备的人。从最初的成绩垫底,到后来以优异表现保研北大计算语言学研究所,她用实力演绎了什么叫「逆风翻盘」。在学术领域,罗福莉的表现更是亮眼。从她的谷歌学术主页可以看到,截至目前,被引数2160,今年被引次数最多。
2019年,还在北大读硕士的她在人工智能领域顶级国际会议ACL上发表8篇论文(其中2篇一作),登上了知乎热搜。罗福莉用本人知乎账号回应称,“这次投稿ACL是我近一年的产出,所以我认为自己是付出了足够的努力的,当然可能也有运气成分加持。”
而在硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。
小米大动作!
被曝搭建GPU万卡集群
事实上,罗福莉被重金招入小米
是小米全面发力AI大模型的
其中一个动作
2023年4月
小米正式组建了
AI实验室大模型团队
今年11月
小米成立了专门的AI平台部
由小米的元老级技术大牛
张铎为负责人
有专业人士透露,除了招募人才以外,近期小米在搭建GPU万卡集群,规模较其大模型团队刚刚成立时的约6500张GPU将大幅增加。这一计划已施行数月,由集团董事长雷军亲自领导。对此,21世纪经济报道记者联系小米相关人士求证,对方未予回复。
小米集团总裁卢伟冰透露,预计2024年小米研发费用将达到240亿元,2025年更是将攀升至300亿元。
对雷军千万年薪
挖掘AI人才
你怎么看?
话匣子综合自21世纪经济报道、证券时报、罗福莉个人公众号等
编辑:王哲嫣
责任编辑:李书娥
-本文完-
版权声明:转载前请联系后台授权