2024
年底,一则《雷军千万年薪挖角
95
后
AI
天才少女》的热搜引爆全网,让
“
罗福莉
”
这个名字再度成为热门话题。事实上,早在
2019
年,
“
八篇
ACL
论文
”
的佳绩就让她在硕士期间成为知乎上的风云人物。直通阿里星项目进入达摩院、开源大模型
DeepSeek-V2
的核心开发者、
“
天才
AI
美少女萝莉
”……
这些闪亮的头衔让人不禁好奇,这位
95
后女孩究竟有何特别之处?
然而,鲜有人知道,这个被誉为天才的少女,曾经也是一个连
Python
都不熟练、为学术压力焦头烂额的普通学生。是什么样的努力与机遇,让罗福莉一路
“
开挂
”
,最终被雷军青睐?接下来本文将带你走近这位
“
天才
AI
少女
”
,了解她如何从普通走向非凡,用行动书写属于自己的
“
花路
”
。
图片来源:新浪微博
小城女儿,勇闯北大
1995
年,罗福莉出生在四川宜宾的一个普通家庭。父亲是一名电工,家庭并不富裕。
回顾求学之路,罗福莉曾经戏称自己是
“
误打误撞
”
进入了北京师范大学计算机系。但其实,
“
稳扎稳打,绝地反击
”
可能用来形容她更合适。
从小,罗福莉就喜欢把任务拆分成一个一个阶段性目标。在父亲的引导下,小学期间,罗福莉缓慢爬坡终于来到班级前两名;随后的求学时光中,罗福莉虽然在新阶段开启的时候有所松懈,但总能抵住压力,成绩波浪前进,螺旋上升。正如罗福莉的班主任评价她:
“
当时在班上罗福莉成绩虽说不是最拔尖的,但也足够优秀,重要的是她非常刻苦。
”
从四川省宜宾市第一中学
“
清北班
”
毕业后,罗福莉虽然如愿来到北师大,但专业却是被调剂到了电子专业。面对自己不喜欢的专业,罗福莉也曾坦言,自己有些迷失方向:
“
刚上大一的我,东一榔头西一棒槌,迷惘不知所向,期末排名也是靠后。
”
值得庆幸的是,经过老师的点拨,罗福莉在大一下学期转入计算机专业,这才为日后的所有成就奠定了基础。
图片来源:百度百科
“
计算机领域绝对的
‘
低起点
’
者
”
,这是罗福莉在微信公众号上对自己下的定义。
或许很多人会觉得这不过是成功者的谦虚幽默,但要知道,计算机的学习对刚转专业的罗福莉来说,无疑是巨大的挑战。在四五十人的班级,她的成绩一度无法排进前三十,连中流砥柱都算不得。其他同学三分钟就能解出来的
Coding
题,她要花整整三个小时。罗福莉曾说,遇到不会的题,唯一的办法就是先去操场跑两圈,然后回来继续硬磕。
但就是靠着一股不服输的劲头,罗福莉花了不到一年的时间,竟然硬是将总成绩从屈居末流提到班级前五,顺利达到了保研的标准。大三期间,她积极寻找北京大学的导师和实验室,为未来的学术研究铺路。但新的挑战,也随之而来。
就像罗福莉在社交媒体上写的那样,不断出现的打击和对自己学术能力的怀疑,让她一度想逃离学术,甚至转行做产品。
实验室里高手如云,十个同组同学,九个是北大男生,而自己连
python
都不会
…
罗福莉没有迷失方向,她清楚地知道,既然已无退路,那就绝地反击!罗福莉恶补欠缺知识,努力赶超论文进度,终于在大年十五那天提交了自己的第一篇自然语言处理领域的顶会论文。
“
我那一年大年二十九回到家,大年初五又回学校赶稿,赶到了正月十五,投出论文后回寝室听到外面放烟花(的声音),躺在寝室床上,眼泪哗哗往下流。
”
罗福莉在阿里达摩院的专访视频中这样回忆道。
图片来源:搜狐网
这段宝贵的求学经历,不仅让她再次意识到了自己的潜力,也逐渐厘清自己对自然语言处理领域的研究兴趣。读研来到北大后,罗福莉开启了开挂人生。与同龄人不太一样的是,从图书馆到宿舍,罗福莉在北大过上了二点一线的生活,将自己深深扎根在学术研究中。在鼓足勇气向各大计算机科学期刊投稿后,属于她的高光时刻悄然开启。研二这一年,她在人工智能领域顶级国际会议
ACL
上发表了
8
篇论文,其中
2
篇是第一作者。要知道,国际顶级会议
ACL
(
Annual Meeting of the Association for Computational Linguistics
) 是自然语言处理(
NLP
)和计算语言学领域的全球最高级别学术会议之一,水平极高,是学术界和工业界公认的顶尖会议。
ACL
会议的论文接收率通常为
20%-25%
,有时甚至更低。
而罗福莉竟然一年连发
8
篇!至此,
“
天才
AI
少女
”
的桂冠正式落在她头上。
拒读博士,撬动
AI
江湖
也许在大众的视野里,继续攻读博士学位对她而言本就是恰逢其时。但出乎大家意料,
2019
年,罗福莉选择离开象牙塔,加入阿里达摩院。其实成绩优异的她,也接到了腾讯技术大咖、百度
AIDU
计划等项目的橄榄枝。权衡再三之后,罗福莉选择了更偏向重要研究的阿里达摩院。据知情人士向有关媒体透露,罗福莉通过阿里星项目进入阿里达摩院。
阿里星项目是阿里巴巴集团专门为招聘全球顶尖高校优秀毕业生而设计的高潜力人才计划,是校招的最高级别,类似于华为
“
天才少年
”
计划,
“
通过阿里星项目的校招生,都是百里挑一。
”
在这里,罗福莉花了半年时间调整自我,努力适应工作节奏,并开始投入到人工智能研究中预训练语言模型相关的部分工作中。罗福莉负责阿里深度语言模型体系(
AliceMind
)的开源,并主导开发
AI
预训练模型
VECO
。
图片来源:
bilibili
AliceMind
是阿里巴巴达摩院推出的一个自然语言处理(
NLP
)框架,主要致力于支持多语言、多任务的预训练模型研究和应用。据央视网消息,
2022
年
11
月
25
日,在中文语言理解领域权威榜单
CLUE
中,
AliceMind
以
86.685
的总分成绩创造了新纪录,这是该榜单诞生近三年以来,
AI
首次超越人类成绩(
86.678
),意味着
AI
模型的中文语言理解水平达到了新的高度。
而
VECO
是
AliceMind
的核心成果之一,是一个多语言预训练模型,其名字来自
“Versatile Encoder for Cross-lingual Understanding and Generation”
的缩写。
VECO
广泛用于阿里巴巴的跨境电商业务,例如
AliExpress
的实时翻译和客户服务系统。有媒体报道称,
AliceMind
的核心在电商领域得到了充分应用。其翻译平台每日有上亿次调用,成功带来价值超过数亿美金。这样的
AI
神器,就是罗福莉主导开发的。
两年后,罗福莉调整事业规划,加入私募公司幻方量化,从事深度学习相关策略建模和算法研究。幻方量化是一家依靠数学与人工智能进行量化投资的公司,
2015
年成立,迅速成长为百亿规模的私募基金。此后,罗福莉转入幻方量化子公司
“
深度求索
”
(
DeepSeek
)。
DeepSeek
是一家专注于人工智能和大规模语言模型研发的科技公司,成立于
2023
年
7
月,由量化投资巨头幻方量化创立。
从此刻起,属于罗福莉的另一个高光时刻即将到来。她参与研发的重要项目
DeepSeek-V2
一经发布就引发了广泛关注。
DeepSeek-V2
是
DeepSeek
推出的第二代大规模语言模型,于
2024
年
5
月发布,以其高性价比和技术创新而闻名。
该模型将推理成本降低至每百万
tokens
仅
1
元人民币,是
GPT-4 Turbo
的七十分之一,因此被誉为
“AI
界的拼多多
”
。
DeepSeek
在行业内上演鲶鱼效应,不仅打响了大模型市场的价格战,也让罗福莉的名气随之水涨船高。
“
单论
DeepSeek-V2
模型的中文水平,是真实处在国内外闭源模型的第一梯队
”
,
“
外加
1
元
/
百万输入
Tokens
的价格,性价比之王。
”
罗福莉曾经在知乎上做出过这样的描述。
图片来源:百家号
仅仅半年之后,
2024
年
12
月,
Deepseek
宣布全新系列模型
DeepSeek-V3
首个版本上线并同步开源。官方称,
DeepSeek-V3
多项评测成绩超越了
Qwen2.5-72B
和
Llama-3.1-405B
等其他开源模型,并在性能上和世界顶尖的闭源模型
GPT-4o
以及
Claude-3.5-Sonnet
不分伯仲。相较
GPT-4o
等模型的训练成本约为
1
亿美元,
V3
模型的总训练成本为
557.6
万美元。
2025
年
1
月
20
日,
DeepSeek
再次推出深度推理版本
DeepSeek-R1
。新模型一经亮相,迅速引发行业关注。其在数学、代码和自然语言推理方面表现出色,与
OpenAI o1
旗鼓相当,并在多个基准测试中展现了卓越性能。
例如,
DeepSeek-R1
在
AIME 2024
数学竞赛中取得了
79.8%
的成绩,
OpenAI o1-1217
以因
0.6%
的差距屈居第二;而在
MATH-500
测试中,
DeepSeek-R1
更是以
97.3%
的高分表现,超
o1-1217
近
1%
,同时显著领先其他模型。
图片来源:雷锋网
随着
R1
的发布,
DeepSeek
已成功登上中国和美国苹果应用商店的免费应用榜单第一位。
在美国市场,
DeepSeek
已超越
ChatGPT
,标志着中国
AI
产品在全球市场上实现了历史性突破。而在中国市场,
DeepSeek
也超越了豆包。
回顾
DeepSeek
推出的这一系列大模型,罗福莉的名字都出现在了论文的鸣谢人员名单。
图片来源:微信公众号
CEO
来信
图片来源:
DeepSeek-R1
论文
而就在
DeepSeek-V3
发布的前几天,有媒体报道称,小米创始人雷军拿出千万年薪高价,招揽罗福莉领军小米
AI
大模型团队。消息一出瞬间在业内引起轰动,再次让罗福莉进入公众视野。据消息,罗福莉目前确已从
DeepSeek
离职,但是否加盟小米,还有待证实。
的确,小米在
AI
领域频频布局是有目共睹的。从
2023
年
4
月,小米正式组建了
AI
实验室大模型团队;去年
11
月成立
AI
平台部。据相关媒体报道,小米集团总裁卢伟冰曾表示,
“
预计
2024
年小米研发费用为
240
亿元,
2025
年将达到
300
亿元,
5
年(
2022-2026
)预计研发费用超
1000
亿元,而研发投入主要方向为
AI
、
OS
、芯片。
”
如果小米和罗福莉牵手成功,会碰撞出怎么的火花?业内无比期待。
努力和运气,
“
普通人
”
的
“
花路
”
“
天才
AI
美少女萝莉
”
,面对这样的桂冠,罗福莉却十分低调。她曾经坦言,自己并不是所谓神人,也不希望自己被神化和娱乐化,她只是一个坚守梦想的普通人。还曾有人找到她,希望她出书,甚至经纪公司也想来签约
…
面对这样的风口,罗福莉却显得尤为克制。
就像面对曾经八篇论文的战果,罗福莉用
“
努力
”
和
“
运气
”
轻松总结自己的成功。她本人在知乎回应称:
“
这次投稿
ACL
是我近一年的产出,所以我认为自己是付出了足够的努力的,当然也可能也有运气成分加持。
”
图片来源:知乎
没有自命不凡,而是脚踏实地。罗福莉经常在社交平台和粉丝交流互动,也会给有同样人生困惑的网友们答疑解惑。曾经有网友留言,觉得上级分配任务杂乱不堪,不知道如何抉择。罗福莉回复称:不要排斥做杂事儿,而且要做到
“
极致
”
。在这个过程中,有眼光的领导会为你分配更重要的事情;而如果领导没有发觉,自己主动请缨也未尝不可。这份对
“
极致
”
的初心,也让罗福莉能够在
AI
领域有所建树。
图片来源:罗福莉公众号
自带互联网光环、深耕
AI
领域前沿、为人低调谦逊,罗福莉,一个集过硬的技术和人格魅力于一体的
“
普通人
”
。在
AI
战场如火如荼的当下,罗福莉就像一阵清爽的风,刮过浮躁与喧嚣,带来专注与坚韧的力量。
参考资料