专栏名称: 夕小瑶的卖萌屋
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
目录
相关文章推荐
田轩的田字格  ·  社会资本“引力波”如何强力释放? ·  2 天前  
田轩的田字格  ·  社会资本“引力波”如何强力释放? ·  2 天前  
东西文娱  ·  努力配得上雄心,“壮志”中国潮玩2024 ·  4 天前  
投资界  ·  史上最大独角兽诞生,25000亿 ·  6 天前  
投资界  ·  史上最大独角兽诞生,25000亿 ·  6 天前  
科技日报  ·  刷新纪录!世界最大,交付离港 ·  6 天前  
科技日报  ·  刷新纪录!世界最大,交付离港 ·  6 天前  
51好读  ›  专栏  ›  夕小瑶的卖萌屋

GPT、CLIP之父Alec Radford确认离开OpenAI!

夕小瑶的卖萌屋  · 公众号  · 科技创业 科技自媒体  · 2024-12-20 11:05

主要观点总结

OpenAI的研究员Alec Radford宣布离职并进行独立研究,他曾是GPT之父并主导了多个里程碑式模型的研发。他的离职对于OpenAI而言是一个重大损失。Radford在OpenAI的7年时间里始终专注于大型语言模型的研究,他的工作奠定了OpenAI的发展方向并引领了全新变革。此前,他主导了基于Transformer的语言模型生成预训练方法,为AI领域的发展奠定了理论基础。与此同时,OpenAI不断失去其早期贡献者,这暗示着行业可能正在经历范式转移。

关键观点总结

关键观点1: Alec Radford,OpenAI的研究员和GPT之父,宣布离职进行独立研究。

他在OpenAI的7年时间里做出了卓越的贡献,主导了多个里程碑式模型的研发。

关键观点2: Radford的离职对OpenAI而言是一个重大损失。

他在OpenAI的发展中起到了至关重要的作用,他的离职可能代表着行业正在经历范式转移。

关键观点3: Radford在OpenAI的七年里专注于大型语言模型的研究。

他的工作奠定了OpenAI的发展方向,引领了全新变革。

关键观点4: 此前,Radford主导了基于Transformer的语言模型生成预训练方法。

这一研究为AI领域的发展奠定了理论基础。

关键观点5: OpenAI不断失去早期贡献者。

这可能暗示着行业正在经历范式转移,预示着AI研究范式的重大转变。


正文

家人们家人们!事越大字越少!大 Shock!

根据 The information 报道,OpenAI 的研究员,GPT 之父 Alec Radford 昨天开始后在同事圈内宣布,他将离职以独立进行研究,以后他计划与 OpenAI 以及其他人工智能开发商以合作形式工作了。

就在最近刚结束的 NeurIPS 会议上,OpenAI 联合创始人 Ilya Sutskever 在回顾了被他称为"预训练时代"的重要历史时刻时,还提到:GPT-2、GPT-3 等里程碑式模型的诞生,很大程度上要归功于 Alec Radford 和现 Anthropic 创始人 Dario Amodei 的开创性工作。

不知道 IIya 是不是当时已经知道了 Radford 的离职。。。。

OpenAI 的主管 Mark Chen 在一份声明中确认了这个消息:

“我们对亚历克及其贡献深表敬意和赞赏,并期待在他探索独立研究时继续与他合作。”

OpenAI 没他真的可以吗。。。

家人们,不是奶茶小题大作,这人离职对 OpenAI 尊滴很严重!看看这些当时轰动一时的论文:

GPT-1:

GPT-2:

CLIP:

谷歌学术个人页:

Sam Altman 对 Alec Radford 的评价是:

“这个创造了 GPT-1 的家伙某种程度上是独立完成的,他解决了这个问题,这确实有些令人印象深刻,但(当时)并没有对它是如何工作以及为什么能工作有深入的理解。”

这真是实打实的 GPT 之父了!

Alec Radford 于 2016 年毕业于富兰克林·欧林工程学院(Franklin W. Olin College of Engineering),毕业后就加入了 OpenAI,开始他的七年研究之路 ~

在 OpenAI 的 7 年, Radford 始终专注于大型语言模型的研究,可以说,他的工作不仅奠定了 OpenAI 的发展方向,而且引领了大语言模型乃至整个 A 届的全新变革。

在 OpenAI 成立之初,公司发展的路径尚未明晰。

直到,Radford 灵光一下,尝试用 20 亿条 Reddit 评论来训练语言模型。

氮素,事情没有那么简单!

第一次尝试并不顺利。但彼时的 CTO(现任 OpenAI 总裁)格雷格·布罗克曼(Greg Brockman)并未因此否定他的想法。

布罗克曼认为,这个创意仍然充满潜力,因而鼓励 Radford 继续探索。

由于当时 OpenAI 的算力远不及如今,资源极为有限。

Radford 于是转而选择亚马逊的电商评论作为实验对象,试图让语言模型预测并生成用户评论的下一个字符。出人意料的是,模型竟然展现出了识别评论情感的能力,能够根据需求生成褒贬不一的评论。

这就是 OpenAI 内部称之为的“无监督情感神经元”项目。

取得这初步胜利后,Radford 开始将研究扩展到更广泛的数据领域。2017 年,著名论文《Attention is All You Need》的发表为他带来了新的启发,Ilya Sutskever 作为少数真正领悟 Transformer 强大之处的先驱之一,敏锐地指出:“这正是我们一直在等待的。”

受此鼓舞,Radford 迅速投身于 Transformer 架构的探索。

他惊喜地发现:“我在两周内取得的进展,比过去两年还要多。”

2018 年 6 月,他领衔发表了一篇划时代的论文,首次提出了基于 Transformer 的语言模型生成预训练方法,这篇发表在 OpenAI 官网的预印本论文,堪称 AI 领域里程碑的壮举,为此后 AI 领域的爆炸性发展奠定了理论基础。

Radford 将他们的模型命名为 Generatively Pretrained Transformer,简称 GPT。

这个拥有 1.17 亿参数的模型,融合了书籍、Quora 问答、初高中考试作文等海量数据,在语言理解和生成方面展现出了前所未有的能力。

Radford 不仅是 GPT-1 的缔造者,还以第一作者身份主导了 GPT-2 的研发。此外,他在计算机视觉领域的 CLIP 模型和语音识别系统 Whisper 等项目中,也做出了卓越贡献。

CloseAI 元老真的走光了。。。

唉,OpenAI 不断失去其最早期和最具开创性的贡献者之一。

在过去一年左右的时间里,OpenAI 的员工已向新投资者出售了超过 8 亿美元的股票。

而且,部分 OpenAI 的元老:首席技术官 Mira Murati、研究主管 Bob McGrew 以及联合创始人兼研究员 John Schulman、天才 Ilya Sutskever安全负责人翁荔 也在最近几个月因各种原因离职。

直到今天,又加上了 Radford~ 呜呜呜

结语

这一趋势似乎并非偶然。

这些"预训练时代"开创者们的 离职,不仅仅是关乎个人选择,更代表着这个时代的新走向,暗示着行业可能正在经历范式转移。

此前,与 Radford 共同开创预训练模型时代的 Dario Amodei 已另立门户,创建 Anthropic 并在 AI 安全领域取得瞩目成就。

华尔街匿名分析师对像 Radford 这样"技术灵魂人物"的出走的评价很有远见:

可能预示着 AI 研究范式的重大转变。我们可能正在见证一个新时代的开始,独立研究者将在 AI 技术创新中发挥越来越重要的作用。

大家怎么看呢 ~ 欢迎评论区和我们一起讨论 ~

参考文献
https://mp.weixin.qq.com/s/XjYh3y6uiDTDvN6uo4JZpA
https://www.theinformation.com/briefings/senior-openai-researcher-radford-departs?rc=ayfylg  
https://mp.weixin.qq.com/s/HcjwATydCMKC4F64WH2OZw  
https://mp.weixin.qq.com/s/4sCBbs8vQ25UytwQecsROQ