专栏名称: 夕小瑶的卖萌屋

这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货，有小夕的回忆与日常，还有最重要的：萌！气！

GPT、CLIP之父Alec Radford确认离开OpenAI！

夕小瑶的卖萌屋 · 公众号 · 科技创业科技自媒体 · 2024-12-20 11:05

主要观点总结

OpenAI的研究员Alec Radford宣布离职并进行独立研究，他曾是GPT之父并主导了多个里程碑式模型的研发。他的离职对于OpenAI而言是一个重大损失。Radford在OpenAI的7年时间里始终专注于大型语言模型的研究，他的工作奠定了OpenAI的发展方向并引领了全新变革。此前，他主导了基于Transformer的语言模型生成预训练方法，为AI领域的发展奠定了理论基础。与此同时，OpenAI不断失去其早期贡献者，这暗示着行业可能正在经历范式转移。

关键观点总结

关键观点1: Alec Radford，OpenAI的研究员和GPT之父，宣布离职进行独立研究。

他在OpenAI的7年时间里做出了卓越的贡献，主导了多个里程碑式模型的研发。

关键观点2: Radford的离职对OpenAI而言是一个重大损失。

他在OpenAI的发展中起到了至关重要的作用，他的离职可能代表着行业正在经历范式转移。

关键观点3: Radford在OpenAI的七年里专注于大型语言模型的研究。

他的工作奠定了OpenAI的发展方向，引领了全新变革。

关键观点4: 此前，Radford主导了基于Transformer的语言模型生成预训练方法。

这一研究为AI领域的发展奠定了理论基础。

关键观点5: OpenAI不断失去早期贡献者。

这可能暗示着行业正在经历范式转移，预示着AI研究范式的重大转变。

正文

家人们家人们！事越大字越少！大 Shock！

根据 The information 报道，OpenAI 的研究员，GPT 之父 Alec Radford 昨天开始后在同事圈内宣布，他将离职以独立进行研究，以后他计划与 OpenAI 以及其他人工智能开发商以合作形式工作了。

就在最近刚结束的 NeurIPS 会议上，OpenAI 联合创始人 Ilya Sutskever 在回顾了被他称为"预训练时代"的重要历史时刻时，还提到：GPT-2、GPT-3 等里程碑式模型的诞生，很大程度上要归功于 Alec Radford 和现 Anthropic 创始人 Dario Amodei 的开创性工作。

不知道 IIya 是不是当时已经知道了 Radford 的离职。。。。

OpenAI 的主管 Mark Chen 在一份声明中确认了这个消息：

“我们对亚历克及其贡献深表敬意和赞赏，并期待在他探索独立研究时继续与他合作。”

OpenAI 没他真的可以吗。。。

家人们，不是奶茶小题大作，这人离职对 OpenAI 尊滴很严重！看看这些当时轰动一时的论文：

GPT-1:

GPT-2：

CLIP：

谷歌学术个人页：

Sam Altman 对 Alec Radford 的评价是：

“这个创造了 GPT-1 的家伙某种程度上是独立完成的，他解决了这个问题，这确实有些令人印象深刻，但（当时）并没有对它是如何工作以及为什么能工作有深入的理解。”

这真是实打实的 GPT 之父了！

Alec Radford 于 2016 年毕业于富兰克林·欧林工程学院（Franklin W. Olin College of Engineering），毕业后就加入了 OpenAI，开始他的七年研究之路～

在 OpenAI 的 7 年， Radford 始终专注于大型语言模型的研究，可以说，他的工作不仅奠定了 OpenAI 的发展方向，而且引领了大语言模型乃至整个 A 届的全新变革。

在 OpenAI 成立之初，公司发展的路径尚未明晰。

直到，Radford 灵光一下，尝试用 20 亿条 Reddit 评论来训练语言模型。

氮素，事情没有那么简单！

第一次尝试并不顺利。但彼时的 CTO（现任 OpenAI 总裁）格雷格·布罗克曼（Greg Brockman）并未因此否定他的想法。

布罗克曼认为，这个创意仍然充满潜力，因而鼓励 Radford 继续探索。

由于当时 OpenAI 的算力远不及如今，资源极为有限。

Radford 于是转而选择亚马逊的电商评论作为实验对象，试图让语言模型预测并生成用户评论的下一个字符。出人意料的是，模型竟然展现出了识别评论情感的能力，能够根据需求生成褒贬不一的评论。

这就是 OpenAI 内部称之为的“无监督情感神经元”项目。

取得这初步胜利后，Radford 开始将研究扩展到更广泛的数据领域。2017 年，著名论文《Attention is All You Need》的发表为他带来了新的启发，Ilya Sutskever 作为少数真正领悟 Transformer 强大之处的先驱之一，敏锐地指出：“这正是我们一直在等待的。”

受此鼓舞，Radford 迅速投身于 Transformer 架构的探索。

他惊喜地发现：“我在两周内取得的进展，比过去两年还要多。”

2018 年 6 月，他领衔发表了一篇划时代的论文，首次提出了基于 Transformer 的语言模型生成预训练方法，这篇发表在 OpenAI 官网的预印本论文，堪称 AI 领域里程碑的壮举，为此后 AI 领域的爆炸性发展奠定了理论基础。

Radford 将他们的模型命名为 Generatively Pretrained Transformer，简称 GPT。

这个拥有 1.17 亿参数的模型，融合了书籍、Quora 问答、初高中考试作文等海量数据，在语言理解和生成方面展现出了前所未有的能力。

Radford 不仅是 GPT-1 的缔造者，还以第一作者身份主导了 GPT-2 的研发。此外，他在计算机视觉领域的 CLIP 模型和语音识别系统 Whisper 等项目中，也做出了卓越贡献。

CloseAI 元老真的走光了。。。

唉，OpenAI 不断失去其最早期和最具开创性的贡献者之一。

在过去一年左右的时间里，OpenAI 的员工已向新投资者出售了超过 8 亿美元的股票。

而且，部分 OpenAI 的元老：首席技术官 Mira Murati、研究主管 Bob McGrew 以及联合创始人兼研究员 John Schulman、天才 Ilya Sutskever、安全负责人翁荔也在最近几个月因各种原因离职。

直到今天，又加上了 Radford～呜呜呜

结语

这一趋势似乎并非偶然。

这些"预训练时代"开创者们的离职，不仅仅是关乎个人选择，更代表着这个时代的新走向，暗示着行业可能正在经历范式转移。

此前，与 Radford 共同开创预训练模型时代的 Dario Amodei 已另立门户，创建 Anthropic 并在 AI 安全领域取得瞩目成就。

华尔街匿名分析师对像 Radford 这样"技术灵魂人物"的出走的评价很有远见：

可能预示着 AI 研究范式的重大转变。我们可能正在见证一个新时代的开始，独立研究者将在 AI 技术创新中发挥越来越重要的作用。

大家怎么看呢～欢迎评论区和我们一起讨论～

参考文献
https://mp.weixin.qq.com/s/XjYh3y6uiDTDvN6uo4JZpA
https://www.theinformation.com/briefings/senior-openai-researcher-radford-departs?rc=ayfylg
https://mp.weixin.qq.com/s/HcjwATydCMKC4F64WH2OZw
https://mp.weixin.qq.com/s/4sCBbs8vQ25UytwQecsROQ