来源:量子位 | 公众号 QbitAI
克雷西 发自 凹非寺
OpenAI又跑了一名大神!
The Information消息,初代GPT论文第一作者
Alec Radford
也要离开OpenAI,转向独立研究。
据了解, Alec于2016年加入OpenAI,
从初代GPT到GPT-4o的论文中全都有他的名字,其中前两代还是第一作者。
另外OpenAI的多模态模型
CLIP
,还有语音识别模型
Whisper
,论文一作也都是Alec。
对于Alec的离开,OpenAI研究负责人Mark Chen表示,“我们对Alec和他的贡献深表敬意和赞赏,并期待在他探索独立研究的过程中继续与他合作。”
之前,前任研究团队负责人Jeff Clune
(已于2022年离开OpenAI,现在是不列颠哥伦比亚大学副教授,同时给DeepMind担任顾问)
还对Alec给予过很高的评价,认为
Alec是影响力最大但知名度最低的AI科学家之一。
甚至在Jeff看来,
Alec应该作为“现代生成式人工智能之父”被载入史册。
坚持做大模型的本科生,前两代GPT一作
2016年,Alec Radford于富兰克林·欧林工程学院(Franklin W. Olin College of Engineering)取得学士学位,随后加入OpenAI,一干就是8年。
虽然Alec只有本科学历,但在大模型领域是不折不扣的领军人才,截至今日
论文被引量已超19万。
被引量排名前三的论文,分别与GPT-3、CLIP和GPT-2相关。
这三篇论文都为今天的ChatGPT打下了重要基础,实际上,Alec
几乎参与了OpenAI所有的重大突破。
除了被引量最高的这三篇,从第一代GPT到GPT-4o的作者名单中,Alec的名字都赫然在列,并且前两代中都是第一作者。
Alec同样作为一作的CLIP,则是OpenAI在多模态路线上的重要成果,甚至在整个行业都极具影响力;同时,Alec也是OpenAI初代绘图模型DALL·E的参与者。
其他模态方面,OpenAI开源的语音识别系统Whisper,一作仍然是Alec……
不过,最新的o1模型贡献者列表中已经没有了Alec的名字,但与他一同从初代开始参与所有GPT工作的Ilya,仍然在o1的名单之上。
但无论如何,综观整个OpenAI,其他人或多或少都转向过机器人、或是游戏AI等其他领域“发发论文”,只有Alec坚持做大模型方向的研究。
正是他所坚持的大语言模型路线,改变了OpenAI公司、乃至整个AI领域的发展方向。
对此,奥特曼还曾半调侃半认真地表示:
招聘时,记得关注那些“看起来不会加入公司”的人。
OpenAI一开始并未确定大模型这一研究方向,但我们仍然招了AI研究员,并在取得突破后让更多人加入其中,最终成就了ChatGPT。
在加入OpenAI之前,Alec研究了卷积神经网络、批量归一化和GAN,是DC-GAN的第一作者。
DC-GAN的另外两名作者,是Alec的同学Luke Metz和PyTorch之父Soumith Chintala。
彼时,还在上学的Alec已经参与创立了indico.io(现名为Indico Data),Luke也加入到了该公司。
(后来,大模型兴起之后,Indico也增加了企业大模型业务,率先推出了基于GPT的自定义模型。)
2016年,也就是Alec加入OpenAI的同一年,Luke去了谷歌大脑,但后来又在2022年加入了OpenAI,参与了GPT-4的部分研发工作,不过今年10月也离职了。
前两代GPT论文作者全部离开OpenAI
到Alec离职完成之后,也就标志着前两代GPT论文的所有作者,都离开OpenAI了。
其中最著名的是原首席科学家Ilya Sutskever,他和Alec一样参与了包括前两代在内的GPT的工作。
Ilya今年五月宣布退出OpenAI时,震动了整个AI圈,后来他成立了新公司,主攻构建“安全超级智能”。
第一代GPT的另外两名作者分别是
Karthik Narasimhan和Tim Salimans。
其中Karthik Narasimhan到OpenAI是出任访问学者,2018年访问期结束后到普林斯顿担任教职,现在是普林斯顿NLP联合主任,跟陈丹琦是同事。
另外,Karthik还是开源版Devin作者之一——清华姚班学霸姚顺雨在普林斯顿读博期间的导师
(今年8月,姚顺雨加入了OpenAI)
。
三作
Tim Salimans
则是在2018年7月履新谷歌大脑,担任职位为高级管理科学家。
同样选择加入谷歌的,还有GPT-2的三作
Rewon Child
和四作
David Luan
。
Rewon后来还参与了GPT-3的工作,2021年离开OpenAI加入谷歌,2022年加入了初创公司Inflection AI,今年三月又到了微软;
David到谷歌则是2020年,后来他和Transformer论文作者Ashish Vaswani、Niki Parmar一起,创办了一家叫Adept的公司,David出任CEO。
不过据David的领英资料显示,他这个月已不在Adept担任职务,而是加入了亚马逊,与强化学习大牛、吴恩达第一届博士生Pieter Abbeel一同工作。
除了去谷歌的,GPT-2的作者中还包括了后来OpenAI的最强竞对,也就是Claude背后的厂商
Anthropic的创始人Dario Amodei。
Dario在OpenAI参与了GPT-2和3的工作,2020年末和妹妹Daniela一起离开,创立了Anthropic,两人分别出任CEO和总裁。
去向为Anthropic的,除了创始人Dario,还有GPT-2的二作
Jeffrey Wu
,离职的时间是今年7月,成为了倒数第二位离开OpenAI的前两代GPT参与者。
而今天,随着Alec的离职消息,打造最早两代GPT的八位研究者,已经要全部各奔东西了。
参考链接:
[1]https://www.theinformation.com/briefings/senior-openai-researcher-radford-departs
[2]https://scholar.google.com/citations?user=dOad5HoAAAAJ&hl=en
[3]https://x.com/iScienceLuvr/status/1869852854728700166
阅读报告全文,请访问欧米伽研究所的“未来知识库”
https://wx.zsxq.com/group/454854145828
未来知识库
是“
欧米伽
未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。
目前拥有超过8000
篇重要资料。
每周更新不少于100篇世界范围最新研究
资料
。
欢迎扫描二维码或访问
https://wx.zsxq.com/group/454854145828
进入。
截止到11月25日 ”未来知识库”精选的100部前沿科技趋势报告
-
Air Street Capital《2024 年人工智能现状报告》
-
未来今日研究所:2024 技术趋势报告 - 广义计算篇
-
科睿唯安中国科学院 2024 研究前沿热度指数报告
-
文本到图像合成:十年回顾
-
《以人为中心的大型语言模型(LLM)研究综述》
-
经合组织 2024 年数字经济展望报告加强连通性创新与信任第二版
-
波士顿咨询 2024 全球经济体 AI 成熟度矩阵报告
-
理解世界还是预测未来?世界模型的综合综述
-
Google Cloud CSA2024 AI 与安全状况调研报告
-
英国制造商组织 MakeUK2024 英国工业战略愿景报告从概念到实施
-
花旗银行 CitiGPS2024 自然环境可持续发展新前沿研究报告
-
国际原子能机构 2024 聚变关键要素报告 - 聚变能发展的共同愿景
-
国际可再生能源署 IRENA2024 年全球气候行动报告
-
Cell: 物理学和化学 、人工智能知识领域的融合
-
智次方 2025 中国 5G 产业全景图谱报告
-
未来今日研究所:2024 技术趋势报告 - 移动性,机器人与无人机篇
-
Deepmind:AI 加速科学创新发现的黄金时代报告
-
PitchBookNVCA2024 年第三季度全球风险投资监测报告
-
德科 2024 年未来全球劳动力报告
-
高工咨询 2024 年协作机器人产业发展蓝皮书
-
国际能源署 IEA2024 年全球能源效率报告
-
基因慧基因行业蓝皮书 2024 - 2025
-
普华永道 PwC2024 全球经济犯罪调查英国报告 - 智对风险直面挑战
-
中国互联网协会 2024 面向未来网络的数字孪生城市场景应用白皮书
-
中移智库 2024 先进感知新技术及新应用白皮书
-
智次方研究院 2025 中国 AIoT 产业全景图谱报告
-
未来今日研究所:2024 技术趋势报告 - 人工智能篇
-
国际电联:迈向衡量数字经济的通用框架的路线图
-
联合国粮食与农业组织:2024 年世界粮食安全和营养状况
-
大语言模型综述
-
李飞飞等,AI 智能体:探索多模式交互的前景综述
-
哈尔滨工业大学 - ChatGPT 调研报告
-
2024《美国核部署战略报告》最新文件
-
清华大学:AIGC 发展研究 3.0 发布版 b 版
-
OpenAI:2024 年 OpenAI o1 大模型技术报告
-
Verizon2024 年世界支付安全报告
-
皇家学会哲学学报 从复杂系统角度评估人工智能风险
-
复旦大学 大模型 AI 代理的兴起和潜力:综述
-
经合组织 OECD2024 年气候行动监测报告
-
Wevolver2024 年边缘人工智能现状报告 - 探索各行业边缘 AI 应用动态
-
2024 全球人形机器人产品数据库报告 - 人形机器人洞察研究 BTIResearch
-
《全球金融稳定报告》 把舵定航 不确定性、人工智能与金融稳定
-
瑞士洛桑联邦理工学院 《人工智能中的 - 创造力:进展与挑战》
-
《你所需要知道的理 - 论:人工智能、人类认知与决策》牛津大学最新 53 页报告
-
世界经济论坛 新兴技术时代的网络弹性导航:应对复杂挑战的协作解决方案 2024
-
ADL 理特咨询 2024 汽车出行未来展望报告
-
2024 中国硬科技创新发展白皮书 - 开辟未来产业新赛道
-
科学时代的大语言模型中的人工智能
-
Gartner2025 年重要战略技术趋势报告
-
CBInsights2024 年第三季度全球人工智能投融资状况报告
-
TrendHunter2025 年全球趋势报告 - 全行业顶级创新和变革趋势前瞻
-
天津大学 2024 大模型轻量化技术研究报告
-
欧洲海洋局 2024 导航未来报告将海洋置于更广泛的地球系统中第六版
-
美国安全与新兴技术中心 2024 AI 生成代码的网络安全风险研究报告
-
国际原子能机构 2024 年世界聚变展望报告
-
复旦大学 2024 大语言模型的能力边界与发展思考报告
-
安盛 AXA2024 年气候与生物多样性报告气候过渡计划路线图