周末,OpenAI 结束了为期 12 天的发布活动,压轴产品是推理大模型 o3,在顶尖的编程竞赛 CodeForces 中,得分可以排进前 200,达到顶级程序员的水平;在专门测试通用人工智能(AGI)的基准中,o3 得分最高达到 87.5%,而 9 月发布的 o1 得分不到 50% 等。OpenAI 并没有解释为什么 o3 性能有提升,但有一点比较明确:高性能计算模式下, o3 完成一个任务花费数千美元。不过 o3 还是一个期货。
据媒体报道,OpenAI 训练下一代模型 GPT-5(代号 Orion)远落后进度。目前 OpenAI 训练 GPT-5 已经 18 个月,从头训练了两次,每次预估花费 5 亿美元,但是性能提升远不及预期。OpenAI 希望 GPT-5 能达到博士生水平。问题在于 OpenAI 难以找到优质数据继续训练模型,他们选择用人直接编写数据,但效率低下,并尝试用大模型生成数据,但质量难以保证。
据媒体报道,OpenAI 今年 5 月从 Google 挖来的高管希瓦库马尔·文卡塔拉曼(Shivakumar Venkataraman)离职,在 OpenAI 只工作了 7 个月。他之前在 Google 工作了 21 年,曾负责搜索广告业务。他在 OpenAI 的主要工作是开发企业版的搜索功能等。OpenAI 希望开发一款与 ChatGPT 结合的浏览器,为旅游、食品、房地产和零售行业的客户提供搜索功能,已经与部分公司接洽。