专栏名称: 混沌学园

咨询服务

OpenAI急了？我们应该抓住哪些变量？

混沌学园 · 公众号 · 学习 · 2024-12-31 19:55

正文

在过去的一个月，OpenAI连续推出12场重磅发布会：

Day 1：满血o1上线，ChatGPT Pro会员上线，o1 pro推出，AI有了类人“思考”能力。

Day 2：基于o1的强化微调，人人都能训练专家模型，专业门槛直线下降。

Day 3：Sora正式发布，AI开始“看懂”现实世界。

Day 4：ChatGPT Canvas全员开放以及小功能更新，写文章、写代码一气呵成。

Day 5：全面接入苹果生态，打造更自然的多设备跨平台操作体验。

Day 6：4o的实时视频理解上线，多模态让AI看懂视频内容。

Day 7：ChatGPT上线 “Projects项目”功能。

Day 8：ChatGPT Search全量开放，升级AI搜索功能，挑战传统网络搜索。

Day 9：满血o1 API正式开放，大幅降低API调用价格。

Day 10：从最新款的iPhone到老式的翻盖机，能直接和ChatGPT打电话聊天了。

Day 11：应用升级，桌面版GPT可以跨应用互联，告别繁琐的复制粘贴对话。

Day 12：OpenAI o3正式发布，超级智能模型震撼登场，向AGI又迈进了一大步。

每一天的发布会都是振聋发聩的技术突破与产品创新，这些前所未有的技术加速度正在深刻改变全球的商业格局、产业生态以及个体的能力边界。

AI将带来哪些行业巨变？

AI离取代人类又近了一步？

AI在哪些能力上已达到了人类的水平？

12月28日，混沌邀请到了硅谷知名华人AI科学家田渊栋博士，脉脉创始人兼CEO林凡，云迹科技创始人、混沌学园校友支涛，云九资本合伙人、混沌创新领教任鑫，混沌合伙人、混沌创新领教张雷等AI行业从业者、专家们一起解读了OpenAI的这12场发布会。这不仅是一场关于AI技术趋势的分享，更是一场关于个人未来发展的思考。AI带来的不仅是工具的进化，更是思维的迭代与格局的重塑。在2025即将到来之际，让我们站在技术与人性的交汇点，重新审视未来的可能性。

以下为部分分享内容精华笔记：

‍田渊栋博士：OpenAI o3的表现依然惊艳

前段时间，OpenAI连续开 12 天的产品发布会，内容大致包括增强的ChatGPT o1模型、Sora视频生成模型和o3模型。另外，还有一些技术上的突破，包括推理模型o1、强化微调技术、文生视频Sora、写作和编程工具Canvas、与Apple生态系统的深度整合、语音和视觉功能、ChatGPT搜索、打电话和WhatsApp聊天等功能。

总体来说，前11天没有什么太多的惊喜，第12天出现的o3相对具有一定的创新能力。它的能力主要表现为解决了之前的一些技术难题，我认为有三个值得一提的亮点：

1. 在ARC-AGI测试中o3的成绩远超其他模型。ARC-AGI测试就像是为人工智能准备的一个特殊"考试"。它不是考AI背诵了多少知识，而是测试AI是否真的具备"理解力"和"思考力"。对目前的AI技术而言，一般的大模型在ARC-AGI测试中的成绩大约都在25%-50%之间，而o3的最低成绩为75.7%，最高成绩为87.5%，有着巨大差距。

2. o3 在全球著名的编码竞赛平台codeforces 中刷出 2727 分，达到此分数的程序员不到200人，之前2073分已相当于终极者，而o1是1891分。这意味着在竞争性代码方面，o3已经达到了世界顶尖程序员水平。

3. 今年11月o3在陶哲轩等60余位全球数学家共同推出的号称业界最强数学基准的EpochAI Frontier Math中创下新纪录，准确率达到25.2%。而今天所有其他模型的准确率都低于2%。联手60多位数学家出题的陶哲轩，曾认为这项测试能够难住AI好多年。如今，这一说法被OpenAI o3推翻了。

可以看到，o3在各方面的表现都让人惊艳，因此很多人判断它会影响未来世界的样态。

‍田渊栋博士：AI正在掀起一阵洪流

计算机普及以后，它的普遍性就像水一样。反观大模型，随着它的不断发展，也会出现同样的情况。AI出现之前，创业的模式是找很多人组建一个团队，团队里的每个人需要不断地试炼和培训才能成为一名有用之才，这一过程大约需要20年的时间。但如果AI变得非常便宜，创业者就可以以极低的成本获得稳定性和乐此不疲的劳动力。到那个时候，市场会是什么样子难以想象，但对于创业者来说，成本和风险会降低很多。

AI的分析能力非常强大，因为它有一个巨大的资料库。我用过一些AI工具，我感觉它们很像小镇做题家，通过大量的训练不断地提升自身的能力，最终寻找到解题的方式。因此它的出现未必对所有人来说都是好事情，例如那些习惯用做题思维解决问题的人。因为AI的水平很大程度上可以取代一些重复性的劳动，做题思维可替代性很高。这告诉我们：不要以一种高考做题家的状态去工作和生活，要保持思维的活力和创造力。这样我们才可以尽量避免被AI淘汰。

AI到来之前，我们的世界布满了山峰，每个山峰上都站着行业里最优秀的人。AI到来之后，它掀起了一阵洪流，让一些山峰上的人被冲刷，以至掉落。留下来的人，只会是最具创造性、不可替代性的人，同时也是领域里的专家。这大概会在十年内发生。

‍田渊栋博士：2025的活法，是让AI来加速自己

我认为在2025年，AI会更快速地发展。加速到一定程度之后，每个人都会开始使用AI，以防止自己的效率远低于其他人。如果这一猜想变成现实，人的价值感会受到影响。我的价值是什么？人类独一无二的价值是什么？这是每个人都要面对的问题。

这个问题很难回答，但我们可以在行动中不断地接近问题的答案，比如我愿意通过写小说找到一些存在的价值，这是我自我定位的一个锚点。AI的出现在提醒我们，人最终要找到自己的独一无二之处，立足世界的生态位。在寻找的过程中，我们可以利用AI加速自己的发展，把AI集合起来，让它们成为自己的将领，协助你做成想做的事。

‍脉脉林凡：OpenAI的发展遇到了瓶颈

从这次12天发布会来看，OpenAI的发展受阻了。整个模型的核心能力没有如预期一样实现Scaling law增长，这其中的主要问题不是算力，而是数据。总体来看，现在所有的模型训练基本上耗尽了高质量的数据，哪怕通过合成数据或其他方式来逼近都无法产生足够的效应。

这是为什么？首先，AI的听觉能力目前无法增强；其次，视觉数据方面有太多的噪音（比如YouTube上的视频），海量信息的杂糅，让AI去理解世界、生成内容存在比较大的限制。

因此我们可以判断，OpenAI遇到了瓶颈期。有一个很简单的道理——如果核心能力足够强，其实不用讲太多的内容。正如此前的ChatGTP-4，只需要一场发布会就足以震惊世界。而这次为期12天的发布会却没有掀起之前那么大的火花。对我们创业者来说，可以根据这次OpenAI的情况来计划未来一两年的创业路径。一定要记住一件事：对于核心基座的能力，它的突破速度没有那么快。

‍脉脉林凡：o3大大提高了AI应用爆发的可能性

打一个比方，如果用高铁来去形容AI的能力进展的话，GPT3.5相当于每小时120公里的火车速度一下提到了每小时200公里，速度翻了将近一倍，对于很多人来讲，已经是一个很大的进步了。GPT4出来的时候，相当于每小时200公里提高到每小时350公里。那么o3呢？相当于提升到了每小时450公里。对于做研究的同学来讲，已经是很大的提升了。但是，作为一个普通消费者，一列350公里时速的高铁和一列450公里时速的高铁，对生活的影响就比较小了。为什么？从3小时的旅程变成了2小时20分钟的旅程，时长变化的体感并不强烈。

在技术上，不管是九月份发布的o1，还是12月份发布的o3，其实都是在Post-Train（后训练）环节做出了比较大的突破，比如思维链的训练、强化学习方面做了很多处理。很多跟我们一样做过AI应用，尤其是To B的 AI应用的人会有一种体感，我们去做agent，去做工作流，其实是在OpenAI上面去打了一堆的业务补丁，业务的状态机控制在顶层，然后通过顶层的状态机去让AI做1、2、3、4、5、6的事情。当然，这个过程很痛苦，因为有的时候它真的很不听话，你要它这么干，它却干出了另外一件事情出来。

所以，现在OpenAI做的Post-Train这件事情，相当于把你上层的逻辑内化到了模型内部，做了内置，这样就会降低后链路开发的难度和复杂度。在新的一年里，AI应用开发的难度会降低，效率和大爆发的可能性会极大提高。这件事情我觉得是需要关注和重视的。

‍脉脉林凡：AI的创业机会不在To B，在To C

对于中国创业者而言，To B行业的 Agent开发或 workflow的优化都不是我们的机会。美国的To B生态非常发达，很多创业者做完workflow的优化后马上就能赚到钱，但中国只适合大厂去做这件事，并且他们自己就能做，不需要找创业者。

在这种情况下，To C是创业者们唯一的机会。Realtime API是一种实时语音交互API，支持文本和音频作为输入和输出，比我们原先用的TTS、ASR的效果好很多。在这个方面，Realtime API的出现会让To C行业的交互产生巨变。例如，面向儿童群体的实时语音交互应用肯定会很受欢迎。但当前还缺乏一种类似于Agent这样的框架与之协同，因为仅依靠大模型的话准确度不高，需要一个可以控制的介质。一旦控制能力与实时语音交互能力结合在一起，会为整个To c行业的创业者带来一次巨大的突破机会。

‍云迹科技创始人支涛：AI已超越了工具，其能力好比拥有了大理段氏的“六脉神剑”

人类为了延伸体力和脑力制造了很多工具，比如火车、电脑、电动工具。这次OpenAI的发布会也发布了一系列我们梦寐以求的工具。在我看来，这些工具超越了“工具”的定义，变成了六脉神剑。它有自主力，学习力、交互力、适应力、情感力和社会力。按照目前的发展来看，AI已经是生产关系和生产力的重要组成部分。

看完发布会以后，有没有觉得AI像是一个正在现实世界不断学习的学生呢。在回答我们问题的时候，是语文；在帮我们进行推理的时候，是数学和经济学；在辅助我们工作的时候，是工程技术、生命科学和管理学。一旦它们试图创新，则会逐个攻读哲学、心理学，甚至是组织行为学。

AI这种硅基生物通过不断地迭代，从开始的辅助工具，逐渐演变为人类身边的助理，如果有一天，它们变成了智能体，就会成为我们的伙伴。一旦它们开始洞察世界，找到人类还没有发现的问题时，它们则化身为一个创新者的面貌出现在我们面前。

我们人类如何实现成长？对今天的我们来说，要先学习使用它们的方式，在它们的发展过程中掌握自身的领导力，最后创建一个“超级智慧的超个体意识”，与AI做到你中有我，我中有你。这其中要让他们跟我们一样，使命、愿景、价值观对齐；在社会里高度统一的法律、法规、道德形成一致。

‍云迹科技创始人支涛：AI在To B的应用场景需要进一步打开

重塑与AI的对话能力十分重要，因为这样才能让AI更好地为我们服务。中国企业在To C场景的推进较好，在To B的应用场景需要进一步打开。To B里，需要更多的人转换思维模式，理解并用好AI来做职业增强，解决实际问题，创造价值。这也提醒了我们企业，不仅要给To C场景提供生产力，还要在ToB场景里提供生产关系。未来，希望中国企业能够快速发展，加大To B对AI的使用率。

‍云九资本合伙人任鑫：OpenAI发布会与你无关

由于大家都是从业者，因此对AI格外关注，还会守着这次OpenAI发布会的直播。在这里我想给大家提供另一个视角，仅代表我个人的观点，只是给一些业外的朋友们一点建议：建议大家不要关心这件事，它不重要。

首先，如果你不是专业人士，不要花太多精力预测AI的未来。我常常会跟一些CEO或者研究员聊到这个话题，最后的结论是，很多业内专业人士的观点并不一致。这告诉我们要充分相信一件事——没有人知道未来会怎样。既然没有人知道未来会怎样，我们只要明确一件事：你现在的状态如何以及你想不想蹭到AI的红利。如果你的状态足够好，你可以有选择。但如果你现在的状态欠佳，心里又跃跃欲试，这个时候其实更不需要预测，因为你没有选择，必须参与。如果想要跟上时代趋势，你只能投身其中。

其次，要具体地思考问题，不要抽象地评判。OpenAI会不会被Google 打败？Deepseek与GPT-4o哪一个更好？如果你是应用方，最好不要这样去思考问题。你的思考落点一定要非常具体，把具体的事物放置在你的场景里，判断它会产生什么样具体的结果，这才是业务导向的思维方式。

‍云九资本合伙人任鑫：不要想太多，先要多用起来

大家有可能听过一种说法，说AI应用不够广泛。但是实际我们调研下来发现，现在AI的应用已经极其广泛，只是大家没有大声吆喝。比如前几天的OpenAI掉线了一会儿，然后推特上铺天盖地都是学生在哭喊：我的论文怎么办？我要交作业！小朋友们用它来写作业这件事情已经非常普遍。然后国内大模型的应用场景当中，一个非常巨大的板块叫做写公文，写报告，也是铺天盖地地在用。

还有当你在网上招聘，你给他电话面试、视频面试的时候，很多小朋友已经在他的电脑上开了一个copilot，你问任何问题，copilot都会结合他的简历和回答来帮他实时作弊。所以，我建议大家不要低估世界的发展，年轻人已经都用起来了，如果我们没有用起来，只是我们老了而已。

我们是一家孵化器，我们会支持一些创业者帮他们把他们的产品实现。在大半年前，我们就已经做到了后端的代码没有一行是人类写的，全部都是AI写的。现在我知道已经有无数的公司做到了。

再举一个例子，前几天有一个同事让我看一个美国项目的招聘计划。但是实际上我是外行，我招他是因为他比我内行，如果按照以前的做法，我会跟他说，这个点你再想一想，我觉得可以怎么样，要不要再修改一下，外行指导内行。但是，前几天我给他的反馈已经变成了：“这件事情你分三个维度，去跟o1聊半个小时，看看它能不能给你更好的建议。如果有的话，你回来告诉我这件事情还有可能往哪些方向优化。”我也没有AI懂，你不如直接去问AI。所以，大家会发现在工作当中，我们相当于引入了一个更好的第三方。

最后，在决策上也是这样，我们现在已经不是拍脑袋想了，而是每一次都跟AI聊聊。我的很多想法都是跟AI聊出来的。

所以，我强烈建议大家在关注新闻的同时，自己更多地用起来。所有事情都是可以用上AI的，就看你想不想得到。真正稀缺的不是知识，而是实践的机会。大家一定不要挖空心思去搞懂OpenAI在干嘛，业外人也搞不懂，赶紧把这些东西全部用一遍，然后在生活当中创造100个实践的机会。这些机会会逼着你去更好地学习，然后这些更好的学习可以帮助我们创造更多的可能性。

////// END //////