在过去的一个月,OpenAI连续推出12场重磅发布会:
Day 1:满血o1上线,ChatGPT Pro会员上线,o1 pro推出,AI有了类人“思考”能力。Day 2:基于o1的强化微调,人人都能训练专家模型,专业门槛直线下降。Day 3:Sora正式发布,AI开始“看懂”现实世界。Day 4:ChatGPT Canvas全员开放以及小功能更新,写文章、写代码一气呵成。Day 5:全面接入苹果生态,打造更自然的多设备跨平台操作体验。Day 6:4o的实时视频理解上线,多模态让AI看懂视频内容。Day 7:ChatGPT上线 “Projects项目”功能。Day 8:ChatGPT Search全量开放,升级AI搜索功能,挑战传统网络搜索。Day 9:满血o1 API正式开放,大幅降低API调用价格。Day 10:从最新款的iPhone到老式的翻盖机,能直接和ChatGPT打电话聊天了。Day 11:应用升级,桌面版GPT可以跨应用互联,告别繁琐的复制粘贴对话。Day 12:OpenAI o3正式发布,超级智能模型震撼登场,向AGI又迈进了一大步。每一天的发布会都是振聋发聩的技术突破与产品创新,这些前所未有的技术加速度正在深刻改变全球的商业格局、产业生态以及个体的能力边界。12月28日,混沌邀请到了硅谷知名华人AI科学家田渊栋博士,脉脉创始人兼CEO林凡,云迹科技创始人、混沌学园校友支涛,云九资本合伙人、混沌创新领教任鑫,混沌合伙人、混沌创新领教张雷等AI行业从业者、专家们一起解读了OpenAI的这12场发布会。这不仅是一场关于AI技术趋势的分享,更是一场关于个人未来发展的思考。AI带来的不仅是工具的进化,更是思维的迭代与格局的重塑。在2025即将到来之际,让我们站在技术与人性的交汇点,重新审视未来的可能性。
田渊栋博士:OpenAI o3的表现依然惊艳
前段时间,OpenAI连续开 12 天的产品发布会,内容大致包括增强的ChatGPT o1模型、Sora视频生成模型和o3模型。另外,还有一些技术上的突破,包括推理模型o1、强化微调技术、文生视频Sora、写作和编程工具Canvas、与Apple生态系统的深度整合、语音和视觉功能、ChatGPT搜索、打电话和WhatsApp聊天等功能。总体来说,前11天没有什么太多的惊喜,第12天出现的o3相对具有一定的创新能力。它的能力主要表现为解决了之前的一些技术难题,我认为有三个值得一提的亮点:1. 在ARC-AGI测试中o3的成绩远超其他模型。ARC-AGI测试就像是为人工智能准备的一个特殊"考试"。它不是考AI背诵了多少知识,而是测试AI是否真的具备"理解力"和"思考力"。对目前的AI技术而言,一般的大模型在ARC-AGI测试中的成绩大约都在25%-50%之间,而o3的最低成绩为75.7%,最高成绩为87.5%,有着巨大差距。2. o3 在全球著名的编码竞赛平台codeforces 中刷出 2727 分,达到此分数的程序员不到200人,之前2073分已相当于终极者,而o1是1891分。这意味着在竞争性代码方面,o3已经达到了世界顶尖程序员水平。3. 今年11月o3在陶哲轩等60余位全球数学家共同推出的号称业界最强数学基准的EpochAI Frontier Math中创下新纪录,准确率达到25.2%。而今天所有其他模型的准确率都低于2%。联手60多位数学家出题的陶哲轩,曾认为这项测试能够难住AI好多年。如今,这一说法被OpenAI o3推翻了。可以看到,o3在各方面的表现都让人惊艳,因此很多人判断它会影响未来世界的样态。
田渊栋博士:AI正在掀起一阵洪流
计算机普及以后,它的普遍性就像水一样。反观大模型,随着它的不断发展,也会出现同样的情况。AI出现之前,创业的模式是找很多人组建一个团队,团队里的每个人需要不断地试炼和培训才能成为一名有用之才,这一过程大约需要20年的时间。但如果AI变得非常便宜,创业者就可以以极低的成本获得稳定性和乐此不疲的劳动力。到那个时候,市场会是什么样子难以想象,但对于创业者来说,成本和风险会降低很多。AI的分析能力非常强大,因为它有一个巨大的资料库。我用过一些AI工具,我感觉它们很像小镇做题家,通过大量的训练不断地提升自身的能力,最终寻找到解题的方式。因此它的出现未必对所有人来说都是好事情,例如那些习惯用做题思维解决问题的人。因为AI的水平很大程度上可以取代一些重复性的劳动,做题思维可替代性很高。这告诉我们:不要以一种高考做题家的状态去工作和生活,要保持思维的活力和创造力。这样我们才可以尽量避免被AI淘汰。AI到来之前,我们的世界布满了山峰,每个山峰上都站着行业里最优秀的人。AI到来之后,它掀起了一阵洪流,让一些山峰上的人被冲刷,以至掉落。留下来的人,只会是最具创造性、不可替代性的人,同时也是领域里的专家。这大概会在十年内发生。
田渊栋博士:2025的活法,是让AI来加速自己
我认为在2025年,AI会更快速地发展。加速到一定程度之后,每个人都会开始使用AI,以防止自己的效率远低于其他人。如果这一猜想变成现实,人的价值感会受到影响。我的价值是什么?人类独一无二的价值是什么?这是每个人都要面对的问题。这个问题很难回答,但我们可以在行动中不断地接近问题的答案,比如我愿意通过写小说找到一些存在的价值,这是我自我定位的一个锚点。AI的出现在提醒我们,人最终要找到自己的独一无二之处,立足世界的生态位。在寻找的过程中,我们可以利用AI加速自己的发展,把AI集合起来,让它们成为自己的将领,协助你做成想做的事。
脉脉林凡:OpenAI的发展遇到了瓶颈
从这次12天发布会来看,OpenAI的发展受阻了。整个模型的核心能力没有如预期一样实现Scaling law增长,这其中的主要问题不是算力,而是数据。总体来看,现在所有的模型训练基本上耗尽了高质量的数据,哪怕通过合成数据或其他方式来逼近都无法产生足够的效应。这是为什么?首先,AI的听觉能力目前无法增强;其次,视觉数据方面有太多的噪音(比如YouTube上的视频),海量信息的杂糅,让AI去理解世界、生成内容存在比较大的限制。因此我们可以判断,OpenAI遇到了瓶颈期。有一个很简单的道理——如果核心能力足够强,其实不用讲太多的内容。正如此前的ChatGTP-4,只需要一场发布会就足以震惊世界。而这次为期12天的发布会却没有掀起之前那么大的火花。对我们创业者来说,可以根据这次OpenAI的情况来计划未来一两年的创业路径。一定要记住一件事:对于核心基座的能力,它的突破速度没有那么快。
脉脉林凡:o3大大提高了AI应用爆发的可能性
打一个比方,如果用高铁来去形容AI的能力进展的话,GPT3.5相当于每小时120公里的火车速度一下提到了每小时200公里,速度翻了将近一倍,对于很多人来讲,已经是一个很大的进步了。GPT4出来的时候,相当于每小时200公里提高到每小时350公里。那么o3呢?相当于提升到了每小时450公里。对于做研究的同学来讲,已经是很大的提升了。但是,作为一个普通消费者,一列350公里时速的高铁和一列450公里时速的高铁,对生活的影响就比较小了。为什么?从3小时的旅程变成了2小时20分钟的旅程,时长变化的体感并不强烈。在技术上,不管是九月份发布的o1,还是12月份发布的o3,其实都是在Post-Train(后训练)环节做出了比较大的突破,比如思维链的训练、强化学习方面做了很多处理。很多跟我们一样做过AI应用,尤其是To B的 AI应用的人会有一种体感,我们去做agent,去做工作流,其实是在OpenAI上面去打了一堆的业务补丁,业务的状态机控制在顶层,然后通过顶层的状态机去让AI做1、2、3、4、5、6的事情。当然,这个过程很痛苦,因为有的时候它真的很不听话,你要它这么干,它却干出了另外一件事情出来。所以,现在OpenAI做的Post-Train这件事情,相当于把你上层的逻辑内化到了模型内部,做了内置,这样就会降低后链路开发的难度和复杂度。在新的一年里,AI应用开发的难度会降低,效率和大爆发的可能性会极大提高。这件事情我觉得是需要关注和重视的。
脉脉林凡:AI的创业机会不在To B,在To C
对于中国创业者而言,To B行业的 Agent开发或 workflow的优化都不是我们的机会。美国的To B生态非常发达,很多创业者做完workflow的优化后马上就能赚到钱,但中国只适合大厂去做这件事,并且他们自己就能做,不需要找创业者。在这种情况下,To C是创业者们唯一的机会。Realtime API是一种实时语音交互API,支持文本和音频作为输入和输出,比我们原先用的TTS、ASR的效果好很多。在这个方面,Realtime API的出现会让To C行业的交互产生巨变。例如,面向儿童群体的实时语音交互应用肯定会很受欢迎。但当前还缺乏一种类似于Agent这样的框架与之协同,因为仅依靠大模型的话准确度不高,需要一个可以控制的介质。一旦控制能力与实时语音交互能力结合在一起,会为整个To c行业的创业者带来一次巨大的突破机会。
云迹科技创始人支涛:AI已超越了工具,其能力好比拥有了大理段氏的“六脉神剑”
人类为了延伸体力和脑力制造了很多工具,比如火车、电脑、电动工具。这次OpenAI的发布会也发布了一系列我们梦寐以求的工具。在我看来,这些工具超越了“工具”的定义,变成了六脉神剑。它有自主力,学习力、交互力、适应力、情感力和社会力。按照目前的发展来看,AI已经是生产关系和生产力的重要组成部分。看完发布会以后,有没有觉得AI像是一个正在现实世界不断学习的学生呢。在回答我们问题的时候,是语文;在帮我们进行推理的时候,是数学和经济学;在辅助我们工作的时候,是工程技术、生命科学和管理学。一旦它们试图创新,则会逐个攻读哲学、心理学,甚至是组织行为学。AI这种硅基生物通过不断地迭代,从开始的辅助工具,逐渐演变为人类身边的助理,如果有一天,它们变成了智能体,就会成为我们的伙伴。一旦它们开始洞察世界,找到人类还没有发现的问题时,它们则化身为一个创新者的面貌出现在我们面前。我们人类如何实现成长?对今天的我们来说,要先学习使用它们的方式,在它们的发展过程中掌握自身的领导力,最后创建一个“超级智慧的超个体意识”,与AI做到你中有我,我中有你。这其中要让他们跟我们一样,使命、愿景、价值观对齐;在社会里高度统一的法律、法规、道德形成一致。
云迹科技创始人支涛:AI在To B的应用场景需要进一步打开
重塑与AI的对话能力十分重要,因为这样才能让AI更好地为我们服务。中国企业在To C场景的推进较好,在To B的应用场景需要进一步打开。To B里,需要更多的人转换思维模式,理解并用好AI来做职业增强,解决实际问题,创造价值。这也提醒了我们企业,不仅要给To C场景提供生产力,还要在ToB场景里提供生产关系。未来,希望中国企业能够快速发展,加大To B对AI的使用率。
云九资本合伙人任鑫:OpenAI发布会与你无关
由于大家都是从业者,因此对AI格外关注,还会守着这次OpenAI发布会的直播。在这里我想给大家提供另一个视角,仅代表我个人的观点,只是给一些业外的朋友们一点建议:建议大家不要关心这件事,它不重要。首先,如果你不是专业人士,不要花太多精力预测AI的未来。我常常会跟一些CEO或者研究员聊到这个话题,最后的结论是,很多业内专业人士的观点并不一致。这告诉我们要充分相信一件事——没有人知道未来会怎样。既然没有人知道未来会怎样,我们只要明确一件事:你现在的状态如何以及你想不想蹭到AI的红利。如果你的状态足够好,你可以有选择。但如果你现在的状态欠佳,心里又跃跃欲试,这个时候其实更不需要预测,因为你没有选择,必须参与。如果想要跟上时代趋势,你只能投身其中。其次,要具体地思考问题,不要抽象地评判。OpenAI会不会被Google 打败?Deepseek与GPT-4o哪一个更好?如果你是应用方,最好不要这样去思考问题。你的思考落点一定要非常具体,把具体的事物放置在你的场景里,判断它会产生什么样具体的结果,这才是业务导向的思维方式。
云九资本合伙人任鑫:不要想太多,先要多用起来
大家有可能听过一种说法,说AI应用不够广泛。但是实际我们调研下来发现,现在AI的应用已经极其广泛,只是大家没有大声吆喝。比如前几天的OpenAI掉线了一会儿,然后推特上铺天盖地都是学生在哭喊:我的论文怎么办?我要交作业!小朋友们用它来写作业这件事情已经非常普遍。然后国内大模型的应用场景当中,一个非常巨大的板块叫做写公文,写报告,也是铺天盖地地在用。还有当你在网上招聘,你给他电话面试、视频面试的时候,很多小朋友已经在他的电脑上开了一个copilot,你问任何问题,copilot都会结合他的简历和回答来帮他实时作弊。所以,我建议大家不要低估世界的发展,年轻人已经都用起来了,如果我们没有用起来,只是我们老了而已。我们是一家孵化器,我们会支持一些创业者帮他们把他们的产品实现。在大半年前,我们就已经做到了后端的代码没有一行是人类写的,全部都是AI写的。现在我知道已经有无数的公司做到了。再举一个例子,前几天有一个同事让我看一个美国项目的招聘计划。但是实际上我是外行,我招他是因为他比我内行,如果按照以前的做法,我会跟他说,这个点你再想一想,我觉得可以怎么样,要不要再修改一下,外行指导内行。但是,前几天我给他的反馈已经变成了:“这件事情你分三个维度,去跟o1聊半个小时,看看它能不能给你更好的建议。如果有的话,你回来告诉我这件事情还有可能往哪些方向优化。”我也没有AI懂,你不如直接去问AI。所以,大家会发现在工作当中,我们相当于引入了一个更好的第三方。最后,在决策上也是这样,我们现在已经不是拍脑袋想了,而是每一次都跟AI聊聊。我的很多想法都是跟AI聊出来的。所以,我强烈建议大家在关注新闻的同时,自己更多地用起来。所有事情都是可以用上AI的,就看你想不想得到。真正稀缺的不是知识,而是实践的机会。大家一定不要挖空心思去搞懂OpenAI在干嘛,业外人也搞不懂,赶紧把这些东西全部用一遍,然后在生活当中创造100个实践的机会。这些机会会逼着你去更好地学习,然后这些更好的学习可以帮助我们创造更多的可能性。