OpenAI 发布o1大模型(即草莓模型),推理能力大幅提升。国君海外科技、电子、计算机、传媒多个团队观点如下:
进一步打开AI应用落地的空间
国君海外科技秦和平团队:o1大模型首次证明了语言模型可以进行真正的强化学习,推理能力可沿着Scaling Law而得到提升,走向真正的“智能”。OpenAI o1是经过强化学习训练来执行复杂推理任务的新型语言模型,o1在回答之前会思考,可以在响应用户前产生一个很长的内部思维链。思维链意味着模型在作出反应之前,花更多时间思考问题,将棘手的步骤分解为更简单的步骤,尝试不同的策略,并认识到自己的错误。这种Scaling束与LLM的预训练显著不同,Scaling重心向后训练&推理转移。o1的性能可通过提高强化学习(训练时计算)和思考时间(测试时计算)而持续提高,扩展这种方法的限制与LLM预训练的限制有很大不同。模型不仅仅拥有训练时的 Scaling Law,还拥有推理层面的 Scaling Law,双曲线的共同增长,将突破之前大模型能力的提升瓶颈。
o1模型验证了算力需求持续性及AI应用落地的光明前景。1)算力持续性:o1通过思维链进行推理,会进行反复试错,推理链较长导致推理算力需求量远超传统LLM。2)应用:o1系列模型对于处理代码的智能体系统有重要提升,Cognition AI使用 Devin(首个AI软件工程师)评估o1的推理能力,gpt-4o、o1预览版、o1正式版的评估分分别为25.9%、34.6%、51.8%。此外,o1系列可以帮医疗保健研究人员来注释细胞测序数据、帮助物理学家可以生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用o1来构建和执行多步骤工作流程。我们认为,具备推理能力的更智能的大模型将进一步打开AI应用落地的空间,出现Killer级应用指日可待。
AI算力基建提速
国君电子舒迪团队:看好OpenAI的新模型o1和o1 mini在推理端处理复杂任务如科学、数学、编程的能力,也看好新模型的持续迭代将继续拉动AI算力基建。新模型是更为垂直的“偏科生”:o1-mini和o1-preview这些增强的推理能力可能特别适用于处理科学、编程、数学以及类似领域中的复杂问题。相较于GPT-4o,o1模型强调推理性、准确性和专业性,而o1 mini是一个强调成本效益的高效推理模型。o1系列在准确生成和调试复杂代码方面表现出色。类似于人类在回答一个难题之前可能会思考很长时间,通过强化学习,o1学会了磨练其思考链并改进它使用的策略,将复杂的步骤简化成更简单的步骤。这个过程显著提高了模型的推理能力。而OpenAI o1-mini是一个更快、更便宜、更高效的推理模型,特别适用于编程。作为一个较小的模型,o1-mini比o1-preview便宜80%,使其成为需要推理但不需要广泛世界知识的应用的强大且具有成本效益的模型。
仍处于应用早期
国君计算机团队:OpenAI o1突破人工智能能力新水平,学会人类“慢思考”。OpenAI o1相比之前的AI大模型最跨越性的一步在于拥有人类“慢思考”的特质:系统性、逻辑性、批判性、意识性。在响应用户提出的难题之前,OpenAI o1会产生一个缜密的内部思维链,进行长时间的思考,完善思考过程、意识逻辑错误、优化使用策略、推理正确答案。这种深度思考能力在处理数学、编程、代码、优化等高难度问题时发挥重要作用,能够进行博士级别的科学问答,成为真正的通用推理。 但是,OpenAI o1算力成本高昂,仍处于应用早期。
关注游戏、智慧教育领域
国君传媒陈筱团队:关注AI推理能力提升对游戏、应用、智慧教育的推动。以OpenAI为代表的大模型公司能力再进步,有望推动AI应用效果提升,特别是在工作效率、智慧教育领域的改进:1)游戏产业对AI代码、逻辑等能力要求较高,o1为代表的推理能力较强的模型将有所帮助。2)各类AI应用场景效果改善。3)o1体现出AI数理能力的提升,智慧教育或可加速推进。
风险提示:AI相关的资本金投入不及预期、AI相关政策落地不及预期、AI相关的投入产出比不及预期、AI相关公司的营收不及预期。
>>以上内容节选自国泰君安证券已经发布的研究报告,具体分析内容(包括风险提示等)请详见完整版报告。
《o1大模型涌现推理能力,推动AI产业加速前进》
2024年9月16日
秦和平,资格证书编号:S0880523110003
《OpenAI o1开启大模型应用新范式》
2024年9月16日
朱丽江,资格证书编号:S0880523060002
伍 巍,资格证书编号:S0880123070157
《OpenAI发布o1模型,AI逻辑推理能力进步》
2024年9月14日
陈 筱,资格证书编号:S0880515040003
杨 昊,资格证书编号:S0880524020001李芓漪,资格证书编号:S0880523080004
《强调推理的OpenAI o1模型发布,AI算力基建提速》
2024年9月13日
舒 迪,资格证书编号:S0880521070002
李 奇,资格证书编号:S0880523060001 关 联 阅 读
OpenAI Sora合集|国君热点研究
GPT-4o带来哪些机会|国君热点研究
推 荐 阅 读