专栏名称: 国泰君安证券研究

国泰君安研究

OpenAI o1大模型开启新范式｜国君热点研究

国泰君安证券研究 · 公众号 · 证券 · 2024-09-20 06:58

正文

OpenAI 发布o1大模型（即草莓模型），推理能力大幅提升。国君海外科技、电子、计算机、传媒多个团队观点如下：

进一步打开AI应用落地的空间

国君海外科技秦和平团队：o1大模型首次证明了语言模型可以进行真正的强化学习，推理能力可沿着Scaling Law而得到提升，走向真正的“智能”。OpenAI o1是经过强化学习训练来执行复杂推理任务的新型语言模型，o1在回答之前会思考，可以在响应用户前产生一个很长的内部思维链。思维链意味着模型在作出反应之前，花更多时间思考问题，将棘手的步骤分解为更简单的步骤，尝试不同的策略，并认识到自己的错误。这种Scaling束与LLM的预训练显著不同，Scaling重心向后训练&推理转移。o1的性能可通过提高强化学习（训练时计算）和思考时间（测试时计算）而持续提高，扩展这种方法的限制与LLM预训练的限制有很大不同。模型不仅仅拥有训练时的 Scaling Law，还拥有推理层面的 Scaling Law，双曲线的共同增长，将突破之前大模型能力的提升瓶颈。

o1模型验证了算力需求持续性及AI应用落地的光明前景。1）算力持续性：o1通过思维链进行推理，会进行反复试错，推理链较长导致推理算力需求量远超传统LLM。2）应用：o1系列模型对于处理代码的智能体系统有重要提升，Cognition AI使用 Devin（首个AI软件工程师）评估o1的推理能力，gpt-4o、o1预览版、o1正式版的评估分分别为25.9%、34.6%、51.8%。此外，o1系列可以帮医疗保健研究人员来注释细胞测序数据、帮助物理学家可以生成量子光学所需的复杂数学公式，所有领域的开发人员可以使用o1来构建和执行多步骤工作流程。我们认为，具备推理能力的更智能的大模型将进一步打开AI应用落地的空间，出现Killer级应用指日可待。

AI算力基建提速

国君电子舒迪团队：看好OpenAI的新模型o1和o1 mini在推理端处理复杂任务如科学、数学、编程的能力，也看好新模型的持续迭代将继续拉动AI算力基建。新模型是更为垂直的“偏科生”：o1-mini和o1-preview这些增强的推理能力可能特别适用于处理科学、编程、数学以及类似领域中的复杂问题。相较于GPT-4o，o1模型强调推理性、准确性和专业性，而o1 mini是一个强调成本效益的高效推理模型。o1系列在准确生成和调试复杂代码方面表现出色。类似于人类在回答一个难题之前可能会思考很长时间，通过强化学习，o1学会了磨练其思考链并改进它使用的策略，将复杂的步骤简化成更简单的步骤。这个过程显著提高了模型的推理能力。而OpenAI o1-mini是一个更快、更便宜、更高效的推理模型，特别适用于编程。作为一个较小的模型，o1-mini比o1-preview便宜80%，使其成为需要推理但不需要广泛世界知识的应用的强大且具有成本效益的模型。

仍处于应用早期

国君计算机团队：OpenAI o1突破人工智能能力新水平，学会人类“慢思考”。OpenAI o1相比之前的AI大模型最跨越性的一步在于拥有人类“慢思考”的特质：系统性、逻辑性、批判性、意识性。在响应用户提出的难题之前，OpenAI o1会产生一个缜密的内部思维链，进行长时间的思考，完善思考过程、意识逻辑错误、优化使用策略、推理正确答案。这种深度思考能力在处理数学、编程、代码、优化等高难度问题时发挥重要作用，能够进行博士级别的科学问答，成为真正的通用推理。 但是，OpenAI o1算力成本高昂，仍处于应用早期。

关注游戏、智慧教育领域

国君传媒陈筱团队：关注AI推理能力提升对游戏、应用、智慧教育的推动。以OpenAI为代表的大模型公司能力再进步，有望推动AI应用效果提升，特别是在工作效率、智慧教育领域的改进：1）游戏产业对AI代码、逻辑等能力要求较高，o1为代表的推理能力较强的模型将有所帮助。2）各类AI应用场景效果改善。3）o1体现出AI数理能力的提升，智慧教育或可加速推进。

风险提示：AI相关的资本金投入不及预期、AI相关政策落地不及预期、AI相关的投入产出比不及预期、AI相关公司的营收不及预期。

>>以上内容节选自国泰君安证券已经发布的研究报告，具体分析内容（包括风险提示等）请详见完整版报告。

《o1大模型涌现推理能力，推动AI产业加速前进》

2024年9月16日

秦和平，资格证书编号：S0880523110003

《OpenAI o1开启大模型应用新范式》

2024年9月16日

朱丽江，资格证书编号：S0880523060002

伍巍，资格证书编号：S0880123070157

《OpenAI发布o1模型，AI逻辑推理能力进步》

2024年9月14日

陈筱，资格证书编号：S0880515040003

杨昊，资格证书编号：S0880524020001

李芓漪，资格证书编号：S0880523080004

《强调推理的OpenAI o1模型发布，AI算力基建提速》

2024年9月13日

舒迪，资格证书编号：S0880521070002

李奇，资格证书编号：S0880523060001

关联阅读

OpenAI Sora合集｜国君热点研究

GPT-4o带来哪些机会｜国君热点研究

推荐阅读

更多国君研究和服务

亦可联系对口销售获取

重要提醒

本订阅号所载内容仅面向国泰君安证券研究服务签约客户。因本资料暂时无法设置访问限制，根据《证券期货投资者适当性管理办法》的要求，若您并非国泰君安证券研究服务签约客户，为保证服务质量、控制投资风险，还请取消关注，请勿订阅、接收或使用本订阅号中的任何信息。我们对由此给您造成的不便表示诚挚歉意，非常感谢您的理解与配合！如有任何疑问，敬请按照文末联系方式与我们联系。

法律声明

本公众订阅号(微信号: GTJARESEARCH )为国泰君安证券股份有限公司(以下简称“国泰君安证券”) 研究所依法设立、独立运营的唯一官方订阅号。其他机构或个人在微信平台上以国泰君安研究所名义注册的，或含有“国泰君安研究"，或含有与国泰君安证券研究所品牌名称相关信息的其他订阅号均不是国泰君安证券研究所官方订阅号。

本订阅号不是国泰君安证券研究报告发布平台，本订阅号所载内容均来自于国泰君安证券研究所已正式发布的研究报告，如需了解详细的证券研究信息，请具体参见国泰君安证券研究所发布的完整报告。

在任何情况下，本订阅号的内容不构成对任何人的投资建议，国泰君安证券也不对任何人因使用本订阅号所载任何内容所引致的任何损失负任何责任。

本订阅号所载内容版权仅为国泰君安证券所有，国泰君安证券对本订阅号保留一切法律权利。订阅人对本订阅号发布的所有内容(包括文字、影像等)进行复制、转载的，需注明出处为“国泰君安研究”，且不得对本订阅号所载内容进行任何有悖原意的引用、删节和修改。