专栏名称: 独角兽智库

独角兽智库是一个新兴产业投研平台，搭建新兴领域高端技术与投资机构、传统行业的桥梁，让专业的资本找到优质的企业，实现新兴产业的快速发展。平台提供新兴产业干货报告、专家咨询服务。

行业深度：AI编程，未来已来

独角兽智库 · 公众号 · 科技投资 · 2025-02-17 23:01

正文

独角兽智库产业研究第一智库

独角兽投研情报群招募

独角兽智库发展至今，历时9年，积累了大量资源，也和顶尖投研资源形成了利益共同体，并经过今年近一年的产品测试，小范围会员服务近两年。

十一月精准把握住了 固态电池、AI+ 等板块机会，个股 桂发祥、华胜天成、供销大集 等

现开放体验名额，加微信 ：itouzi8888， 文末有二维码

核心观点

1、大模型军备竞赛，编程能力跃进，AI编程未来已来

大模型军备竞赛，编程能力跃进，为AI编码应用繁荣夯实基础底座。 Claude 3.5 sonnet (new)在HumanEval代码生成基准测试得分高居93.7%；OpenAI 12月发布的推理模型o3 Codeforces得分为2727，编程能力超过99%的人类程序员。

国产大模型编程能力快速补齐，DeepSeek-V3、豆包1.5-pro模型在多个公开评测表现优异，比肩OpenAI、Claude系前沿模型，有望孕育国产AI编程应用。

AI编程前景广阔 ，Spherical Insights预计2032年AI编码工具市场超295亿美元。微软、亚马逊、谷歌、Salesforce等多家科技巨头广泛利用AI编程技术降本增效。

2、海外AI编程杀手级应用涌现

海外已涌现多款AI编程应用跑通商业闭环，获得明星资本和科技巨头客户认可，充分验证AI编程市场潜力，包括Copilot、Agent2种形态。Copilot代表如 GitHub Copilot、Cursor等，能够实现代码补齐优化等功能，收费数十美元/月，Agent 以Cognition Devin为代表，可独立完成代码开发等复杂任务，收费500美元/月。Information报道OpenAI也在开发一款编程Agent，相当于6级工程师的能力。

GitHub Copilot：实现亿级美元ARR，商业化进展积极。 根据微软业绩会，2024年4月，GitHub Copilot已付费用户增长至180万，增速显著。2024年7月，GitHub Copilot收入超过GitHub 2018年被微软收购时的水平（2-3亿美元）。

Cursor：产品力强劲，获明星资本加持。 根据Sacra估计，2024年11月Cursor的ARR达到6500万美元，同比增长6400%，ARR高增长凸显卓越产品力。2025年1月完成超1亿美金B轮融资，此前曾获OpenAI投资。

Cognition：牵手微软，编程Agent Devin开放商业化。 Devin [production]评测表现优于GPT4o和o1，2024年5月宣布与微软合作，强强联合推广编程Agent。

3、国产AI编程应用初显峥嵘

字节跳动：MarsCode和Trae齐发，剑指AI编程蓝海。 2024年6月，字节跳动发布基于豆包大模型打造的智能开发工具-豆包MarsCode，在国内免费开放；2025年1月，豆包全新上线AI编程功能，并推出面向海外的AI编程工具Trae，支持AI问答、代码自动补全、基于Agent的AI编程等功能。

卓易信息：艾普阳低代码IDE新产品前景光明。 子公司艾普阳PowerBuilder产品基本盘稳固，低代码IDE新品SnapDevelop前景光明，有望成为公司新增长点。

科大讯飞：星火4.0 Turbo全新升级，代码智能体iFIyCode持续选代。 2025年1月升级的讯飞星火4.0 Turbo全面对标GPT-4o。模型升级驱动代码智能体iFIyCode持续选代，代码采纳率和单元测试行覆盖率快速提升，成长前景光明。

普元信息：国内低代码领军，引领软件研发智能体建设。 公司为国内低代码领域市场领军，连续中标金融、政务、制造领域，前沿引领编程智能体开发。

4、投资建议

我们看好AI编程市场潜力和国内领军公司成长前景，推荐卓易信息、科大讯飞、普元信息等，受益标的包括金现代等。

风险提示： 产业落地不及预期；市场竞争加剧风险；公司研发不及预期风险等。

目录:

正文:

1、大模型军备竞赛，编程能力跃进，AI编程未来已来

大模型军备竞赛，编程能力跃进，有望孕育AI编码杀手级应用。 2023年以来国内外大模型持续迭代，其中编程能力提升尤为显著，代码正确性和编程速度等方面快速改善。我们认为大模型编程能力快速提升为AI编程应用生态繁荣夯实基础底座。

Claude 3.5 sonnet (new)代码生成测试得分领先。 以Claude系列模型为例，2024年10月发布的Claude 3.5 sonnet (new)版本编程能力超预期，HumanEval代码生成基准测试得分高居93.7%，较2023年的Claude1.3得分56%、Claude2得分71.2%显著提升。

OpenAI发布下一代推理模型o3，推理能力提升。 12月20日，OpenAI发布下一代推理模型o3和o3 mini，o3推理能力较此前的o1模型进一步提升，其中编程能力方面，o3模型Codeforces（编程测评系统）得分为2727，超过99%的人类程序员。

METR研究显示在2个小时内的编程任务中，Claude 3.5 Sonnet和o1-preview表现均优于人类专家。 根据METR (Model Evaluation and Threat Research) 研究结果，AI编程速度能以超越人类10倍速度生成并测试各种方案。给定2个小时，Claude 3.5 Sonnet和o1-preview在7项具有挑战性研究工程中，击败了50多名人类专家。在一个需要编写自定义内核以优化前缀和运算的任务中，o1-preview不仅完成了任务，还创造了惊人的成绩：将运行时间压缩到0.64毫秒，甚至超越了最优秀的人类专家解决方案（0.67毫秒）。

Github 调研显示AI在提高代码质量、使用新编程语言、生成测试案例等方面效果显著。 根据Github2024年发布的一项针对全球软件开发者调查结果，目前已经有97%的受访开发者表示在工作内外中使用过AI编程类工具，他们认为AI在提高代码质量、使用新的编程语言并理解现有代码库以及生成测试用例方面效果显著。

2024年Github上的公共生成式AI项目数量快速增长。 根据Github 2024 年Octoverse报告，GitHub 上的开发人员创建了7万多个新的公共和开源生成式 AI 项目，对 GitHub 上所有生成式AI项目的总贡献增加了近 60%。

AI编程未来已来，AI编程前景广阔。 Spherical Insights预计2032年AI编码工具市场规模超295亿美元。科技巨头利用AI编程技术降本增效。亚马逊将生成式AI开发助手“Amazon Q”集成到内部系统，节省了约4500个开发人员一年的工作量，节约2.6亿美元的运营资金。谷歌CEO在2024Q3财报电话会表示谷歌超25%新代码由AI生成，然后由工程师审查通过。Salesforce利用Agentforce和其他AI技术将团队生产力提高30%以上。

国产大模型代码能力快速补齐，DeepSeek-V3代码场景测评表现比肩GPT-4o及 Claude-3.5-Sonnet。 12月26日，全新系列模型 DeepSeek-V3 首个版本上线并同步开源。根据官方论文，DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及 Claude-3.5-Sonnet不分伯仲。

在算法类代码场景（Codeforces），DeepSeek-V3测评表现领先于市面上已有的全部非o1类模型，并在工程类代码场景（SWE-Bench Verified）逼近 Claude-3.5-Sonnet-1022。

豆包通用模型pro代码能力提升显著。 12月18日2024年冬季火山引擎FORCE原动力大会上，火山引擎总裁谭待宣布豆包通用模型pro完成新版本迭代，其中代码能力提升速度最为显著。

具体来看，综合任务处理能力较5月份提升32%，在推理上提升13%，在指令遵循上提升9%，在代码上提升58%，在数学上提升43%，在专业知识领域能力提升54%。

豆包全新基础模型 Doubao-1.5-pro模型能力全面升级。 1月22日，豆包全新基础模型 Doubao-1.5-pro正式发布，Code等方面的能力在多个公开评测基准上表现优异。

2、海外AI编程杀手级应用涌现

2.1、GitHub Copilot：实现亿级美元ARR，商业化进展积极

GitHub与OpenAI合作推出 GitHub Copilot，2021年6月，GitHub 宣布与OpenAI合作开发的AI编程工具 GitHub Copilot，在Visual Studio Code开发环境中进行技术预览，专业开发人员可以使用GPT-3模型更快速地编写代码。目前GitHub Copilot支持使用 Claude 3.5 Sonnet和 GPT-4o模型。

GitHub Copilot生成的代码多数正确，尤其是在Java和C++语言。 根据《GitHub Copilot: the perfect Code compLeeter？》论文，作者基于LeetCode问题集评估GitHub Copilot生成的代码质量，具体评估了Copilot在4种编程语言（Java、C++、Python3和Rust），代码生成阶段的可靠性、生成代码的正确性以及其对编程语言、问题难度和问题主题的依赖性，并评估了代码的时间和内存效率，并将其与平均人类结果进行比较。

研究发现Copilot成功解决了大多数问题，且在Java和C++中生成代码的成功率要高于Python3和Rust。根据LeetCode的统计信息，GitHub Copilot生成的代码平均水平比人类更有效率。

GitHub Copilot采用订阅制收费模式。 2022年6月，GitHub正式宣布GitHub Copilot 推出“技术预览版”，并基于订阅服务提供给个人开发者。目前针对Pro/Business/Enterprise用户，分别收费10/19/39美元/月。

GitHub Copilot付费用户规模快速增长，商业化进展积极。 2022年7月，GitHub Copilot发布仅一月即实现超过40万订阅用户；截至2024年4月，GitHub Copilot付费用户增长至180万，增速显著。

2023年10月，GitHub CEO Thomas Dohmke 宣布 GitHub Copilot ARR突破1亿美元，并且Copilot项目已经实现盈利。根据2024年7月微软业绩电话会，GitHub Copilot收入已经超过GitHub 2018年被微软收购时的水平（2-3亿美元）。我们认为GitHub Copilot作为头部AI编程应用商业化进展积极，彰显AI编程成长前景。

2.2、Cursor：产品力强劲，获明星资本加持

Cursor产品表现惊艳，吸引多家知名客户。 Cursor具备多行编辑、跨文件上下文补全、下一个动作预测等功能。开发者只需不断按下Tab键，就可自动完成整个文件的代码修改，且Cursor的处理结果更准确，速度更快。

凭借流畅的产品体验，2024年8月，特斯拉前AI总监Andrej Karpathy在X上连发数条推文称赞Cursor。此外，Cursor还吸引了OpenAI、Midjourney、Perplexity、shopify、三星等多家知名公司。

Cursor ARR高增长。 根据公司官网，Cursor针对Pro/Business用户，分别收费20/40美元/月，定价高于GitHub Copilot。根据Sacra估计，2024年11月，Cursor的年度经常性收入（ARR）达到6500万美元，同比增长6400%。

Cursor公司主体Anysphere获明星资本投资。 2025年1月Cursor官网宣布完成超过1亿美金的B轮融资，机构包括Thrive Capital、Andreessen Horowitz、Benchmark等，此前Anysphere还曾获OpenAI等知名机构投资。我们认为OpenAI和明星资本投资充分验证Cursor产品实力，也彰显AI编程赛道前景。

2.3、Cognition：牵手微软，编程Agent Devin开放商业化

Cognition推出AI软件工程师Devin，性能表现优异。 2024年3月份，Cognition宣布推出首个AI软件工程师Devin。伴随在长期推理和规划方面的进步，Devin可以规划和执行需要数千次决策的复杂工程任务，Devin可以在每一步都召回相关的上下文，随着时间的推移学习，并纠正错误。

Cognition团队通过SWE-bench测试评估Devin，要求 agent解决在开源项目中（如Django和scikit-learn）找到的真实世界GitHub问题。Devin正确解决了13.86%的问题，超过此前大模型的最好表现（Claude2，4.80%）。

Devin [production]表现优于GPT4o和o1。 2024年9月，根据cognition-golden基准评估结果，较GPT 4o，o1模型显著提升了Devin表现。但Devin与客户合作研发的Agent“Devin [production]”表现更为优异，Devin [production]依赖于根据专有数据进行后期训练的模型。

Devin开放商业化。 2024年12月，Cognition官网宣布Devin全面开放商业化，针对Team客户收费500美元/月。相较Copilot，Devin作为编程agent收费更为高昂。创始人&CEO Scott Wu表示，AI代码助手工具使用通用模型可以进行代码自动补全，或编写某些文件或函数，整体上将工程效率提升10%-20%；但Devin可以替代用户完成整个任务，能够测试自己的代码，实时运行，查阅文档，甚至自行访问网站，提升10倍。

Devin获得微软等伙伴认可。 2024年5月，Devin宣布与微软合作，微软开发人员将使用Devin实现代码迁移等工作，并将Devin引入客户，微软CTO盛赞Devin是一款非凡工具。

3、国产AI编程应用初显峥嵘

3.1、字节跳动：MarsCode和Trae齐发，剑指AI编程蓝海

字节跳动发布“豆包MarsCode”智能开发工具。 2024年6月，字节跳动发布基于豆包大模型打造的智能开发工具-豆包MarsCode，面向国内开发者免费开放。豆包MarsCode产品负责人王海建介绍了豆包MarsCode产品的两种形态-编程助手和CloudIDE，同时通过需求开发、修复Bug、开源项目学习三个实际场景，详细演示了豆包MarsCode的项目问答、代码补全、单测生成、BugFix等功能。2025年1月，豆包在电脑版和网页版全新上线了AI编程功能，完善AI编程领域布局。

字节跳动推出面向海外的AI编程工具Trae，从Copilot向Autopilot的转变。 1月20日，字节跳动推出了一款面向海外市场的AI编程工具Trae，内置GPT-4o、Claude-3.5-Sonnet模型供免费使用，支持AI问答、代码自动补全、基于Agent的AI编程等功能。

3.2、科大讯飞：星火4.0 Turbo全新升级，代码智能体iFIyCode持续选代

科大讯飞发布智能编程助手iFlyCode，支持SaaS模式和私有化部署。 iFlyCode基于先进的星火认知大模型，提供代码生成、代码续写、代码解释、单元测试等能力。iFlyCode针对个人和中小企业提供SaaS公有化服务；并面向金融、工业、教育等头部客户提供私有化部署版本，可以提供纯软，也可以凭借讯飞星火一体机进行软硬一体化部署。

讯飞星火4.0 Turbo全新升级，代码等七大能力全面提升。 2025年1月15日，讯飞星火4.0 Turbo底座再次全面升级，代码七大核心能力全面提升，星火底座已全面对标OpenAI 最新版的GPT-4o。

代码智能体iFIyCode持续选代。 2024年6月27日，科大讯飞正式发布星火企业智能体平台，并推出代码智能体iFlyCode等案例。iFlyCode集成了代码生成助手、架构设计助手、代码问答助手、测试助手、数据库优化助手、代码审核助手等六大场景智能体，代码在科大讯飞内部的采纳率已经从2023年10月份的30%涨到52%，单元测试行覆盖率从30%提到50%，实用性显著增强。

3.3、卓易信息：艾普阳低代码IDE新产品前景光明

公司收购IDE领军公司艾普阳。 2023年公司收购IDE工具软件开发商艾普阳52%的股权；2024年9月，公司公告以自有资金 2.73亿元收购少数股东所持有的艾普阳科技剩余 48%股权，收购完成后公司将持有艾普阳科技100%股权。艾普阳科技是企业应用开发工具领域的领导者，旗下产品包含SnapDevelop、PowerBuilder、PowerServer等，全球服务超过18000家客户，包括众多世界500强企业。

艾普阳少数股东就艾普阳2024年度做出了实际净现金流不低于4600万元的业绩承诺，以及在2024-2026年度期间，每年度对于新产品的研发和销售费用投入应至少不低于2023年度对新产品实际投入的研发和销售费用，即不低于960万元/年的承诺以及业绩补偿承诺。

艾普阳PowerBuilder产品基本盘稳固，低代码IDE新产品前景光明。 艾普阳科技目前收入主要来自于PowerBuilder系列产品，PowerBuilder系列产品的业绩稳定并略有增长。此外，艾普阳科技于2023年底发布的低代码IDE新产品SnapDevelop已于2024年发布正式版本，目前处于免费推广阶段；截至目前，该产品已积累了免费用户超过2000户。伴随艾普阳不断丰富产品系列，艾普阳科技在稳定的盈利能力及现金流基础上，预计未来还有较大的成长空间，有望为公司带来新的增长点。

艾普阳研发云原生IDE工具产品DevMagicStudio ，它是一种低代码工具，用于为开源.NET 框架快速开发云原生应用程序，包括可视化工具和代码生成器，支持使用Powerbuilder 开发的应用无缝升级。可替代国外主流商业开发工具(VisualStudio、Rider)的同等功能。

艾普阳具备丰富客户资源。 艾普阳服务的客户在全球各行业都有强大的覆盖，包括财富500强企业（如埃克森美孚、AT&T、英国石油公司、雪佛龙、西门子等）、政府客户、独立软件开发商（ISV）和中小企业等。客户主要分布于北美、欧洲和亚洲，产品最终主要应用于金融、医疗、政府、软件等行业。市场角度看，PowerBuilder系列产品没有直接替代品，更换到不同的产品需要较大的成本和风险来重写系统，艾普阳深圳客户群体较稳定。

3.4、普元信息：国内低代码领军，引领软件研发智能体建设

普元信息为业内领先的一站式软件基础平台提供商。 普元在中国信通院发布的“智能流程赋能者象限”中位列“行业赋能价值第一”，为国内低代码领域市场领导者。中国企业数字化联盟《央国企数据治理市场发展白皮书（2023）》显示，普元在央国企数据治理和主数据市场占有率第一。IDC《中国银行业IT解决方案市场份额，2023》报告显示，普元应用开发平台市场排名第一。计世资讯《2022-2023年中国中间件市场发展研究报告》显示，普元在新兴中间件领域处于领导者地位，产品技术能力、市场及战略能力均位列第一。

普元信息智能化低代码开发平台发布，结合专有模型大幅提升软件生产力。 2023年7月，在“低代码+AI”产品战略发布会上，普元智能化低代码开发平台正式发布。平台整合普元自研专有模型，接入多款AI大模型能力，提供包含中间件、业务分析、应用开发、数据中台与业务流程自动化在内的全系列低代码产品家族，致力于变革企业复杂软件的生产方式，降低企业数智化转型难度。

普元信息在2003年发布了国内首款专业低代码平台产品EOS，并面向各行业头部客户的信息化建设需求，持续以低代码技术的方式，升级应用开发、数据治理、应用支撑与集成能力，累计帮助超过5000家大型企业，建设超过10万款企业应用，累积了面向企业级应用开发的海量业务对象和数据指标，基于大模型接入以及微调训练，最终构建成为普元专有模型能力。

普元信息积极探索构建软件研发智能体 ，通过业务标准化、工程标准化和知识持续积累，训练多智能体协同工作，实现“人+智能体”的未来研发模式。业务标准化，梳理、规范并优化业务流程，形成标准化的业务活动和业务操作。工程标准化，基于标准化的业务活动和业务操作形成业务组件，业务组件需要具备可变性来适用不同的业务变化，通过业务组件的组合能够构建新的业务场景。知识的持续积累与优化，则是利用知识结构化描述实现融合专家经验、流程挖掘与现有系统的持续积累，实现思维链训练框架，为智能体提供高效学习路径。

普元信息低代码项目连续中标。 公司重点面向金融、电信、政务、能源、先进制造等行业建设自主可控软件基础设施的需求，提供融入低代码开发理念的全栈式信创中间件产品与解决方案，获得多家重点行业大中型客户及合作伙伴的持续认可。

4、投资建议

我们看好AI编程市场潜力和国内领军公司成长前景，推荐卓易信息、科大讯飞、普元信息等，受益标的包括金现代等。

5、风险提示

产业落地不及预期风险： （1）AI产品技术研发进展不及预期，AI大模型更新迭代受技术路径、算力成本、人员投入及监管等影响，其进展存在不确定性；（2）AI应用商业化落地进展不及预期，受大模型能力、实际应用效果、消费者接受度及收入预期等因素影响，AI应用商业化进展存在不及预期的风险。

市场竞争加剧风险： 伴随人工智能行业技术日趋成熟，政府的多项利好政策加速行业的整体生态建设，未来的市场进入者预期将不断增加，行业整体竞争未来将呈现逐步加剧态势。

公司研发不及预期风险： 全球人工智能技术和产品呈现日新月异的发展态势，新技术、新产品、新模式的更迭速度较快。在技术不断升级迭代过程中，若研发成果不达预期或不符合客户需求、研发进度落后于行业水平或短期之内无法转化为收入、研发产品出现替代性的创新技术等情况，将会对公司产品的销售和市场竞争力造成不利影响；同时，在新产品开发过程中，公司需要投入大量的人力和资金，若公司前期研发投入的成本无法收回，也会对公司经营业绩产生不利影响。

现开放投研情报群体验名额，更多投研情报服务，请往下看