创造软件将不再受编程语言能力约束,创造和使用软件的方式将发生巨大的改变。
整理 | 王启隆
出品丨AI 科技大本营(ID:rgznai100)
GitHub CEO
Thomas Dohmke
曾在今年的
TED 演讲
上分享了
他通过 AI 编程开发的一款专属应用,用来记录他一生中乘坐的所有航班。他自己吐槽说这是一款无聊的应用,但这却是属于他自己一个人的 App,且整个开发过程仅用
自然语言
完成,只花了喝一杯酒的时间。
Thomas
紧接着强调:“
不久之后,每个人都能像我一样,开发出专属于自己的 App
。
” 这句话的“每个人”并不是指“每一名程序员”,而是世界上的“
每一位普通人
”。
这一切,并不是仅靠 OpenAI ChatGPT 的驱动,而是与紧随其后的开源 AI 浪潮息息相关。如今开源 AI 大模型层出不穷,不仅有企业巨头 Meta 开发的 Llama,还出现了法国独角兽 Mistral、马斯克谋划已久
的 Grok、英伟达最新开源的
Nemotron、登顶 Hugging Face 的国产阿里云 Qwen2
……
开源的风吹进了千家百户,让每个人都能享受到这场正在进行的 AI 革命
。
作为国内最早推广开源文化的技术社区,CSDN 团结了我国最早的一批开源贡献者与数千万华人开发者,历经了移动互联网时代和云原生时代两大变革。如今面对 AI 技术的迅猛发展
,CSDN 创始人、总裁
蒋涛
在北京智源大会的“AI 开源”分论坛上
带来了自己的思考与观察,以开发者的视角
总结了当前
开源大模型时代的
范式变化
与
AI
应用
的
爆发趋势
,观点提炼如下
:
-
我们正从程序员的“2G 时代”进入真正的智能时代,即所谓的 3G 时代。随着大模型在本地设备上的运行,对应的“4G 时代”也将加速到来,AI 应用产生巨大爆发。
-
开源和闭源的工具在不断涌现,
AI 技术生态的演进速度是过去云计算的十倍以上。
每一次新技术带来范式的转移,
应用的渗透速度都会加倍
。
-
智能体(Agent)写代码只是临时的热点,未来智能体将彻底改变人机交互的方式,
我们身边的每一个设备都会智能化
。
-
所有的电脑用户都将能够从零开始开发小型软件工具,创造软件将不再受编程语言能力约束,创造和使用软件的方式将发生巨大的改变。
每个人都可以创作数百个专属应用,每家企业都可以拥有专属个性化应用市场
。
以下为演讲全文整理:
AI 大模型是一场新生态革命
我从事编程很多年,经历了行业的很多演变周期。但这两年我发现,我们其实原本处于程序员的“
2G 时代
”,现在才开始进入真正的智能时代,即所谓的 3G 时代。
CSDN 在这些年里积累了超过 5300 万的注册用户,每天新增约两万用户。如今全球开发者数量持续增加,根据 GitHub 截止到 5 月份的数据,全球开发者数量达 1.32 亿,增长了 30%。而在中国,每年新增开发者数量达到七八百万,几乎与我国的大学生数量持平。
我们有一半的用户同时使用 CSDN 和 GitHub,但是我们中国也需要自己的GitHub,因此 CSDN 在 2020 年开始建设
GitCode
项目,去年与华为进行战略合作,底层使用华为的 CodeArts,上层面向中国开发者提供服务。
此外,我们也举办一些深度的技术大会,比如今年 7 月很快会在北京开启一场
全球软件研发技术大会
,探讨的主题和这篇文章一样:
在开源大模型时代,软件研发将发生什么变化
。
计算范式的变化
首先是底层计算范式的变化。今年 6 月份高考的时候,我曾听北大计算机系的陈忠教授建议“
不要选择计算机专业
,因为冯诺依曼架构已不再是主流
”,现在连教材都还来不及换。AndreJ Karpathy 在 2017 年曾提出了
软件 1.0
和
软件 2.0
的概念,标志着我们程序员从通过 if else 等规则解决问题,转变为神经网络自学习解决问题。
图片来源:Andrej Karpathy “Software 2.0”
过去我们做的是确定性的、规则性的计算,研究结构化的数据串行如何执行;但神经网络的计算是不一样的,它需要向量和并行,它计算的是下一个词出现的概率(next-word prediction),充满了不确定性。
这里有个经典的类比:
我们相当于从经典物理时代进入了量子物理时代
。
开发范式的变化
大模型的出现带来了开发工具的巨大变化,此前被视为没什么机会的云计算也在不断演变。比如 CoreWeave,这家公司是做加密货币挖矿起家的,后面被英伟达投资了 80 亿美元专门做 GPU 算力;而在中国,前阿里巴巴副总裁贾扬清创办的 Lepton AI 就是云原生 AI 平台,专门做推理服务。这些案例体现了基础设施的革新。
围绕模型训练和生成式工具,各种新技术和工具链不断涌现,并且大部分都是开源的。开源项目的发展速度非常快,例如 Meta 的 Llama 项目虽然不到一年时间,但其生态项目的 Star 数已达 24 万,而 Kafka 和 Spark 做了十几年也只有其五分之一。
AI 技术生态的演进速度,是过去云计算的十倍以上
。我们原先是
以半年为单位来学习技术的最新动向,现在则需以周为单位学习。
图片来源:Sapphire Ventures
此外,作为 AI 大模型的驱动者,OpenAI 如今收入达到了非常惊人的 34 亿美元(
去年是
20 亿
),它也是史上最快达到一亿用户的公司。据最新统计,OpenAI 的独立访问用户已经超过 6 亿。
对开发者而言,
AI 带来了编程范式的变化,开发从本地化走向云化,再到 AI 化,最终借助大模型赋能实现了
平民化
。
新的工具链不断涌现,帮助开发者编写、测试甚至 Review 代码。
GitHub 此前推出了 Copilot,并结合 Workspace,让 AI 可以随时在写代码的过程中提供帮助。这也解决了开发人员面临的最大障碍 —— 将想法转化为详细规范。
但现在,我们也面临许多严峻的挑战。
例如,我去年在注册 GitHub Octoverse 大会的时候发现居然没有中国选项,这也是我们开发 GitCode 的原因之一。此外,
编辑器也在发生变化,比如 OpenAI 投资的 Cursor AI 可以在写代码时无缝集成 AI 助手,提供了极大的帮助。
未来的编程方式将更加智能化,AI 助手将无处不在。当前大量工具仍由欧美公司掌握,但我们也在积极发展自己的工具链,比如华为、智谱和智源等公司都在努力,相信
AI 带来的机会对中国的公司和大模型厂商是一个巨大的机遇期
。
这一点可以类比汽车领域:德国、日本曾在燃油车领先了很多年,中国想追上传统燃油车几乎是不可能的,但是
我们
在电动车领域就实现了很好的超越。所以工具链也是如此,我们很难追赶 20 年的差距,但可以从 AI 编程入手。
我们的调查显示,AI 编程工具的使用率和留存率非常高,48.6% 的开发者每天使用 AI 编程工具。
GitHub Copilot 是世界上最领先的工具,占有率却只有 28%,这有点类似于电动车领域里特斯拉的地位。而
阿里的通义灵码等
国产工具
表现不错,使用占比 25.5%,国产化程度达到了历史新高。
此外,付费意愿值得一提,有 71.8% 的中国开发者愿意为工具付费。
未来可能是智能体(Agent)开发的时代,写代码只是临时过程,更多的智能体将帮助开发者完成工作。
例如,前段时间爆火的「
D
evin
」就号称“
你
的第一个 AI 软件工程师
”。
总之,开源和闭源的工具在不断涌现。
交互范式的变化
随着用户与开发工具的变化,应用也会随之改变。每一次的技术转型同样会带来应用的类型变更,如今从 GUI 图形交互转为自然语言交互,应用形态正在发生变革。
我们总结,从 PC 时代、互联网时代再到移动互联网时代,应用的渗透速度都会加倍。如今进入生成式 AI 的应用时代,会用更短的时间完成范式的转移
。
人工智能的大模型时代并不是从
2022
年底才开始的,前面有很长的积累期,正如我开头提到
2G
时代将过渡到
3G
,可能马上就会进入
4G
的加速时代。
如果大模型未来能够在我们的本地电脑上很好地运行(苹果已经在今年 WWDC 2024 大会上演示了 iPhone 上的 7B 模型),
会带来应用的巨大爆发。
创造软件将不再受编程语言能力的约束
应用将如何实现爆发呢?我们总结了三个关键点:
行业应用 AI 化、终端应用服务化和应用行业可塑化
。
行业应用 AI 化
我曾提出过一个观点:
大模型新时代,
人人都是开发者、行行知识炼模型
。每个行业都应该有自己的行业模型,基于自身的知识和数据,推动全行业 AI 化。
图片来源:
Battery Ventures
此前美国投资机构 Battery Ventures 整理过法律领域的 AI 应用点。可以看到,光是法律领域,每个点都可以独立做一个模型,如专利 Review、合同 Review 等等。同样的情况在 AI 营销工具中也出现了,包括 SEO 和内容生成工具。
终端应用服务化
目前主流的交互方式还是依赖点击和键盘,但比尔·盖茨先前在他的个人网站发表过观点,他认为
智能体将是新的交互方式,
智能体会颠覆软件行业,引领自我们从输入命令到点击图标以来最大的计算机革命
。