专栏名称: AI科技大本营
为AI领域从业者提供人工智能领域热点报道和海量重磅访谈;面向技术人员,提供AI技术领域前沿研究进展和技术成长路线;面向垂直企业,实现行业应用与技术创新的对接。全方位触及人工智能时代,连接AI技术的创造者和使用者。
目录
相关文章推荐
什么值得买  ·  这个节电小玩意,骗了多少农村老人?? ·  2 天前  
上海市场监管  ·  明天开始!新一轮消费券就按攻略这么领→ ·  3 天前  
上海市场监管  ·  明天开始!新一轮消费券就按攻略这么领→ ·  3 天前  
华人生活网  ·  手速要快!巴塔、Burberry、CK、汤米 ... ·  3 天前  
华人生活网  ·  手速要快!巴塔、Burberry、CK、汤米 ... ·  3 天前  
51好读  ›  专栏  ›  AI科技大本营

李彦宏:开源模型会越来越落后,自然语言将成为新的通用编程语言

AI科技大本营  · 公众号  ·  · 2024-04-16 17:28

正文

整理 | 沭七
出品丨AI 科技大本营(ID:rgznai100)

一个月前,百度创始人、董事长兼首席执行官李彦宏在《对话》中直指:以后不会存在“程序员”这种职业了,因为只要会说话,人人都会具备程序员的能力。“未来的编程语言只会剩下两种,一种叫做英文,一种叫做中文。”

类似的话,OpenAI 联创 Andrej Karpathy 曾在 2023 年初也表达过( The hottest new programming language is English” ),但李彦宏直指程序员这一职业将不复存在的言论一出便引发了广泛的热议。

一个月 之后的今天,北京时间 4 月 16 日,李彦宏在 Create 2024 百度 AI 开发者大会上发表“人人都是开发者”的主题演讲,再一次力证“未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”

基于此,李彦宏 为开发者们 式发布了 三大 开箱即用”的工具, 分别是 智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder,以及各种尺寸的模型定 制工具 ModelBuilder,助力所有开发者实现生产力的跃升

李彦宏的此次演讲信息量巨大,其多个观点都引发了 AI、开源等不同从业者的深度讨论。在大模型风靡席卷的一年后,AI 从业者逐渐回归理性,一个模型无法解决所有问题、大小模型混用成为结论之一,贾扬清也赞同了李彦宏对于 AI 原生应用的具体思路。但另一方面,李彦宏提出在大模型时代,“开源模型会越来越落后”引发了争议,在以 GPT、Llama 为代表的闭开源并驾齐驱的今天,对于开闭源模型至今尚未有定论。

精彩观点速览:

  • 自然语言将成为新的通用编程语言,只要会说话就可以成为一名开发者。今天,你不会写代码,也可以做出一个 AI 应用;不用编程,也可以做出一个智能体。

  • AI 正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。

  • 大模型本身并不直接创造价值,基于大模型开发出来的 AI 应用才能满足真实的市场需求。

  • 智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。

  • 大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。

  • 面向未来,我认为多模态大模型,或者说文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往 AGI 的必经之路。

以下为李彦宏演讲实录 (为便于阅读,经过不改变原意的删减):

大家好,欢迎参加 Create 2024 百度 AI 开发者大会,这是 Create 大会首次在粤港澳大湾区举办。今天现场来了 5000 多位开发者和科技爱好者。过去这一年,我跟很多创业者、开发者交流,感觉大家都处在一种“FOMO”状态,也就是 Fear of Missing Out,既兴奋、又害怕错过。确实,大模型和生成式 AI,将彻底改变开发者这个群体。

过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。

这一天并不遥远,我们看到,因为有了强大的基础大模型,有了很多低门槛,甚至零门槛的开发工具,开发者的生产力大大提高了。

比如,基于文心大模型的智能代码助手 Comate,不仅支持 100 多种语言和所有主流 IDE 平台,可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码。上岗一年多,Comate 已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了 46%, 百度每天新增的代码中,已经有 27%是由 Comate 生成的。

今天,你不会写代码,也可以做出一个 AI 应用;不用编程,也可以做出一个智能体。AI 正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。

作为一家技术公司,百度的角色定位,就是尽可能地为大家提供所需的开发工具,不断提升整个社会的创造力。具体来说,我们提供 1 个强大的基础模型系列,就是文心大模型系列,这包括旗舰版的 ERNIE3.5, ERNIE4.0, 也包括轻量版的 ERNIE Speed、Lite、Tiny 等等。

我们还提供基于大模型来开发各种应用的工具,包括智能体开发工具 AgentBuilder,AI 原生应用开发工具 AppBuilder,以及各种尺寸的模型定制工具 ModelBuilder。这三个工具,都代表了先进生产力。下面,我会给大家一一展示。


文心一言用户超 2 亿,文心大模型 4.0 工具版发布

首先讲一下,文心一言和文心大模型的最新进展:

文心一言从去年 3 月 16 日发布,到今天是一年零一个月的时间。我们的用户数突破了 2 亿,API 日均调用量也突破了 2 亿,服务的客户数达到了 8.5 万,利用千帆平台开发的 AI 原生应用数超过了 19 万。

我们可以看到,文心一言正在改变更多人的工作和生活。

支撑文心一言的基座模型,就是文心大模型。过去一年,它经历了从 3.0 版本到 3.5,再到 4.0 版本的进化。文心 4.0 在理解、生成、逻辑、记忆四大能力方面,均达到了业界领军水平。

近几个月来,文心大模型在代码生成、代码解释、代码优化等通用能力方面实现了进一步的显著提升,达到国际领先水平。

今天,我们正式发布文心大模型 4.0 的工具版,现在,大家可以在工具版上,体验代码解释器功能,通过自然语言交互,就能实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供高效精准的支撑。

文心大模型已经成为了中国最领先、应用最广泛的 AI 基础模型。

不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的 5.1 倍,周均训练有效率达到 98.8%,推理性能提升了 105 倍,推理的成本降到了原来的 1%。

也就是说,客户原来一天调用 1 万次,同样成本现在可以调用 100 万次。媒体可能不会因为成本下降 99%而兴奋。但是企业也好,开发者也好,一旦用起来,最关注的就是效果和成本。

我们能在提升性能的同时,把推理成本降到 1%,正是因为百度在芯片、框架、模型、应用这四层架构上有着全栈的布局,通过端到端优化,不断地把成本打下来,让更多人都可以高效、低价地用大模型来做 AI 应用。

毫无疑问,大模型相关的话题,在 2024 年依然会很热,各类技术突破还会不断涌现。媒体也会继续热衷于用“震撼发布”“史诗级更新”这样的标题进行渲染。但 我想强调的是,大模型本身并不直接创造价值,基于大模型开发出来的 AI 应用才能满足真实的市场需求。


“踩了无数的坑,交了高昂学费”,李彦宏 分享开发 AI 原生应用的具体思路和工具

今天我想跟大家分享的是一些基于大模型开发 AI 原生应用的具体思路和工具。这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。

  • 第一是 MoE。

未来大型的 AI 原生应用基本都是 MoE 架构,这里所说的 MoE 不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,这都是有技术含量的,要针对应用的不同场景做匹配。

  • 第二是小模型。

小模型推理成本低,响应速度快,在一些特定场景中,经过 SFT 精调后的小模型,它的使用效果可以媲美大模型。 这就是我们发布 Speed、Lite、Tiny 三个轻量模型的原因。我们通过大模型,压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。

  • 第三是智能体。

智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,我们还可以让不同的智能体互动,相互协作,更高质量地完成任务。这些智能体能力,反思、规划、自我计划的能力,我们已经开发出来了,并且向开发者全面开放。

在 MoE、小模型、智能体这三个方向上,百度都已经给大家做好了“开箱即用”的工具。下面,我就给大家介绍三种不同的工具,分别是:智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder、各种尺寸的模型定制工具 ModelBuilder。

  • 智能体开发工具 AgentBuilder

首先是智能体开发工具 AgentBuilder。智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。

百度刚刚升级了文心智能体平台。截至目前,已经有 3 万多个智能体被创建、5 万多名开发者和上万家企业入驻。我们的目标是,让每个人、每个组织都成为智能体的开发者,打造国内最完整的智能体生态。

那如何实现这个目标呢?就是给大家提供零门槛的智能体开发工具 AgentBuilder。

下面我们就先以“新加坡旅游局”为例,看一个智能体是如何做出来的。

首先,我们打开文心智能体平台,创建页面有着零代码、低代码两种模式,新手可以直接选择“零代码模式”,用自然语言,几句话就能创建一个智能体。

我们先给智能体起名叫“新加坡旅游局”,然后在设定里写明需要打造旅游方案、解答问题,提供酒店门票预订服务,这些设定都是用来指导智能体的,告诉它都能做什么。

如果只需要基础智能体,平台会自动完成填写。但我们希望“新加坡旅游局”是一个专业的智能体,所以要进行高级配置。我可以把新加坡百科词条和官网链接都添加到知识库里,让它每天更新。然后添加一些工具,如酒店查询、景点门票购买等,增强它的服务能力。目前我们已经跟携程合作,提供了酒店、景点、票务等旅游服务工具。这样,一个新加坡旅游局的智能体就做好了,可以进一步预览、调优。

现在打开百度 App,搜索“什么时候去新加坡人最少”,因为大家出去旅游都想避开人潮。智能体会综合多个来源的信息,生成一个答案,“1-3 月人最少”。我们还可以点击智能体,和它进一步互动,比如去新加坡旅游的注意事项,推荐新加坡排名前三的酒店,还能让它直接预订新加坡环球影城的门票,一站式解决需求,大大节省了用户时间。

除了新加坡之外,大连、沈阳等文旅类智能体也都在文心智能体平台上线,还有知识类、创作类、学习类、娱乐类等各式各样的智能体,这些都是用 AgentBuilder 做出来的。

去年文心一言刚发布的时候,我就说过,文心一言会影响到每一家公司。因为它强大的自然语言理解能力、表达能力、推理能力,可以使任何一个公司都离自己的客户更近。

今天,每一个商家、每一个客户,都能在百度拥有专属的智能体。整个过程完全不需要编程,通过类似提示词的信息输入,和简单的几步操作调优,就能迅速生成一个智能体,成为 7X24 小时在线的金牌业务员。

我们接着来看一下,一个商家智能体是怎么做出来的。

启德教育是家知名教育企业,在全国有 60 多家分支机构,还有很多海外分公司,覆盖国家广,对接待的话术要求很高。如何能全天 24 小时回复客户的咨询,并且提高接待水平、降低经营成本呢?

启德教育利用百度的 AgentBuilder,打造了专属的智能体。

我们来看看,如何打造一个具备基本能力的智能体。很简单,在平台上填写智能体的头像、名称、经营业务范围和欢迎语,再设置一些需要用户提供的信息,比如年龄、学历。5 分钟、零门槛,一个智能体就做好了。

启德教育还希望这个智能体是个懂业务、懂学生的留学顾问。它可以针对学生的不同情况,比如想去美国还是澳洲、是硕士还是学士、雅思和托福考了多少分等等,做出专业分析,给出精准回答。我们可以通过添加知识、角色、工具这几大模块,来打造一个更高级的智能体。

在知识模块中,上传私域知识,让平台实时解析,自动生成对话语料;在角色模块,把一些不在经营范围内的留学国家,增加到过滤方案中,可以提高用户线索的有效率;在工具模块,加入预约到店等服务。通过这样几步简单操作,一个拥有专业能力的启德教育智能体就做好了。

现在,我们来搜索“澳洲留学申请条件”,可以看到智能体快速给出了需要的语言能力、专业选择等七大必备条件,还给能出相应的留学咨询方案,对各种难题都有问必答、有求必应。

启德教育智能体非常的受欢迎,上线第一周,就成功分发了 155 万次,与用户交互了 5.8 万次,线索转化量直线增长、有效线索的转化成本明显降低,经营效率大幅提升。

下面,我再给大家介绍一个家居行业的智能体。

索菲亚是专注全屋定制的家居品牌。它也可以通过填写极其简单的信息,创建出一个基础的商家智能体。但对于家居行业,消费者的线下体验更重要,所以索菲亚希望能在线上打造出一个金牌销售,还原线下的接待体验。

因此在进一步的设置中,它在角色模块,选择了数字人作为展示方式,然后给数字人选取了合适的背景和声音,并且结合平台的智能解析能力,自动总结了一套销售话术。最终打造出一位温柔亲切、话术专业的金牌销售,她能 24 小时满足用户的各种需求,提供高水准的服务体验。

当百度搜索用户有装修诉求时,索菲亚智能体会利用文心大模型的能力,优先给出问题的答案。除此之外,她还会主动与客户确认具体需求,如装修类型、预算等,并推荐附近的线下门店。

索菲亚商家智能体上线以来,有效线索成本下降了 30%。也就是说,它获得一个有效客户,如果过去的成本是 100 块,现在只需要 70 块了。

目前,已有超过 1 万个百度的客户拥有了商家智能体,涵盖了教育培训、房产家居、机械设备、商务服务等超过 30 个行业。

上面,通过三个 Demo,我展示了开发者和商家,如何利用 AgentBuilder,制作不同行业智能体的过程。

现在,制作一个智能体,真的就是分分钟的事。但问题来了!如果没流量、没分发、找不到、没人用,那么开发者和商家就没有收益,没有收益就没有动力。怎么解决这个痛点呢?

我们的文心智能体平台,为开发者们提供了流量变现的通路。除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体的相关能力,为开发者解决流量分发的后顾之忧,获得实打实的收益。

有分发,就会有数据反馈;有数据反馈,飞轮转起来,智能体就能够自主迭代,越用越聪明。文心智能体平台还上线了智能体的数据分析和问答调优模块,不久后还将有更多的新能力上线。文心智能体平台将通过分发-诊断-收益的数据飞轮,驱动智能体形成质量更优、流量更好、收益更大的正循环。

  • AppBuilder:自然语言三步就能开发一个应用

下面,我给大家介绍第二个开发工具,AppBuilder。它是目前最好用的 AI 原生应用开发工具。在 AppBuilder 上面,我们提前封装和预置了开发 AI 原生应用所需的各种组件和框架,大幅降低开发门槛。

最快只需三步,开发者就可以用自然语言开发出一个 AI 原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。我们来看几个案例:

今年年初,我们搞过一期 AI 原生应用开发挑战赛,赛题是利用 AppBuilder 打造一款“游乐场排队规划助手”,帮助游客更好地了解游乐场排队情况,设计个性化的游玩路线,在有限时间内获得最好的游玩体验。

这期比赛的冠军选手,没写一行代码,就开发出了应用,拿到了百度提供的 10 万元大奖。这个题目如果会写代码的话,你写一个并不难,但是你一行代码都不写还能做出来,那还是非常依赖基础模型和 AppBuilder 这个工具的能力的。

我们来看下,怎么用 AppBuilder,把这个 AI 应用做出来。

我们先回顾一下赛题。它假定了“环球影城”各个项目的排队时间和刺激指数,那么在有限的时间内获得刺激指数最高的体验,就是这期赛题要解决的问题。

首先,打开 AppBuilder 的开发界面,给应用起名“游乐场排队助手”;第二步,我们在角色指令中描述具体要求,包括调用代码解释器、算出在固定时间内的最佳组合、输出结果等;第三步就是到工具组件中,把代码解释器添加进来,帮助运算。

现在,我们来测下效果,在右侧输入问题“我有 3 个半小时时间,怎么玩最刺激?”,可以看到,代码解释器将这个问题翻译成了代码,再调用数据理解工具,对已知条件进行分析。经过一系列计算,得出将《哈利波特禁忌之旅》、《侏罗纪大冒险》、《霸天虎过山车》、《大黄蜂回旋机》,这四个项目组合游玩,效果最佳。测试没问题,点击发布,在零代码的情况下,一个应用就生成了。

现在,AppBuilder 又进一步升级了,在创建的过程中,全部可以通过“AI 优化配置”功能,自动帮助开发者优化角色指令、组件配置等环节,进一步提高开发效率。

我们再看一个例子。

今年年初,华北电力大学提出,希望为全校师生提供智能化的专属服务。基于百度的 AppBuilder,我们共同打造了一个华电 AI 助理,下面,我来给大家展示一下,华电 AI 助理是怎么做出来的:

第一步:打开 AppBuilder,进入创建页面,点击 AI 自动生成配置。首先为应用设置名称、简介、头像等基本信息。

第二步:通过自然语言在角色指令中描述具体要求,包括任务、组件能力、要求与限制。

第三步:插入自定义的图书借阅查询、课表查询、学生成绩查询等组件,让校园助手能够具备智能化服务的能力。之后再为校园助手添加一个开场白,这样应用就配置好了。

接下来,我们在预览界面中,结合用户提问,对助手进行调试。比如询问四六级考试的报名时间,测试各组件自动调用的效果。

大家可以看到,通过这些简单的操作,这个应用就构建完成了。目前已经小规模测试上线,接入了查制度、查课程,充饭卡、借书籍等高频场景,服务了学校广大师生。后续,我们将与华北电力大学一起,进一步深化应用合作,提供更为丰富便捷的服务。

百度在跨模态方面,也有着多年技术积累。在 AppBuilder 上面,我们也提供了一定的跨模态能力,你只需要给一段文字,或者几句话,就可以快速创建绘画类的应用,像漫画、儿童画本等。

过程也很简单:打开 AppBuilder,点击进入“应用创建”,输入角色指令,选择“添加文生图”组件,再输入三个推荐问题,就可以点击发布了。应用做好后,我们只需要输入一个大概想要的角色或剧情,AppBuilder 就可以自动生成故事、输出图画。

百度文库最新推出的智能漫画和画本生成功能,就利用了 AppBuilder 上提供的这类组件。我们来看看,百度文库的漫画生成功能,是如何让每一个有创想的人,都能做出好作品的。

咱们以经典的《周处除三害》为例。

打开百度文库,输入主题《周处除三害》,这在《晋书》和《世说新语》里都有写到,文库搜索后,会根据原文生成故事,我们也可以再对故事内容进行修改;然后点击右侧的 AI 工具栏,开始创建这篇漫画。

进入漫画制作界面,文库将根据故事情节为我们自动生成漫画分镜;然后从光影、写实、卡通等多种风格中,选择最贴合故事的漫画风格;最后根据角色选择不同的人物形象,这样就完成了漫画的生成。

漫画生成后,我们可以在百度文库的智能漫画编辑器里,浏览完整的漫画。同时,文库支持对每一个画面进行编辑、修改和精调,比如,在左侧选中画面“周处与白额虎”,点击编辑,增加画面描述“人物面容清晰,画面明亮”,就能精调出更符合需求的漫画。大家看到,百度文库的漫画功能在角色和场景的风格一致性方面,都做得非常出色。

百度文库的智能漫画能力,极大地提高了创作漫画的效率,降低了漫画创作的成本和门槛,可以让更多有想法、有创意的人实现自己的漫画创作梦。

不止生成漫画,百度文库现在还可以帮助用户零门槛的创作画本。大家可能不知道,中国小孩一年的人均绘本阅读量只有 10 本,而欧美国家是 50 本左右。现在,AI 能够让完全没有绘画能力的父母,也可以为自己的孩子创作一个专属的儿童画本了。下面我们就来看一下这个图文并茂的有声画本吧!

从去年开始,我们用 AI 重构了百度文库,使它成为用户“内容生产的起点”。如今,在 AppBuilder 的支持下,百度文库新推出的智能漫画和智能画本功能,更是把场景延伸到了更加有趣的跨模态创作领域。

刚才我用三个案例,展示了如何用百度的 AppBuilder,做出 AI 原生应用。大家应该能够感受到 AppBuilder 的两个明显优势:

一是功能强大。依托文心 4.0 对指令的理解和遵循能力,我们的 AppBuilder,能保证冷启动就能达到一个不错的水平,不会因为效果差,再花很长时间去调优,大大降低了开发门槛。依托检索增强技术 RAG,在知识问答等典型场景,我们的问答准确率和友好回复程度都达到了 95%以上,大幅超越其他同类产品。AppBuilder 还提供丰富完整的组件工具,包括百度搜索等基于百度多年技术积累的 AI 能力组件、大模型能力组件,还有百度独家开放的业务组件等 55 个组件。以及一些主流场景的第三方 API,比如航班查询、论文查询等。我们还刚刚支持了自定义组件,客户可以直接对接自己专有的任何工具和数据。这些丰富的组件,共同支撑起了 AI 原生应用的高效开发。







请到「今天看啥」查看全文