“过去这24个月,这种全球性的大模型狂热,究竟是一场新的技术革命,还是新一轮泡沫?”百度世界大会2024上,李彦宏再次对AI热提出冷静的思考。过去一年,他提出的和主流共识看似“相反”的判断还有“不要卷模型,要卷应用”;比起开源大模型系统,商业化的闭源大模型更有优势。
这个被《时代》周刊称为“中国最杰出的未来主义者,长期投身于AI发展的浪潮”的AI布道师,在冷清时布局入场,在热闹中反而总能保持冷静。潮水过后,穿过泡沫才能看到正确的方向。“我们不是要推出一个‘超级应用’,而是要不断地帮助更多人、更多企业打造出数百万‘超级有用’的应用。”
李彦宏又对AI热“清醒”发言了。
过去两年,AI大模型卷得如火如荼,相关技术以前所未有的速度进行迭代和创新,从大公司,到创业者,到风险投资,各路人马都在寻找生成式AI时代基于大模型的超级应用。
“然而客观地讲,大家期待的超级应用还没有出现,甚至有人开始问,过去这24个月,这种全球性的大模型狂热,究竟是一场新的技术革命,还是新一轮泡沫?”
11月12日,在百度世界大会2024现场,百度创始人李彦宏在开场就犀利抛出这个问题。
▲ 百度创始人李彦宏在百度世界大会2024现场。图 / 访谈者供图
在大模型风云变化的这两年,行业始终笼罩在超级应用的焦虑之下,人工智能领域能不能出现像抖音、微信、淘宝这样的超级应用,至今都困扰着从业者和投资者。
作为中国最早的AI布局者和布道者,李彦宏在过去2年反而时不时因为“清醒发言”出圈,比如当国内还在聚焦百模大战时,李彦宏就说“不要卷模型,要卷应用”。当业界都在鼓吹大模型系统的开源优势时,李彦宏却强调,商业化的闭源大模型是最能打的。
在冷清时率先布局,在热闹中反而保持冷静和思考,这正是源于李彦宏在AI领域的长期主义和总是“领先半步”的前瞻性。
在很长的时间周期中,李彦宏都是中国乃至全球最早的AI长期信仰者,2023年9月7日,《时代》周刊发布了首届全球百大AI人物,李彦宏被评为全球AI领袖,和他一起被评选上的还有马斯克、黄仁勋以及萨姆·奥特曼。在评选理由里,《时代》这样写道:“李彦宏是中国最杰出的未来主义者,长期投身于AI发展的浪潮。”
在AI还未找到清晰路径的时候,他就持续多年呼吁全社会投入和关注AI。
李彦宏坚信前沿的技术浪潮是等不来的,必须提前十年甚至二十年布局。他对AI的热情可以追溯至学生时代。30年前,他主动选修AI课程,老师告诫过他:“(你喜欢的)这些东西不可能赚钱。”外界的质疑没有因为百度的强大而减弱,但这也并没有阻碍他成为中国第一个看中AI的人。
杨立昆在《科学之路》中文版自序里曾称赞:“百度是最早部署商业化深度学习系统的大型公司之一,领先于谷歌和微软。”
▲ 杨立昆《科学之路》中文版自序。图 / 微信读书
早在2012年,距离OpenAI成立还有3年,李彦宏就鼓励全百度产品经理了解AI技术最新趋势。也是在这一年,美国太浩湖南边的赌场酒店,酝酿了一场秘密的拍卖会。竞拍标的是名为DNNResearch的“三无公司”,唯一资产是创始人杰弗里·辛顿(Geoffrey Hinton)教授和他的两个学生。参与竞拍的却是四家世界顶级的公司,谷歌、微软、DeepMind和百度。
百度是第一个给这家“三无公司”开出1200万美元“天价”的公司,比其他公司提前半步向辛顿亮出了底牌。后来虽然因为各种原因和这位未来的诺贝尔物理奖得主失之交臂,李彦宏投入人工智能的决心却开始为世人所知。
次年一月,百度深度学习研究院成立,也成了“全球企业界第一家用深度学习来命名的研究院”。到目前为止,百度研究院已为百度和AI行业培养出数千名AI人才。
▲ 百度深度学习院,AI相关人才。图 / 访谈者供图
2015年3月29日的海南博鳌论坛上,三位全球科技巨头的代表围绕《对话:技术、创新与可持续发展》展开对谈。李彦宏是这场会议的主持人,在问完向网友征集的问题后,李彦宏终于提出了他最想问的问题:“如何看待人工智能?”
彼时距离Facebook的CEO马克·扎克伯格宣布成立AI实验室才不过两年,“阿尔法狗”战胜世界围棋冠军李世石还不到一年。移动互联网的浪潮还未结束,所有人便开始好奇下个浪潮是不是人工智能。
面对李彦宏的提问,马斯克一改之前“AI是恶魔”的观点,认为应该通过互联网把AI建立起来,但同时也要注意安全性。在这个尚未展露出野心的早餐会上,大家原本期待的“人工智能激辩”并没有发生。
但三人对谈的9个月后,OpenAI成立,马斯克担任联合董事长一职并承诺向OpenAI提供10亿美元资金,此后微软在OpenAI先后投资了一百多亿美元,获得了OpenAI的技术使用权,成了OpenAI的新主人。
科技巨头在AI领域的台前“斗法”被大众看到时,往往已经在背后布局已久。
2022年底,OpenAI 面向大众发布Chatgpt应用,引爆了大众对AI的讨论和想象。几个月后,百度发布了文心一言;紧接着谷歌发布了Bard,后来改名为Gemini;然后我们看到以英伟达为代表的芯片厂商和微软为代表的云厂商吃到红利,开源模型奋起直追……
▲ 全球AI生态全景概览与趋势分析。图 / 访谈者供图
百度也再次迎来前所未有的关注。人们意识到,李彦宏押注AI不是说说而已。过去10年,作为全国政协委员,李彦宏曾连续8年在“两会”中,提出了13份AI相关提案。有人统计过,在上次AI大潮袭来的2016年,李彦宏在公开场合提到“人工智能/AI”500多次。但凡对AI有兴趣者,无论是国家领导、相关企业,还是极客、学生,李彦宏都要向他们“安利”AI,不放过任何科普AI的机会。
而李彦宏带领的百度更是在这10年蜕变为一个拥有强大互联网用户基础的AI生态型公司:在深度学习、对话式人工智能操作系统、自动驾驶等前沿领域均已深度布局、全面开花。
看得更远的人往往能在他人“上头”时冷静。在大模型卷起的浪花让人眼花缭乱时,李彦宏却始终在穿过泡沫注视潮水真正的方向。他认为,接下来应该专注于实际场景和AI应用了。
10月17日,李彦宏在与哈佛商业评论英文版总编辑殷阿笛(Adi Ignatius)对话时表示:AI泡沫难以避免,基于用户实际需求的应用来推动AI的创新和发展,无疑能降低那些“伪创新”的比例,提升企业在泡沫中生存下来的机会。成为脱颖而出的1% AI企业,能让AI技术发展和创新能走得更远。“现在,我们只是在经历这个阶段,这个行业比去年更冷静,也更健康。”
而这一判断恰好和全球AI巨头的选择遥相呼应。微软推出嵌入在Microsoft 365(如Word、Excel、PowerPoint等办公软件)中的AI助手Copliot,直接把AI无缝集成到用户日常应用中,扮演“协作者”角色而不再仅仅是一个工具或单一产品。2022年底横空出世的Perplexity.ai,则是一个“正在基于人工智能聊天努力构建堪与谷歌搜索的生成式搜索引擎”,旨在提供简洁、准确的回答。
微软Copilot和Perplexity.ai,毫无疑问指向的是全球AI技术向应用落地的转型。这种转型也意味着,更加务实和着眼于用户需求的AI技术,才有可能成为日常生产生活不可或缺的一部分。
早在去年3月16日发布文心一言App时,李彦宏就给出预测:下一步的方向,应该是大模型的应用。他也拿出过移动互联网时代来类比模型和应用,比如十几年前各种应用大量涌现,而手机上的系统只有iOS和安卓。
六个月前,在法国巴黎举办的大会“欧洲科技创新展览会”(Viva Technology)上,李彦宏一共提到了22次“应用”。阳狮集团监事会主席莫里斯·列维(Maurice Levy)肯定地表示:“人们普遍认为人工智能领域的两大主导力量是美国和中国。”
▲ 百度世界大会2024现场,“我们即将迎来AI应用的群星闪耀时刻”。图 / 访谈者供图
在这场名为大模型的风暴中,中国无疑是最受关注的技术变革风暴眼之一。世界的眼光聚焦在李彦宏身上,不仅因为他是大会唯一受邀的中国企业家,在国际上他更被熟知的身份是“长期的AI支持者”和“中国AI头号玩家”。
百度世界2024大会上,李彦宏带来关于AI应用的最新判断。在《应用来了》主题演讲中,李彦宏表示:“我们不是要推出一个‘超级应用’,而是要不断地帮助更多人、更多企业打造出数百万‘超级有用’的应用。”
大会发布了iRAG、无代码工具“秒哒”两大AI技术,展示了百度以大模型为基础,以应用为核心的“超级有用”生态,宣布“AI应用的群星闪耀时刻已然到来”。
李彦宏的信心并非没有根据。
今年5月,文心大模型日均调用量达到两亿时,李彦宏曾和高管讨论,如果日均调用量一年内涨10倍,涨到20亿,“我认为就成了,就说明大家是真需要”。仅仅半年过去,这个数字就达到15亿,增长至7.5倍,这条陡峭的增长曲线成了他的底气。
▲ 百度世界大会2024现场,文心大模型增长曲线图。图 / 访谈者供图
AI“超级有用”正在成为现实。李彦宏带来两大变革技术。
第一大“超级有用”技术是检索增强的文生图技术iRAG(image based RAG),iRAG看似基础,却直戳痛点。超级有用的关键在于“有用”,用科技让复杂的世界更简单。
过去一两年,当整个中文互联网都为Sora(OpenAI发布的人工智能文生视频大模型)捶胸顿足时,百度却在潜心解决一个更枯燥的问题:图像生成的幻觉问题,简单来说,就是文生图“一眼假”的问题。比如北京天坛的照片,真正的天坛是3层建筑,AI却能凭空多出一层,iRAG 要解决的正是这类痛点。
过去两年,大模型在文本上的幻觉已经基本被解决,但图像等多模态内容和RAG的结合还不够。
而iRAG可以让文生图变得无幻觉、超真实、没成本,而且立等可取。这样的功能在影视作品、漫画作品、连续画本、海报制作等很多领域,都可以有广泛的应用空间。比如在品牌宣传场景,以前拍一组汽车在某场景的大片宣传海报动辄需要一二十万元,甚至大几十万元,如果运用iRAG,创作的成本就会接近于0,商业价值潜力巨大。
每日人物试着输入“帮我画一张马斯克和一只迅猛龙在后备箱里剥豆角”让AI作画,很快屏幕上就出现了一张马斯克笑容可掬地剥豆角,与体型相当的迅猛龙在后备箱和谐共处的图片,马斯克是那个马斯克,剥豆角的手指也没有无缘无故地多或是少。
▲ 每日人物尝试AI作画。图 / 每日人物
第二大“超级有用”技术则显得更为炫酷,“人人都可以是程序员”理想照进现实。李彦宏发布了无代码产品“秒哒”,并称其为“迄今为止人类历史上最复杂的多智能体协作工具”。
李彦宏现场演示如何借助秒哒完成百度智能驾驶产品“萝卜快跑”的发布会电子邀请函。简单的指令召唤出0号智能体,它负责规划调度,将这个任务拆解成了需求确定、内容生产、工程开发三个步骤。接下来,0号智能体依次召唤出策划、程序员等多个智能体完成图片设计、写代码、文案产出等工作,最终产出了一个完备的线上邀请系统。“从你开始到最后结束,只需要3分钟,用户不用写一行代码,甚至完全不用看得懂代码,就可以完成。”
▲ 百度世界大会2024现场,演示“秒哒”生成电子邀请函。图 / 访谈者供图
直播的实时弹幕中,网友惊呼“这也太牛了吧,震惊”“人工智能技术造福广大普通人” “AI应用的时代是真的来了”。李彦宏宣布,“秒哒”将于明年第一季度发布,现在就可以去排队预约,参与内测。“AI之所以被称为产业革命级的机会,就是因为它对于社会经济,带来了生产力的无限扩张。”早在今年年初,李彦宏就预言过“未来10年,人人都将拥有程序员的能力”的时代很快来临,这一预判也和用英伟达创始人黄仁勋的想法不谋而合。黄仁勋曾在2024年世界政府峰会上表示,“我们的工作是创造计算技术,使得没有人需要(传统意义上的)‘编程’,让世界上的每个人都成为程序员。”
李彦宏展望,随着秒哒技术的进阶,未来人们不需要去招募项目经理、设计人员、开发人员、测试人员等,自己就可以指挥多个智能体来协同完成任务。“只要有想法,你就可以心想事成,我们将迎来一个前所未有的只靠想法就能赚钱的时代。”
“基础模型能力就绪,我们即将迎来AI应用的群星闪耀时刻。每一个应用都是一颗星,每一个应用都将成为改变世界的力量。”
得益于百度文心大模型和百度生态的丰富应用场景,目前,百度已经在智能体和产业应用两大方向上跑出商业通路,形成AI领域的“超级有用”生态。
大模型如何在产业落地,如何为千行百业的企业创造增量价值,这是百度一直在探索的问题。李彦宏介绍,过去这一年半左右,百度在金融、能源、教育、招聘、公共服务等各个领域,大模型跟场景结合后,在降本和增效两个方面都取得了实实在在的成果。▲ 百度世界大会2024现场,要打造数百万“超级有用”的应用。图 / 访谈者供图
百度智能云是百度构建智能产业生态的主要依托。目前在百度智能云的千帆大模型平台上,已经累计帮助用户精调了3.3万个大模型,开发出了77万个企业级应用,百度智能云已经拥有中国最大的大模型产业落地规模,60%的央国企以及大量的民营企业,都在联合百度智能云进行AI创新。
比如招聘企业智联招聘利用大模型重构了“把合适的人匹配到合适的岗位上”这个核心环节。AI还能自动回答有关工作时长、薪资福利、工作地点这些求职者关心的问题,甚至进一步帮助安排面试。“人岗匹配的平均准确率高达93%,而大模型使用的成本却下降了约90%。”还有蔚来汽车基于文心大模型打造出了端云协同多模态大模型——NOMI GPT,目前NOMI已经陪伴了近20万车友家庭。
百度世界大会2024现场,全红婵、陈芋汐、曹缘等跳水冠军亮相引起轰动。大家只知道国家队一线备战训练的刻苦,跳水队巴黎奥运包揽奥运8金的好成绩,没想到体育竞技背后还有AI技术的较量。
据介绍,百度AI为我国跳水队打造了首个智能辅助训练系统。配备这套系统相当于有了“火眼金睛”和“最强大脑”,能够捕捉高速跳水动作的任一细节,实现快速分析、对比、实时打分,可以在训练前熟悉动作,也可以在训练后分析并形成改进方案。全红婵在现场都说,“我感觉帮助挺大,这套(AI)系统可以多角度还原我的动作,同时也会和之前的动作对比,帮我把动作做得更好,真是太全面了!”
除了产业应用,李彦宏认为:“智能体是AI应用的最主流形态,即将迎来它的爆发点。”这种判断,一样在比尔盖茨、扎克伯格、吴恩达等科技巨头的想法中找到了呼应。去年11月,比尔·盖茨在个人网站撰文,阐述了智能体(agent)在未来几年如何颠覆我们使用计算机的方式。在他的设想中,智能体会成为每个人的私人助理,人们“不必为不同的任务使用不同的应用程序,只需使用日常语言告诉设备你想做什么”。而今年7月,扎克伯格也在一次采访中直接预测,未来智能体的数量可能会达到数十亿,甚至超过全球人口总数。
▲ 小言上线的角色智能体“新东方董仲蠡老师”,正在解答问题。图 / 访谈者供图
全球所有顶尖科技公司都很关注智能体,“但像百度这样把智能体作为最重要战略方向的并不多”。李彦宏认为,做智能体很像在PC时代做网站,或者是移动时代做自媒体账号。不同之处是智能体更像人,更智能,更像你的销售、客服、助理。智能体可能会变成AI原生时代内容、信息和服务的新载体。
他现场展示了4种不同类型的智能体的应用,包括公司类智能体,角色类智能体,工具类智能体和行业类智能体。
在百度搜索“比亚迪”,就能直接唤起它的官方智能体。点击进入,它会首先给你一段比亚迪品牌的简短介绍,类似于传统的官网。然后,你可以让它推荐一台“性能均衡”的车型,智能体能准确理解“性能均衡”的含义,并把你感兴趣的多个车型的动力类型、车身尺寸、续航、加速性能放在一起拉出表格来,直观呈现。
“比亚迪的官方智能体上线后,销售线索转化率提升了119%。”未来,公司官方智能体将成为最直接的面向消费者的界面。
▲ 比亚迪官方智能体可以准确理解并推荐“性能均衡”的车型,并展示产品图片。图 / 访谈者供图
第二类,角色智能体。提到角色,大家很容易想到数字人。数字人有自己的人设、自己的知识库,这都是典型的智能体基本要素。
在百度搜索“教育辅导”这样的关键字,就能看到这些数字人。他们不仅比我们以前看到的数字人更加自然、动作幅度更大,甚至在直播场景下,还可以说着说着,在合适的时机停下,回复网友现场提出的问题。“这需要大量的数据积累和直播互动规律的总结提炼,以前,我们是不具备这样的能力。所以今天的数字人直播,很多情况下,转化率已经超过了真人。”
李彦宏认为,真人与虚拟人的交互,将创造巨大的产业价值和社会价值。这里的虚拟人,可能就是现实生活中的一位名师的数字分身,也可能是一位名医、王牌律师和金牌销售的数字分身,而你从来没有像现在这样离他们如此之近。
李彦宏还在现场发布了一个全新的工具类智能体,由百度文库和网盘联合开发的“自由画布”。相比过去单一的产品,它充分运用了文库与网盘的融合优势,全面打通过去公域与私域资料的限制,让输入、编辑、创作和分享的自由相比过去更上一层次。简单来说,自由画布就是一个由文心多模态大模型加持的万能白板,它能很好地激发人们的无限灵感和创造力。借助自由画布,每个人都可以是漫画家、成为短视频导演。
▲ 基于漫画内容,自由画布让AI生成了一个漫画视频。图 / 访谈者供图
如今,智能体已经不仅仅是一个冰冷的技术名词,而是温暖的生活助手和每个人的创意展示平台。无论什么年龄段和学历层次,无论是小学生还是博士生,都可能在“人人可开发”的宗旨下创建独属于自己的智能体。百度智能体开发大赛中,11岁的小学生朵朵就融合自己的成长经历创建了一个“青春期成长小导师”的智能体,希望帮助青春期朋友应对身体和思想的种种变化,缓解情绪问题。
法律、医疗健康、金融、体育、旅行等等领域,也涌现出了各类有用的行业智能体。百度打造的法律行业智能体法行宝,创建至今已经累计回答用户1660万个法律问题。如果遇到被车撞对方全责却得不到赔偿的情况,法行宝能立即给出四个步骤的指导:先是保留相关证据,请求交管部门去调解,如果调解失败,可以再提起民事诉讼、申请法院的强制执行。但它的作用远不止停留在咨询这一层面,还包括但不限于计算交通事故赔偿、帮忙写起诉状、按照不同领域推荐知名律师解决更复杂的问题。因此,法行宝已经成为了许多人专属的AI免费律师。
可以肯定的是,人类对智能体的开发将远不止这些。目前,百度新搜索已经成为了智能体分发最大入口,日均分发已超1000万。截至2024年11月,百度文心智能体平台已经吸引了15万家企业、80万名开发者入驻。
“我是软件工程师出身,国外有个说法,软件吞噬世界,世界不应该被吞噬,而应该被创造。AI时代,应用创造世界。”熬得过万丈孤独,挺得过烈火烹油,现在这个心怀信仰的人,有耐心也有决心,面朝星辰大海,和AI以及背后的人们,一起创造全新的世界。
▲ 一图看懂百度世界2024。图 / 访谈者供图
参考资料 :
1.《李彦宏博鳌对话盖茨马斯克:创新是一个集体智慧》环球网科技
2.《百度十年:AI时代的登月计划》,远川研究所
3.《深度学习革命》(美)凯德·梅茨
4.《李彦宏:从拓荒者到Game Changer》,每日人物
5.《李彦宏欧洲谈AI:比起GPT-5,我更感兴趣超级应用》,量子位
微信又双叒叕改版了,如果不标星,容易错过我们的推送,也无法看到封面图片。还请点击星标🌟“每日人物”,及时接收每篇新鲜出炉的推文,我们期待与你的每一次见面。