专栏名称: 36氪
36氪是中国领先的新商业媒体,提供最新锐最具深度的商业报道。我们强调趋势与价值,我们的slogan是:让一部分人先看到未来。
目录
相关文章推荐
新浪科技  ·  【#AMD苏姿丰称DeepSeek的出现是好 ... ·  2 天前  
新浪科技  ·  【#小鹏推出5年0利息0首付政策#】 ... ·  2 天前  
51好读  ›  专栏  ›  36氪

百度怎么打造「超级有用」?

36氪  · 公众号  · 科技媒体  · 2024-11-18 18:31

主要观点总结

今年百度世界大会的主题是“应用来了”,李彦宏表示国内大模型行业开始从底层模型转向应用层探索,行业共识是商业化落地的进度至关重要。百度主要通过新发布的两大赋能AI的技术——iRAG和秒哒,来展现对“超级有用”的理解。需求侧和供给侧都体现了百度解决用户需求的痛点,通过消除幻觉问题,解决多模态应用的问题。同时,百度更注重为开发者提供生态,更倾向于放在做工具和基础平台上,让大家更容易地开发应用。至于未来可能出现的新基础设施形态,李彦宏认为是智能体,且智能体将是过渡形态。

关键观点总结

关键观点1: 百度世界大会主题定为“应用来了”,代表百度对大模型行业发展判断的转变。

大会强调了行业共识——国内大模型开始走向应用层探索,尤其关注商业化落地的进度。

关键观点2: 李彦宏通过两大赋能AI的技术——iRAG和秒哒展示“超级有用”的理解。

这两大技术分别解决了用户需求侧和供给侧的痛点,iRAG消除幻觉问题,多模态应用得以实用化;秒哒提高了程序员效率,降低了大模型的应用门槛。

关键观点3: 李彦宏强调百度的策略转变,更注重为开发者提供生态。

百度更倾向于做工具和基础平台,让大家更容易地开发应用,而不是追逐“超级应用”。未来基础设施的可能形态是智能体。

关键观点4: 智能体被认为是新一代基础设施的过渡形态。

智能体具有响应自然语言并根据用户了解完成不同任务的能力。百度认为智能体不仅改变人与计算机交互的方式,也将成为下一个平台。搜索公司对这项技术有天然优势。


正文

iRAG和秒哒。


图片来源 IC photo

今年百度世界大会主题定为“应用来了”,大会现场李彦宏表示,这一主题代表了百度对于当前大模型行业发展的判断——进入2024年,国内大模型开始走入不同于海外同行的发展路线,即从投入底层模型转向探索应用层——这也基本是目前的行业共识。

国内大模型厂商在底层模型卷了近两年后,几乎所有公司和投资人都开始焦虑商业化落地的进度,“killer app在哪里”成为焦点。

虽然不少C端AI软件应用已经面世,但现阶段来看,用户渗透率及制造现金流的能力仍较为初期。

以曾经火爆一时的妙鸭相机为例。百度指数显示,妙鸭相机从去年7月17日上线,热度从7月23日开始上升,8月初达到峰值,随后就开始缓慢下滑。根据数据分析公司Sensor Tower统计,大部分头部“AI+图像”应用的生命周期只有两个月。

这背后透露的问题是,对用户而言,这些应用是否真正“有用”,以及是否满足了用户的真实需求。

基于类似的观察,李彦宏在百度世界大会上提出,百度“不做超级应用,但要做超级有用”。
如何“超级有用”

百度主要通过新发布的两大赋能AI的技术——iRAG和秒哒,来展现自己对“超级有用”的理解。

需求侧看,iRAG和秒哒有各自的“有用”价值。在李彦宏的描述中,文生图技术iRAG的商业价值在于无幻觉、超真实、没成本、立即可取,秒哒则能进一步降低大模型的应用门槛,释放社会生产力。

RAG(检索增强)是过去一段时间大模型行业的共识,为了追求模型落地的准确性,“幻觉”必须被消除。

在12日下午的一场AI圆桌访谈中,李彦宏表示:“过去两年,RAG使大语言模型具备了实用价值,可以有效控制幻觉生成,所以它才在各个场景,尤其是to B场景应用起来。但是多模态要想进入真正实用阶段,也得有准确性、可控性,应用空间才能打开。”

李彦宏指出,过去24个月,大模型的最大变化是基本消除了“幻觉”,但图像和RAG技术的结合还远远不够。在他看来,多模态模型还没有大规模应用的原因,就是幻觉问题解决得还不够彻底。这是需求痛点决定的。

因此针对这一用户需求的痛点,百度决定先通过iRAG这一技术解决实际的幻觉问题,再谈多模态应用。

而做秒哒,是相对于提高程序员效率,百度看到了更有意义的潜在需求。

“当几亿、十几亿人都具备程序员能力的时候,它对于创造力的爆发,是辅助代码生成工具没法比的,那些工具是让金字塔塔尖的人更加powerful,而我们希望金字塔中间层和底层的人,拥有金字塔塔尖这些人的能力,这个意义更大。”李彦宏表示。

供给侧看,秒哒的构建模式也与百度对大模型发展的判断有关,即通过多个“智能体”协作的方式进行开发,比如程序员智能体、写作智能体、检索智能体、质检智能体等。

李彦宏认为,Chat GPT-o1的方向和百度去年四季度开始讲的“智能体”异曲同工,“智能体可以反思、进化、使用工具,这个方向和传统意义上大语言模型的方向确实不太一样。”

而在各大模型公司追赶Sora的这一年中,百度最终选择推出iRAG技术,李彦宏认为,Sora不等于就是多模态。

“Sora本质上是任意场景下的视频生成能力。它的本质是可以做到基本预测未来,预测一个画面的下个10秒会变成什么样子。”李彦宏表示,但按Sora现阶段的技术进展,还无法解决更实际的问题,比如数字人,生成的文字用语音表达出来,同时形象动作也要配合,这靠“任意场景下生成视频的产品”,不一定能做好。

按照李彦宏的说法,Sora是较为理想化的终极目标,在达成这一目标的路上,还有很多细节问题待解决,比如iRAG就是来解决问题的。

“百度不做Sora,不等于百度不做多模态。先把iRAG跑起来,是百度的思路。”
脚踏实地与应用驱动

值得注意的是,李彦宏在本次世界大会的演讲,鲜少出现底层模型迭代和进化等大议题,而是更多聚焦在了“多少人能够用模型能力做多少事”。

这样一个更脚踏实地的转变,映射了行业整体思路的变化,即手中不放弃底层研究,但眼中要看向务实的落地目标。李彦宏表示“应用驱动是第一性原理”。

但这并不意味着要焦虑“超级应用”。

“大模型这一代超级应用出现的时间点,不应当和互联网刚出现时比较,而是应当和电力革命时比较,也就是说,这一代超级应用或许不局限于一个设备上的app,而是一种类似基础设施的应用。”李彦宏指出。

相对于互联网,大模型是一个全新的底座,在这一底座之上将相应地建立新的生产力和生产关系,而在大模型还没有真正变为基础设施之时,追逐“超级应用”也为时尚早。

基于此,李彦宏才提出“不断赋能数百万‘超级有用’的应用”这一概念。相比于自己做出“超级应用”,百度更倾向于为开发者提供生态。







请到「今天看啥」查看全文