专栏名称: 埃森哲中国
埃森哲是一家注册于爱尔兰的全球性专业服务公司。我们一直站在全球商业和技术的前沿,致力于将具有世界声誉的研究能力与广博的行业经验相结合,探索政府及企业如何成就卓越绩效并实现基业常青。
目录
相关文章推荐
昆明发布  ·  刚刚!大观楼灯会上《新闻联播》啦 ·  7 小时前  
云南省文化和旅游厅  ·  关注丨线上订单量同比增长36%!云南春节假期 ... ·  3 天前  
云南省文化和旅游厅  ·  关注丨线上订单量同比增长36%!云南春节假期 ... ·  3 天前  
51好读  ›  专栏  ›  埃森哲中国

从ChatGPT到Sora,迎接智识革新!

埃森哲中国  · 公众号  ·  · 2024-03-01 17:32

正文


当许多人还未熟练掌握ChatGPT的时候,一款名为Sora的AI文生视频大模型又在2024年初横空出世。这意味着人类的信息获取和内容创造方式将发生革命性的变化。


技术进化的新纪元已然开启。人工智能正跨越机械逻辑的边界,模拟并延展人类思维维度,从被动响应走向主动理解,预示着信息时代一场深刻的认知革命。同时,人工智能的发展极大地拓展了人类的能力边界,就像ChatGPT革新了人类知识交互的方式,Sora又创作出既真实又富有想象力的场景。通过与AI伙伴的紧密协作,人类将大幅提升生产力和创造力。


如何充分利用这种技术能力,构建新一代的商业模式?企业需要怎样的数据基础架构,才能真正从这波人工智能浪潮中获益?最新发布的埃森哲《技术展望2024》报告给出了答案。



AI伙伴:从知识到智识的革新


当前趋势显示,人们获取信息的方式正经历深刻变革,从单纯依赖搜索技术转变为通过与生成式AI对话直接获取答案。埃森哲《技术展望2024》调研显示,95%的高管相信我们与数据互动的方式将发生变化。这一变化或对传统搜索引擎行业、CRM系统内的客户信息查询以及整个软件市场带来广泛影响。


各家企业都拥有许多宝贵且特有的信息,并希望客户、员工、合作伙伴和投资者能够发现并使用它们。但由于种种原因,比如记不住正确的搜索词、无法编写查询、存在数据孤岛又或是文档太繁杂,很多信息都难以访问或提炼。而拥有巨大潜力的生成式AI,则能解决上述问题,进而为企业创造巨大价值。


企业内部运营中,生成式AI聊天机器人能够革新员工和客户获取知识的过程,提供情境化精准答案,从而强化内部知识流通、提升客户服务品质、优化产品性能。外部业务拓展中,生成式AI聊天机器人同样将改变客户查找和理解企业产品与服务信息的方式。



例如,在GPT-4的赋能支持下, 摩根士丹利 创建了一个生成式AI聊天机器人,将原本庞大、分散的内部知识库(包括数十万份PDF文档)进行“学习”“消化”,助力咨询师即时提炼所需的洞察。 丰田 则将车主手册“浓缩”在生成式AI中,使其能够针对车主提出的汽车问题提供简洁直接的答案——研究结果表明,AI助手为员工赋能增效,平均每小时问题解决量增加14%,有效舒缓了客户情绪,降低了员工留持率,也减少了发送给经理的请求量。



解锁数据驱动型企业


为了真正从生成式AI中受益并建立“数据+AI”驱动的未来企业,企业需要从根本上重新思考自己的核心技术战略。这其中就包括:如何收集和构建数据及更广泛的架构,如何部署技术工具和运用它的全部功能,这些都需要重新考虑。此外,培训、消除偏见和AI监督等工作也须要在一开始就实施起来。



强化数据基础


生成式AI将成为企业数据架构的顶层接口,这一转型要求企业对现有的数字核心进行适应性重构和升级。好消息是,随着新技术与新工艺的不断涌现,企业能够有效地强化其数据基础设施的基础,并为迎接数据驱动业务的未来做好充分准备。实际上,一些行业先锋已经率先行动起来,通过采用这些先进技术推动自身数据战略的现代化进程,从而在重构数据架构以支持生成式AI的同时,也为企业整体的数据应用创新和发展打开了新的局面。


知识图谱是这里会用到的最重要的技术之一。它是一个图形结构的数据模型,包含了事物及其之间的关系,并对更大的上下文和含义进行编码。知识图谱不仅可以聚合多样化来源的信息以支持个性化服务,还可以通过语义搜索提升数据查找效率。



思科公司 的案例为例。其全球销售团队拥有海量文档资料,但传统的索引搜索因缺乏元数据而难以找到所需内容。为此,思科与Neo4j合作构建了一个元数据知识图谱系统。虽然没有使用大语言模型,但他们依靠自然语言处理创建了本体论,和机器标记服务来分配文档元数据,然后将其存储在图形数据库中。这一举措使信息查询所需的时间减半,每年为销售人员节省超过400万小时的工作时间。



除了知识图谱之外,其他数据管理策略也很重要。在企业更新整体架构时,可以使用数据网格和数据结构这两种方法来帮助匹配和梳理企业需要处理的信息。



大语言模型:新数据接口


知识图谱、数据网格和数据编织对企业知识管理系统来说已经是一个巨大进步。但如果将图书管理员模式转变为顾问模式,企业有望获得更多价值。通过建立一个可访问的、情境化的数据基础,企业就可以开始着手创建顾问模式,并且还可以尝试探索一些不同的方式。


从零开始训练自有大语言模型。 由于这需要投入大量资源,因此只有一些领先的AI企业会采用这种方式。

对现有的大语言模型进行“微调”。 从本质上讲,这就是在更通用的大语言模型基础上,用特定领域的专门文档对其进行进一步培训,使其符合某个专业领域的需求。大型云厂商就会提供这种微调服务,然后把定制的个性化模型集成和部署在其公司的应用中。


与从头开始训练大语言模型相比,这种方法需要的资源要少得多,但这样训练出来的模型并不能确保具有最新的信息。这种微调方式最适用于那些对实时信息的要求不那么高的特定应用场景(例如设计或市场营销中的创意输出)。

针对一些特定场景,对小语言模型进行微调。 比如DeepMind的Chinchilla和斯坦福大学的Alpaca。这样的小语言模型效率更高、运行成本更低、碳足迹更小,而且可以更快地进行训练并用于较小的边缘设备。

提供更具相关性、特定用例信息来关联预训练的大语言模型。 这是目前最流行的方法之一。通常通过检索增强生成(RAG, Retrieval Augmented Generation)将信息检索系统和生成模型相结合,生成模型既能进行自我训练又能直接使用,并通过API进行访问。


情境学习和RAG奠定了大语言模型的基础,而所需的时间和计算资源较少。相比之下,从头开始训练或微调大语言模型需要更多的时间、计算资源和专业知识。这种方式最适合那些对信息时效要求比较高的用例,但精确性可能仍有待验证。


将企业知识的未来引入正轨


我们现已探索了人类与信息之间变幻万千的关联,以及企业数据实践如何发展方可与时俱进,当下亟需讨论它将帮助企业做什么。有一点笃定无疑,大语言模型顾问将助推新一代数据驱动型业务的崛起。然而,如何构建它却又需经历一番深思熟虑。



大语言模型并非完美无瑕,它会“产生幻觉”。由于它们被训练为以高度确定性提供概率性答案,因此有时这些模型顾问会充满自信地传达错误信息。当大语言模型的应用开始越来越深入地参与我们的日常活动,这种缺陷带来的后果也可能会愈发严重。


除此之外,企业使用聊天机器人时还会遇到其他问题——如果使用的是公共模型,企业则必须仔细保护专有数据,以免泄露;即使是私有模型,也要避免未经授权的员工接触到不应该共享的数据;同时企业还要管理计算成本;最后,实施这些解决方案需要相关专业知识,而这方面的专家人才相对较少。


然而,面对这些挑战,我们不该因噎废食,而应当以适当的控制措施来实施这项技术。


输入到大语言模型中的数据,无论是培训中的还是提示的,都应该是高质量的数据:新鲜、标签明确且无偏见。 培训数据应该是由客户主动共享的零方数据,或者是公司从自有资源中直接收集的第一手数据。任何个人或专有数据都应得到安全标准的保护。数据权限也必须到位,以确保用户有权访问为情境学习而检索的任何数据。







请到「今天看啥」查看全文