行业定制，场景融合：张江大模型蓄势待发

你好张江 · 公众号 · · 2024-05-22 18:01

正文

请到「今天看啥」查看全文

近期，腾讯研究院发布《向AI而行，共筑新质生产力——行业大模型调研报告》（以下简称“报告”），这也是业内首份行业大模型调研报告。这份报告的撰写前后历时近一年，访谈了近百位各界专家，深入剖析了行业大模型的发展背景、应用进展、实现方式、安全与治理以及未来的发展趋势。

赋能各行各业，行业大模型提升新质生产力

报告显示，最近一年多以来，各类通用大模型在让人们深切地感受到AI强大能力的同时，也暴露出一些局限性，比如专业性、经济性和泛化性难以兼顾。虽然通用大模型具备泛化性，但其训练成本高昂，动辄需要上千亿甚至上万亿的参数量，导致经济性不足，且在满足具体行业的特定需求上还存在短板。因此，要走完“人工智能+”的最后一公里，真正实现落地，行业大模型不可或缺。

行业大模型大多“长”在通用大模型之上，即基于通用大模型进行二次开发，针对特定数据和任务进行再训练或优化，从而以较低的成本实现更优的性能。金融、医疗、工业等领域都迫切需要行业大模型带来的可靠性和精准性。

那么，怎样才算成功的大模型呢？ 报告提出了“2-3-1”法则：

避免2个误区：片面追求技术性能和短期收益。
评估3类价值：降本增效、业务创新和体验增强。
构建1个模式：高质量数据飞轮。

值得注意的是，将技术指标作为衡量大模型成功的标准是目前常见的误区。事实上，用户数、使用量、收入等业务指标更能直观反映价值，是更具有说服力的评判标准。

展望未来，大模型有哪些发展方向？ 在国家推进新质生产力的背景下，人工智能已经成为经济发展的核心动力之一，而人工智能将通过行业大模型赋能各行各业。可以预见，在不久的将来，行业大模型将呈现百花齐放的态势。同时，在云智一体的基础设施支持下，行业大模型将朝着多模态、人工智能体、端侧及小型化等方向发展，以更灵活的形态嵌入到各行各业的工作流程中，从而提升生产力。

“人工智能大模型正在催生新一轮技术创新与产业变革，也将为工业、金融、广电等行业数字化转型和高质量发展带来新动能。当前市场以基础大模型为主，通识能力强，但缺少行业专业知识。如何将大模型融入千行百业，是下一阶段的发展重点。”中国工程院院士邬贺铨在报告的序言部分指出。

那么，作为大模型领域的探索先行者，张江企业又是如何在行业大模型上实现突破的呢？

达观数据：“曹植”深耕长文本智能处理

从这款大模型的命名可以看出，它擅长处理长文档的写作、审核、润色和翻译，毕竟曹植“七步成诗”的典故及其名作《洛神赋》早已广为人知。得益于 达观数据 多年来积累的专业文档、报告等资源，“曹植”大模型在垂直领域的语言能力和写作能力都表现出色。

达观数据“曹植”大语言模型

（图片来源：达观数据）

值得注意的是，长文本不仅包含文字信息，还包含许多复杂的结构，如表格、文档样式、签名、印章等，甚至还有图片等多模态的内容。这些多样化的元素，要求大模型具备深层次的理解和分析能力，以应对诸如段落结构解析、表格信息提取乃至页面布局分析等挑战。这些都需要高度专业的技术和细致的优化来实现。

一般而言，大模型因为应用领域广泛，往往难以在某一垂直领域达到深入的程度。这导致用户在使用大模型（比如文本写作大模型）的过程中，常常感觉生成的文本平淡无奇、缺乏生气。而得益于达观数据在长文本专业领域的不断深耕，“曹植”大模型不仅掌握了出色的长文本写作能力，更具备专业领域的写作技巧，弥补了当前许多大模型的不足。

此外，“曹植”大模型还具备多语言写作和翻译能力，能够在不同语言环境下提供高质量的文案服务。与此同时，“曹植”大模型还支持多模型并联，能够轻松与其他第三方大模型进行对接，实现大模型间的互联互通。针对WPS和Office，“曹植”大模型还提供专门的插件，帮助用户在专业的文本处理软件中直接调用“曹植”的强大功能。

新一代智能知识管理系统

（图片来源：达观数据）

“曹植”大模型成为国内首批可落地的产业应用级大语言模型，持续赋能金融、政务、制造等多个垂直领域，助力企业加速数字化转型进程，实现降本增效。

达观数据董事长兼CEO陈运文在接受采访时表示，自己深受GPT和复旦大学最新MOSS插件库的设计理念启发，认识到只有具备丰富插件功能的大语言模型，才能真正展现出持久的生命力，并发挥出巨大价值。

云从科技：“从容”大模型提供一体化高效解决方案

云从科技 于2023年5月发布了自主研发的“从容”大模型，并持续迭代到目前的3.0版本。立足于自研基础大模型，云从科技放弃了动辄千亿级别的通用大模型方向，选择以百亿模型为主体，聚焦行业落地，以此撬动市场需求。

云从科技“从容”大模型

（图片来源：云从科技）

2023年，云从科技与昇腾联合提出应对创新智算基础设施挑战的解决之道，开启“算力+智算”的新布局。目前，双方已与天津港集团、首链科技、今世缘、国网山东、中国电信等合作伙伴一起，在智慧港口、智能制造、智慧能源、智能客服等领域实现了成功应用。

而云从科技所推出的“从容”大模型一体机，则实现了从模型训练到推理应用的一体化高效解决方案，为行业用户提供了一站式、低门槛、高性能的人工智能基础设施。目前该大模型已经为政务、金融、教育、医疗等多个行业提供了可以落地的场景应用。

在智能算力紧缺的大背景下，每一个大模型厂商都需要平衡模型参数规模与性能，并结合客户场景需求给出最佳投入产出比的技术方案。降低参数规模可以实现成本的指数级下降。云从科技凭借其深厚的垂直行业经验积累，专注于训练更精简高效的行业大模型，并通过多行业落地的模式摊薄研发成本，为客户提供更具性价比的解决方案。

目前，云从科技位列中国人工智能大模型第13名。2023年，其泛AI领域营业收入同比增长超20倍，表现尤为突出。“从容”大模型作为实现这一增长的加速器，发挥了关键作用。这些成绩有力证明了在智慧城市、智慧金融和智慧交通等众多垂直领域深入探索实践，会带来显著的社会和经济效益。

上海任意门科技：“SoulX”聚焦社交体验

2023年年底，“SoulX”大模型正式上线，并在Soul APP中的“AI苟蛋”聊天机器人中得到应用。据官方介绍，“SoulX”大模型能够赋予机器人“拟人化、多模态、时间感知”等能力。

Soul APP

（图片来源：Soul APP）

简单来说，“AI苟蛋”就是一个极其擅长交流、充满情感互动的陪伴机器人。举个例子，如果你告诉它你要去吃饭了，当你餐后再次和它聊天时，它会自然地接续话题，问候你“饭吃完了呀？”很神奇的感觉，有木有？当然，它会的不仅仅是这点小安抚，而是真的像你的好朋友一样陪你聊天解闷。比如，你说“工作压力好大哦”，“ AI 苟蛋”会首先表示自己也有同感，然后又建议可以找一些解压方式，例如跑步，并风趣地表示“跑步是累，但不会让心情更差”。因此，“ AI 苟蛋”自诩为“闲聊小能手”、“被动式话痨”、“社交小达人”等。

Soul自研的语言模型“SoulX”，与其他聊天机器人最大的差异在于，训练中使用了平台长期积累的海量高质量社交数据。基于“SoulX”语言模型叠加天然的社交场景，“ A I 苟蛋”能够快速获取用户反馈并持续优化升级。当前，Soul拥有约3000万月活用户，近8成是热衷表达与分享的Z世代群体。通过分析这些年轻用户在公开场景的真实互动，“ A I 苟蛋”深刻学习并理解了用户的语言风格和兴趣爱好，自然就更懂他们爱聊什么，需要怎样的社交。这也是为什么有用户会评论说，“感觉‘ AI 苟蛋’每天都在成长一样”。

得益于在多元社交互动场景中的垂直应用，“ AI 苟蛋”极大地丰富了用户的社交体验。数据显示，现阶段用户平均每天给“ AI 苟蛋”发送超过70条消息，平均互动时长超30分钟。可见，很多用户已经将其当做可以持续聊天互动的“伙伴”。而这正是Soul有意将“ AI 苟蛋”往情感方向训练的结果。用户表示它能够在关系发现、破冰、建立、沉淀、内容生产、分发、消费以及交互等环节中发挥独特的作用，帮助用户更好地理解和发现彼此的兴趣点，从而更快速地建立起有效的社交联系。

此外， 阅文集团、上海蜜度科技 等张江企业也在不同垂直领域大力发展大模型，并取得了不俗的成绩。如果说2023年的“百模大战”只是大模型竞争的1.0版本，那么到了2024年，大模型之间的较量将进入融合行业运用场景的2.0版本。在这个新的发展阶段，张江的人工智能企业正蓄势待发，它们将如何凭借创新技术引领行业变革，又将如何在更广阔的实践场景中各显其能？所有的好奇与想象，都将在未来的日子里逐一揭晓，令人翘首以盼。