专栏名称: 你好张江
聚焦张江热点资讯,全方位服务创新创业者。
目录
相关文章推荐
51好读  ›  专栏  ›  你好张江

行业定制,场景融合:张江大模型蓄势待发

你好张江  · 公众号  ·  · 2024-05-22 18:01

正文

请到「今天看啥」查看全文






近期,腾讯研究院发布《向AI而行,共筑新质生产力——行业大模型调研报告》(以下简称“报告”),这也是业内首份行业大模型调研报告。这份报告的撰写前后历时近一年,访谈了近百位各界专家,深入剖析了行业大模型的发展背景、应用进展、实现方式、安全与治理以及未来的发展趋势。







赋能各行各业,行业大模型提升新质生产力

报告显示,最近一年多以来,各类通用大模型在让人们深切地感受到AI强大能力的同时,也暴露出一些局限性,比如专业性、经济性和泛化性难以兼顾。虽然通用大模型具备泛化性,但其训练成本高昂,动辄需要上千亿甚至上万亿的参数量,导致经济性不足,且在满足具体行业的特定需求上还存在短板。因此,要走完“人工智能+”的最后一公里,真正实现落地,行业大模型不可或缺。


行业大模型大多“长”在通用大模型之上,即基于通用大模型进行二次开发,针对特定数据和任务进行再训练或优化,从而以较低的成本实现更优的性能。 金融、医疗、工业等领域都迫切需要行业大模型带来的可靠性和精准性。


那么,怎样才算成功的大模型呢? 报告提出了“2-3-1”法则:


  • 避免2个误区:片面追求技术性能和短期收益。


  • 评估3类价值:降本增效、业务创新和体验增强。


  • 构建1个模式:高质量数据飞轮。


值得注意的是,将技术指标作为衡量大模型成功的标准是目前常见的误区。事实上,用户数、使用量、收入等业务指标更能直观反映价值,是更具有说服力的评判标准。



展望未来,大模型有哪些发展方向? 在国家推进新质生产力的背景下,人工智能已经成为经济发展的核心动力之一,而人工智能将通过行业大模型赋能各行各业。可以预见,在不久的将来,行业大模型将呈现百花齐放的态势。同时,在云智一体的基础设施支持下,行业大模型将朝着多模态、人工智能体、端侧及小型化等方向发展,以更灵活的形态嵌入到各行各业的工作流程中,从而提升生产力。


“人工智能大模型正在催生新一轮技术创新与产业变革,也将为工业、金融、广电等行业数字化转型和高质量发展带来新动能。当前市场以基础大模型为主,通识能力强,但缺少行业专业知识。如何将大模型融入千行百业,是下一阶段的发展重点。”中国工程院院士邬贺铨在报告的序言部分指出。


那么,作为大模型领域的探索先行者,张江企业又是如何在行业大模型上实现突破的呢?

01

达观数据:“曹植”深耕长文本智能处理

从这款大模型的命名可以看出,它擅长处理长文档的写作、审核、润色和翻译,毕竟曹植“七步成诗”的典故及其名作《洛神赋》早已广为人知。得益于 达观数据 多年来积累的专业文档、报告等资源,“曹植”大模型在垂直领域的语言能力和写作能力都表现出色。


达观数据“曹植”大语言模型

(图片来源:达观数据)


值得注意的是,长文本不仅包含文字信息,还包含许多复杂的结构,如表格、文档样式、签名、印章等,甚至还有图片等多模态的内容。这些多样化的元素,要求大模型具备深层次的理解和分析能力,以应对诸如段落结构解析、表格信息提取乃至页面布局分析等挑战。这些都需要高度专业的技术和细致的优化来实现。


一般而言,大模型因为应用领域广泛,往往难以在某一垂直领域达到深入的程度。这导致用户在使用大模型(比如文本写作大模型)的过程中,常常感觉生成的文本平淡无奇、缺乏生气。而得益于达观数据在长文本专业领域的不断深耕,“曹植”大模型不仅掌握了出色的长文本写作能力,更具备专业领域的写作技巧,弥补了当前许多大模型的不足。


此外,“曹植”大模型还具备多语言写作和翻译能力,能够在不同语言环境下提供高质量的文案服务。与此同时,“曹植”大模型还支持多模型并联,能够轻松与其他第三方大模型进行对接,实现大模型间的互联互通。针对WPS和Office,“曹植”大模型还提供专门的插件,帮助用户在专业的文本处理软件中直接调用“曹植”的强大功能。


新一代智能知识管理系统

(图片来源:达观数据)


“曹植”大模型成为国内首批可落地的产业应用级大语言模型,持续赋能金融、政务、制造等多个垂直领域,助力企业加速数字化转型进程,实现降本增效。


达观数据董事长兼CEO陈运文在接受采访时表示,自己深受GPT和复旦大学最新MOSS插件库的设计理念启发,认识到只有具备丰富插件功能的大语言模型,才能真正展现出持久的生命力,并发挥出巨大价值。

02

云从科技:“从容”大模型提供一体化高效解决方案

云从科技 于2023年5月发布了自主研发的“从容”大模型,并持续迭代到目前的3.0版本。立足于自研基础大模型,云从科技放弃了动辄千亿级别的通用大模型方向,选择以百亿模型为主体,聚焦行业落地,以此撬动市场需求。


云从科技“从容”大模型

(图片来源:云从科技)


2023年,云从科技与昇腾联合提出应对创新智算基础设施挑战的解决之道,开启“算力+智算”的新布局。目前,双方已与天津港集团、首链科技、今世缘、国网山东、中国电信等合作伙伴一起,在智慧港口、智能制造、智慧能源、智能客服等领域实现了成功应用。


而云从科技所推出的“从容”大模型一体机,则实现了从模型训练到推理应用的一体化高效解决方案,为行业用户提供了一站式、低门槛、高性能的人工智能基础设施。目前该大模型已经为政务、金融、教育、医疗等多个行业提供了可以落地的场景应用。


在智能算力紧缺的大背景下,每一个大模型厂商都需要平衡模型参数规模与性能,并结合客户场景需求给出最佳投入产出比的技术方案。降低参数规模可以实现成本的指数级下降。云从科技凭借其深厚的垂直行业经验积累,专注于训练更精简高效的行业大模型,并通过多行业落地的模式摊薄研发成本,为客户提供更具性价比的解决方案。


目前,云从科技位列中国人工智能大模型第13名。2023年,其泛AI领域营业收入同比增长超20倍,表现尤为突出。“从容”大模型作为实现这一增长的加速器,发挥了关键作用。这些成绩有力证明了在智慧城市、智慧金融和智慧交通等众多垂直领域深入探索实践,会带来显著的社会和经济效益。

03

上海任意门科技:“SoulX”聚焦社交体验

2023年年底,“SoulX”大模型正式上线,并在Soul APP中的“AI苟蛋”聊天机器人中得到应用。据官方介绍,“SoulX”大模型能够赋予机器人“拟人化、多模态、时间感知”等能力。


Soul APP

(图片来源:Soul APP)


简单来说,“AI苟蛋”就是一个极其擅长交流、充满情感互动的陪伴机器人。举个例子,如果你告诉它你要去吃饭了,当你餐后再次和它聊天时,它会自然地接续话题,问候你“饭吃完了呀?”很神奇的感觉,有木有?当然,它会的不仅仅是这点小安抚,而是真的像你的好朋友一样陪你聊天解闷。比如,你说“工作压力好大哦”,“ AI 苟蛋”会首先表示自己也有同感,然后又建议可以找一些解压方式,例如跑步,并风趣地表示“跑步是累,但不会让心情更差”。因此,“ AI 苟蛋”自诩为“闲聊小能手”、“被动式话痨”、“社交小达人”等。


Soul自研的语言模型“SoulX”,与其他聊天机器人最大的差异在于,训练中使用了平台长期积累的海量高质量社交数据。基于“SoulX”语言模型叠加天然的社交场景,“ A I 苟蛋”能够快速获取用户反馈并持续优化升级。当前,Soul拥有约3000万月活用户,近8成是热衷表达与分享的Z世代群体。通过分析这些年轻用户在公开场景的真实互动,“ A I 苟蛋”深刻学习并理解了用户的语言风格和兴趣爱好,自然就更懂他们爱聊什么,需要怎样的社交。这也是为什么有用户会评论说,“感觉‘ AI 苟蛋’每天都在成长一样”。


得益于在多元社交互动场景中的垂直应用,“ AI 苟蛋”极大地丰富了用户的社交体验。数据显示,现阶段用户平均每天给“ AI 苟蛋”发送超过70条消息,平均互动时长超30分钟。可见,很多用户已经将其当做可以持续聊天互动的“伙伴”。而这正是Soul有意将“ AI 苟蛋”往情感方向训练的结果。用户表示它能够在关系发现、破冰、建立、沉淀、内容生产、分发、消费以及交互等环节中发挥独特的作用,帮助用户更好地理解和发现彼此的兴趣点,从而更快速地建立起有效的社交联系。


此外, 阅文集团、上海蜜度科技 等张江企业也在不同垂直领域大力发展大模型,并取得了不俗的成绩。如果说2023年的“百模大战”只是大模型竞争的1.0版本,那么到了2024年,大模型之间的较量将进入融合行业运用场景的2.0版本。在这个新的发展阶段,张江的人工智能企业正蓄势待发,它们将如何凭借创新技术引领行业变革,又将如何在更广阔的实践场景中各显其能?所有的好奇与想象,都将在未来的日子里逐一揭晓,令人翘首以盼。









请到「今天看啥」查看全文