2023年是大模型元年,也是生成式AI蓄力爆发之年,距离2022年底ChatGPT横空出世仅一年多,AI大模型已迅速赋能至千行百业。
为了推动大模型加速产业落地,继2023年11月启动
AGI产业先锋营
后,
首钢基金
参加CANPLUS
联合
前瞻产业研究院
及
华为云初创生态
,发起《2024年中国AI大模型场景探索及产业应用调研报告》项目,邀请华为、腾讯、科大讯飞、第四范式、商汤科技、智谱AI、360等多家中国头部大模型公司参与,以期呈现当下国内大模型研发及应用的多样图景。
为此,我们推出
“AI大模型前沿访谈系列”
,精选部分代表企业的调研访谈内容,关心国内大模型最新进展的读者可以先睹为快。
本期访谈的对象是商汤智能产业研究院院长
田丰
。针对困扰行业的“基础模型与行业模型之争”问题,田丰明确表示,企业应一手抓基础模型,保持技术与国际顶尖水平对齐;一手抓行业模型,为基础研发补血,支持基础模型的持续迭代与创新。“中国AI需要与世界顶级技术水平保持同步,但不能只是追赶,而应该预埋分叉技术,预判下一个技术爆点在哪里。”。
一手抓基础模型,一手抓行业模型
Q:商汤研发AI大模型的决定始于何时?当前的业务布局进展到哪一阶段?
田丰
:
早在2018年商汤开始着手大装置SenseCore,在上海自贸区临港新片区建设了智算中心,也称为临港AIDC,它将深度学习训练和推理框架、算法异构计算能力调度系统、海量数据处理引擎融为一体,目前算力达12,000Petaflops(1 Petaflop等于每秒1千万亿次浮点运算),GPU45,000张。
Q:您认为部署大模型的基础要素有哪些?
田丰
:
人才非常重要。所有的科技都是由人创造出来的。
其次是算力。OpenAI也认为,基于“尺度定律(Scaling Laws)”,并给出该定律的定义“随着训练数据集、训练计算量、模型参数量“三元素”持续增加,语言模型性能持续提高,这一趋势跨越至少6个数量级有效。”用海量算力支撑更大规模的数据,可以使算法在小版本升级时对模型效果实现特别好的提升。
再次是数据的处理效率。无论是自有数据还是收集数据,消耗的都是算力成本,所以训练效率至关重要。
Q:在 AI 大模型产业化应用上,我们同时选择了基于通用大模型能力开发产业化应用,以及融合产业know-how构建专业的行业大模型这两种方式。两种方式各有怎样的优缺点?哪种更有可能成为未来的主流方向?
田丰
:
基础模型方面,如山姆·奥特曼所说,如果基于一个基础模型的短板做应用,这个短板可以很快被补上。这表明基础模型的升级速度是很快的,基本上两三个月会一个小版本的升级,半年到一年有一次大版本的升级换代。
行业模型更多是对基础模型进行压缩,然后去做行业数据的优化训练。例如,能源、医疗、车载模型等都会根据场景设计不同的参数量,以保证其运行性能和速度。
Q:商汤在行业大模型中探索了哪些应用场景和落地案例?
田丰
:
在金融领域,上海银行的3D数字人客服是基于商汤的日日新金融大模型开发并结合了如影数字人技术,它方便了银行为上海地区近百万老年用户发放养老金。老年人可以直接与数字人对话,简化了服务流程。
教育领域中,线上AI老师节省了名师的时间,助力教育网站同比覆盖更多用户。比如,商汤日日新大模型“如影”帮助中公教育,通过技术方式为其打造了全虚拟教师“小鹿老师”,为客户实现了降本增效的同时,也实现了教师IP品牌的打造。
再如电商领域,随着品牌直播间增多,我们为代运营平台提供了软硬一体的直播解决方案。我们投入数字人+大模型后,主播只需输入产品介绍,便能迅速形成一套营销文案。
商汤商量大模型还延伸出一些行业垂直模型,并衍生出营销助手、海报助手、IT助手、HR助手等。
商汤
“如影
”AI数字人视频生成平台
Q:在上述应用领域中,客户对大模型的需求和兴趣是否有明显的类型分布?
田丰
:
在电商、教育等人与人之间交流的界面上,大模型有更多的用武之地。
与人打交道的服务业客户非常多,包括零售、文旅、会展、汽车、手机、医疗、教育等。在上海新华医院,我们用商汤日日新大模型“商量·大医”大模型做术前导诊,AI可以告诉患者挂哪个科,帮助患者创建病例,还可以进行AI自诊、AI预问诊、AI辅助诊疗、AI随访等。这种公共服务场景下,AI的使用空间非常大。
其次是营销领域,包括电商、直播等线上内容营销,以及传统零售等线下场景。
此外,还有车、手机、笔记本电脑、平板电脑等终端层面应用。甚至未来的机器人,都属于新型终端,有可能会跟AI助手结合到一起。
Q:就当前实际操作层面而言,以上商汤目前各类商业模式的占比大约是怎样的?
田丰
:
目前尚未有明晰的占比数据。
但我认为,前期国内的客户应该会以大型B端类为主,随着大模型的成本持续下降,大型B端客户量会相应提升。
未来,伴随模型调优类工具的成熟度提升,用户对模型的应用理解越来越丰富,AI模型下的SAAS级服务可能会出现。
Q:商汤在问卷中提到,电子信息和装备制造领域的竞争激烈程度相对较高,请问这种竞争主要体现在哪些方面?是企业数量还是布局密度?
田丰
:
主要指AI大模型在这两个领域的布局。
制造业上下游的链接非常强,精确度要求也非常高。我们目前已经落地了一些相关应用,比如在锂电池生产厂中利用大模型进行智能质检,在南方电网中共同研发电力AI大模型。
另外,还有利用AI进行动车、铁路、电气系统的巡检等,其中要面对大量不同路段的零配件,是非常长尾的工程。大模型很擅长做长尾的事情,它的基础理解能力、泛化能力可以有效提升其效率。
回到装备制造领域,将会实现逐个环节渗透,并可以从痛点和高价值环节切入。同时,制造业企业通过大模型助手可以实现市场的数据回流,在后服务市场创造新的利润板块。
再看电子信息领域。按照原本的销售模式,一台笔记本电脑卖给消费者后,服务基本就结束了。但现在的产品都会带有Agent或Copilot助手,可以帮助企业实现用户的服务闭环。
我用电脑看春晚,有一项能够用AI算法提高清晰度(超分辨率)、流畅度(插帧),电脑厂商便可以通过这一增值服务向我收费。再者,高清晰度的内容是否一定需要最顶级的拍摄机器,或者进行繁琐的后期处理?其实不然。商汤有一类技术,可以将普通质量的视频在放映时实现超分辨率。
AI在电子信息领域同样会带来降本增效,令企业用更高效的方式组合现有的生产资料,提高部门之间的协同效率,最终实现利润提升,并给到用户丰富、个性化的长尾服务。
Q:就目前的态势而言,市场上是否有令您印象深刻的案例?
田丰
:
中国有两类大模型企业,一类是创业企业,一类是人工智能平台型企业。商汤更偏向后者,有自己的算力平台、数据处理平台、完善的工具链,离应用也比较近,又做过很多行业
know-how
。这些研发工具链、开源算法生态资源,帮助创业企业加速构建自己的基础模型、行业模型。归根结底,这两类企业存在一种竞合关系。
Q:在大模型产业化应用方面,我们未来有什么规划?
田丰
:
我
们会坚定地往 AGI方向发展,跟海外一线公司保持同等水平。重要的不是追随先行者的步伐,而是与其保持同步,并预判下一步会走向哪里。
所以,未来的“爆点”可能并非由商业界、媒体界、投资界来定义,而是这些预埋的技术达到“工业红线”。如此一来,我们才有可能在这些技术分叉上实现此消彼长。
Q:在大模型产业应用的挑战方面,您认为目前的人才缺口有多大,以及当前最需要什么类型的人才?
田丰
:
第一类肯定是基础研发人才,尤其是从0到1的模型开发人才。
第二类是工程类人才。谷歌的Transformer仅仅实现了科学革命,下一步技术革命面临的是能否在工程上将效率提上去、成本降下来。